]> sjero.net Git - wget/blobdiff - NEWS
[svn] Handle <base href=...> when converting links.
[wget] / NEWS
diff --git a/NEWS b/NEWS
index 2a9a02905c44a47d27f4cf7f06683826a4849dba..d9849ef0f57c391afcca172c1111d7fc611a06a4 100644 (file)
--- a/NEWS
+++ b/NEWS
@@ -5,6 +5,37 @@ See the end for copying conditions.
 
 Please send GNU Wget bug reports to <bug-wget@gnu.org>.
 \f
+* Changes in Wget 1.8.
+
+** A new progress indicator is now available.  Try it with
+--progress=bar or using `progress = bar' in `.wgetrc'.
+
+** "Recursive retrieval" has been revamped:
+
+*** Wget now traverses links breadth-first.  This makes the
+calculation of depth much more reliable than before.  Also, recursive
+downloads are faster and consume *significantly* less memory than
+before.
+
+*** Links are converted only when the entire retrieval is complete.
+This is the only safe thing to do, as only then is it known what URLs
+have been downloaded.
+
+*** BASE tags are handled correctly when converting links.  Since Wget
+already resolves <base href="..."> when resolving handling URLs, link
+conversion now makes the BASE tags point to an empty string.
+
+** Host directories now contain port information if the URL is at a
+non-standard port.
+
+** Wget now supports the robots.txt directives specified in
+<http://info.webcrawler.com/mak/projects/robots/norobots-rfc.html>.
+
+** URL parser has been fixed, especially the infamous overzealous
+quoting bug.  Wget no longer dequotes reserved characters, e.g. `%3F'
+is no longer translated to `?', nor `%2B' to `+'.  Unsafe characters
+which are not reserved are still escaped, of course.
+\f
 * Wget 1.7.1 is a bugfix release with no user-visible changes.
 \f
 * Changes in Wget 1.7.