]> sjero.net Git - wget/blobdiff - NEWS
[svn] Introduce non-strict comment parsing.
[wget] / NEWS
diff --git a/NEWS b/NEWS
index 90acbf3c8593f9066cdf06806b1852d6977b0686..fc1e8e27a33a9d9cafaeb3d6874464b9cc780741 100644 (file)
--- a/NEWS
+++ b/NEWS
@@ -1,10 +1,60 @@
 GNU Wget NEWS -- history of user-visible changes.
 
-Copyright (C) 1997, 1998, 2000, 2001 Free Software Foundation, Inc.
+Copyright (C) 1997, 1998, 2000, 2001, 2002, 2003 Free Software Foundation, Inc.
 See the end for copying conditions.
 
 Please send GNU Wget bug reports to <bug-wget@gnu.org>.
 \f
+* Changes in Wget 1.9.
+
+** It is now possible to specify that POST method be used for HTTP
+requests.  For example, `wget --post-data="id=foo&data=bar" URL' will
+send a POST request with the specified contents.
+
+** IPv6 is experimentally supported.
+
+** The `--timeout' option now affects DNS lookup and establishing the
+connection as well.  Previously it only affected reading and writing
+data.
+
+** Download speed shown by the progress bar is based on the data
+recently read, rather than the average speed of the entire download.
+The ETA projection is still based on the overall average.
+
+** It is now possible to connect to FTP servers through FWTK
+firewalls.  Set ftp_proxy to an FTP URL, and Wget will automatically
+log on to the proxy as "username@host".
+
+** The new option `--retry-connrefused' makes Wget retry downloads
+even in the face of refused connections, which are otherwise
+considered a fatal error.
+
+** The new option `--dns-cache=off' may be used to prevent Wget from
+caching DNS lookups.
+
+** Wget no longer escapes characters in local file names based on
+whether they're appropriate in URLs.  Escaping can still occur for
+nonprintable characters or for '/', but no longer for frequent
+characters such as space.  You can use the new option
+--restrict-file-names to relax or strengthen these rules, which can be
+useful if you dislike the default or if you're downloading to
+non-native partitions.
+
+** Handling of HTML comments has been dumbed down to conform to what
+users expect and other browsers do: instead of being treated as SGML
+declaration, a comment is terminated at the first occurrence of "-->".
+Use `--strict-comments' to revert to the old behavior.
+
+** Wget now correctly handles relative URIs that begin with "//", such
+as "//img.foo.com/foo.jpg".
+
+** Boolean options in `.wgetrc' and on the command line now accept
+values "yes" and "no" along with the traditional "on" and "off".
+\f
+* Wget 1.8.2 is a bugfix release with no user-visible changes.
+\f
+* Wget 1.8.1 is a bugfix release with no user-visible changes.
+\f
 * Changes in Wget 1.8.
 
 ** A new progress indicator is now available and used by default.
@@ -13,12 +63,12 @@ types are available, "bar" (the new default), and "dot" (the old
 dotted indicator).  You can permanently revert to the old progress
 indicator by putting `progress = dot' in your `.wgetrc'.
 
-** You can limit the bandwidth spent by the retrieval using the
-`--limit-rate' option.  For example, "wget --limit-rate=15k URL" will
+** You can limit the download rate of the retrieval using the
+`--limit-rate' option.  For example, `wget --limit-rate=15k URL' will
 tell Wget not to download the body of the URL faster than 15 kilobytes
 per second.
 
-** "Recursive retrieval" has been revamped:
+** Recursive retrieval and link conversion have been revamped:
 
 *** Wget now traverses links breadth-first.  This makes the
 calculation of depth much more reliable than before.  Also, recursive
@@ -33,16 +83,37 @@ have been downloaded.
 already resolves <base href="..."> when resolving handling URLs, link
 conversion now makes the BASE tags point to an empty string.
 
+*** HTML anchors are now handled correctly.  Links to an anchor in the
+same document (<a href="#anchorname">), which used to confuse Wget,
+are now converted correctly.
+
+*** When in page-requisites (-p) mode, no-parent (-np) is ignored when
+retrieving for inline images, stylesheets, and other documents needed
+to display the page.
+
+*** Page-requisites (-p) mode now works with frames.  In other words,
+`wget -p URL-THAT-USES-FRAMES' will now download the frame HTML files,
+and all the files that they need to be displayed properly.
+
+** `--base' now works conjunction with `--input-file', providing a
+base for each URL and thereby allowing the URLs in the file to be
+relative.
+
+** If a host has more than one IP address, Wget uses the other
+addresses when accessing the first one fails.
+
 ** Host directories now contain port information if the URL is at a
 non-standard port.
 
 ** Wget now supports the robots.txt directives specified in
-<http://info.webcrawler.com/mak/projects/robots/norobots-rfc.html>.
+<http://www.robotstxt.org/wc/norobots-rfc.txt>.
 
 ** URL parser has been fixed, especially the infamous overzealous
-quoting bug.  Wget no longer dequotes reserved characters, e.g. `%3F'
-is no longer translated to `?', nor `%2B' to `+'.  Unsafe characters
+quoting.  Wget no longer dequotes reserved characters, e.g. `%3F' is
+no longer translated to `?', nor `%2B' to `+'.  Unsafe characters
 which are not reserved are still escaped, of course.
+
+** No more than 20 successive redirections are allowed.
 \f
 * Wget 1.7.1 is a bugfix release with no user-visible changes.
 \f