]> sjero.net Git - wget/blobdiff - NEWS
[svn] Handle <base href=...> when converting links.
[wget] / NEWS
diff --git a/NEWS b/NEWS
index 19407f6fdd6fc923c455fe5e9a6cb3e229e4eaa5..d9849ef0f57c391afcca172c1111d7fc611a06a4 100644 (file)
--- a/NEWS
+++ b/NEWS
@@ -5,17 +5,63 @@ See the end for copying conditions.
 
 Please send GNU Wget bug reports to <bug-wget@gnu.org>.
 \f
-* Changes in Wget 1.7-dev
+* Changes in Wget 1.8.
 
-** Wget can now recognize FTP directory listings from some non-Unix
-servers.  Currently Windows NT is supported.
+** A new progress indicator is now available.  Try it with
+--progress=bar or using `progress = bar' in `.wgetrc'.
+
+** "Recursive retrieval" has been revamped:
+
+*** Wget now traverses links breadth-first.  This makes the
+calculation of depth much more reliable than before.  Also, recursive
+downloads are faster and consume *significantly* less memory than
+before.
+
+*** Links are converted only when the entire retrieval is complete.
+This is the only safe thing to do, as only then is it known what URLs
+have been downloaded.
+
+*** BASE tags are handled correctly when converting links.  Since Wget
+already resolves <base href="..."> when resolving handling URLs, link
+conversion now makes the BASE tags point to an empty string.
+
+** Host directories now contain port information if the URL is at a
+non-standard port.
+
+** Wget now supports the robots.txt directives specified in
+<http://info.webcrawler.com/mak/projects/robots/norobots-rfc.html>.
+
+** URL parser has been fixed, especially the infamous overzealous
+quoting bug.  Wget no longer dequotes reserved characters, e.g. `%3F'
+is no longer translated to `?', nor `%2B' to `+'.  Unsafe characters
+which are not reserved are still escaped, of course.
+\f
+* Wget 1.7.1 is a bugfix release with no user-visible changes.
+\f
+* Changes in Wget 1.7.
+
+** SSL (`https') pages now work if you compile Wget with SSL support;
+use the `--with-ssl' configure flag.  You need to have OpenSSL
+installed.
+
+** Cookies are now supported.  Wget will accept cookies sent by the
+server and return them in later requests.  Additionally, it can load
+and save cookies to disk, in the same format that Netscape uses.
+
+** "Keep-alive" (persistent) HTTP connections are now supported.
+Using keep-alive allows Wget to share one TCP/IP connection for
+many retrievals, making multiple-file downloads faster and less
+stressing for the server and the network.
+
+** Wget now recognizes FTP directory listings generated by NT and VMS
+servers.
 
 ** It is now possible to recurse through FTP sites where logging in
 puts you in some directory other than '/'.
 
-** "Keep-Alive" connections are now supported.
-
-** https URLs (SSL) are now supported if you link wget with OpenSSL.
+** You may now use `~' to mean home directory in `.wgetrc'.  For
+example, `load_cookies = ~/.netscape/cookies.txt' works as you would
+expect.
 
 ** The HTML parser has been rewritten.  The new one works more
 reliably, allows finer-grained control over which tags and attributes
@@ -29,9 +75,10 @@ also more general.
 where appropriate.  This results in huge speedups when retrieving
 large sites (thousands of documents).
 
-** Wget now mmaps the files it needs to read instead of allocating
-heap memory to read them.
-
+** Wget now has a man page, automatically generated from the Texinfo
+documentation.  (The last version that shipped with a man page was
+1.4.5).  To get this, you need to have pod2man from the Perl
+distribution installed on your system.
 \f
 * Changes in Wget 1.6
 
@@ -304,7 +351,7 @@ geturl -vo log http://fly.cc.fer.hr/
 ----------------------------------------------------------------------
 Copyright information:
 
-Copyright (C) 1997, 1998, 2000 Free Software Foundation, Inc.
+Copyright (C) 1997, 1998, 2000, 2001 Free Software Foundation, Inc.
 
    Permission is granted to anyone to make or distribute verbatim
    copies of this document as received, in any medium, provided that