]> sjero.net Git - wget/blob - NEWS
Print diagnostic messages to stderr, not stdout.
[wget] / NEWS
1 GNU Wget NEWS -- history of user-visible changes.
2
3 Copyright (C) 1997, 1998, 1999, 2000, 2001, 2002, 2003, 2004, 2005,
4 2006, 2007, 2008, 2009, 2010 Free Software Foundation, Inc.
5 See the end for copying conditions.
6
7 Please send GNU Wget bug reports to <bug-wget@gnu.org>.
8 \f
9 * Changes in Wget X.Y.Z
10
11 ** Support HTTP/1.1
12
13 ** Fix some portability issues.
14
15 ** Handle properly malformed status line in a HTTP response.
16
17 ** Ignore zero length domains in $no_proxy.
18
19 ** Set new cookies after an authorization failure.
20
21 ** Exit with failure if -k is specified and -O is not a regular file.
22
23 ** Cope better with unclosed html tags.
24
25 ** Print diagnostic messages to stderr, not stdout.
26 \f
27 * Changes in Wget 1.12
28
29 ** Mailing list MOVED to bug-wget@gnu.org
30
31 ** SECURITY FIX: It had been possible to trick Wget into accepting
32 SSL certificates that don't match the host name, through the trick of
33 embedding NUL characters into the certs' common name. Fixed by Joao
34 Ferreira <joao@joaoff.com>.
35
36 ** Added support for CSS. This includes:
37      - Parsing links from CSS files, and from CSS content found in HTML
38        style tags and attributes.
39      - Supporting conversion of links found within CSS content, when
40        --convert-links is specified.
41      - Ensuring that CSS files end in the ".css" filename extension,
42        when --convert-links is specified.
43
44    CSS support in Wget is thanks to Ted Mielczarek
45    <ted.mielczarek@gmail.com>.
46
47 ** Added support for Internationalized Resource Identifiers (IRIs, RFC
48 3987). When support is enabled (requires libidn and libiconv), links
49 with non-ASCII bytes are translated from their source encoding to UTF-8
50 before percent-encoding.  IRI support was added by Saint Xavier
51 <wget@sxav.eu>, as his project for the Google Summer of Code.
52
53 ** Wget now provides more sensible exit status codes when downloads
54 don't proceed as expected (see the manual).
55
56 ** --default-page option (and associated wgetrc command) added to
57 support alternative default names for index.html.
58
59 ** --ask-password option (and associated wgetrc command) added to
60 support password prompts at the console.
61
62 ** The --input-file option now also handles retrieving links from
63 an external file.
64
65 ** The output generated by the --version option now includes
66 information on how it was built, and the set of configure-time options
67 that were selected.
68
69 ** --html-extension has been renamed to --adjust-extension, to reflect
70 the fact that it now also applies to CSS content. --html-extension is
71 still acceptable, but is now deprecated.
72
73 ** An "ascii" specifier is now accepted by --restrict-file-names, which
74 forces the percent-encoding of all non-ASCII bytes
75
76 ** Several previously existing, but undocumented .wgetrc options are
77 now documented: save_headers, spider, and user_agent,
78 auth_no_challenge, and keep_session_cookies. Also added documentation
79 for the "lowercase" and "uppercase" values for --restrict-file-names, which had been present since Wget 1.11.
80 \f
81 * Changes in Wget 1.11.4
82
83 ** Fixed an issue (apparently a regression) where -O would refuse to
84 download when -nc was given, even though the file didn't exist.
85
86 ** Fixed a situation where Wget could abort with --continue if the
87 remote server gives a content-length of zero when the file exists
88 locally with content.
89
90 ** Fixed a crash on some systems, due to Wget casting a pointer-to-long
91 to a pointer-to-time_t.
92
93 ** Translation updates for Catalan.
94 \f
95 * Changes in Wget 1.11.3
96
97 ** Downgraded -N with -O to a warning, rather than an error.
98
99 ** Translation updates
100 \f
101 * Changes in Wget 1.11.2
102
103 ** Fixed a problem in authenticating over HTTPS through a proxy.
104 (Regression in 1.11 over 1.10.2.)
105
106 ** The combination of -r or -p with -O, which was disallowed in 1.11,
107 has been downgraded to a warning in 1.11.2. (-O and -N, which was never
108 meaningful, is still an error.)
109
110 ** Further improvements to progress bar displays in non-English locales
111 (too many spaces could be inserted, causing the display to scroll).
112
113 ** Successive invocations of Wget on FTP URLS, with --no-remove-listing
114 and --continue, was causing Wget to append, rather than replace,
115 information in the .listing file, and thereby download the same files
116 multiple times. This has been fixed in 1.11.2.
117
118 ** Wget 1.11 no longer allowed ".." to persist at the beginning of URLs,
119 for improved conformance with RFC 3986. However, this behavior presents
120 problems for some FTP setups, and so they are now preserved again, for
121 FTP URLs only.
122 \f
123 * Changes in Wget 1.11.1.
124
125 ** Interrupted downloads no longer result in renaming the file
126 (regression in 1.11 over 1.10.2).
127
128 ** Progress bar now displays correctly in non-English locales (and a
129 related assertion failure was fixed).
130
131 ** Wget no longer issues a GET request over HTTP for files it should
132 know it's not going to download (regression in 1.11 over 1.10.2).
133
134 ** Added option --auth-no-challenge, to support broken pre-1.11
135 authentication-before-server-challenge, which turns out to still be
136 useful for some limited cases.
137
138 ** Documentation of accept/reject lists in the manual's "Types of
139 Files" section now explains various aspects of their behavior that may
140 be surprising, and notes that they may change in the future.
141
142 ** Documentation of --no-parents now explains how a trailing slash, or
143 lack thereof, in the specified URL, will affect behavior.
144 \f
145 * Changes in Wget 1.11.
146
147 ** Timestamping now uses the value from the most recent HTTP response,
148 rather than the first one it got.
149
150 ** Authentication information is no longer sent as part of the Referer
151 header in recursive fetches.
152
153 ** No authentication credentials are sent until a challenge is issued,
154 for improved security. Authentication handling is still not
155 RFC-compliant, as once a Basic challenge has been received, it will
156 assume it can send credentials to any URL at that same host, and not
157 just the ones at or below the original authenticated location.
158 Credentials for Digest authentication are still never saved or issued
159 automatically, and continue to require a challenge for each resource.
160
161 ** Added --max-redirect option, allowing the user to specify what should
162 be the maximum number of HTTP redirects to follow.
163
164 ** Wget now supports saving HTTP downloads using file names specified by
165 the `Content-Disposition' header.  This is a standard way of specifying
166 the file name used by many web dynamically generated pages. However, the
167 current implementation is inefficient, and known to have bugs. It is
168 EXPERIMENTAL only, and not enabled by default. Use --content-disposition
169 to enable it.
170
171 ** The new option `--ignore-case' makes Wget ignore case when
172 matching files, directories, and wildcards.  This affects the -X, -I,
173 -A, and -R options, as well as globbing in FTP URLs.
174
175 ** ETA projection is now displayed in "dot" progress output as well as
176 in the default progress bar.  (The dot progress is used by default when
177 logging Wget's output to file using the `-o' option.)
178
179 ** The "lockable boolean" argument type is no longer supported.  It
180 was only used by the passive_ftp .wgetrc setting.  If you're running
181 broken scripts or Perl modules that unconditionally specify
182 `--passive-ftp' and your firewall disallows it, you can override them
183 by replacing wget with a script that execs wget "$@" --no-passive-ftp.
184
185 ** The source code has been migrated to Mercurial. The repositories are
186 available at http://hg.addictivecode.org/. Prior to this, the source
187 code was hosted on Subversion (migrated from the original CVS); you can
188 still get access to older tags and branches for Wget in the Subversion
189 repository at http://addictivecode.org/svn/wget/.
190 \f
191 * Changes in Wget 1.10.
192
193 ** Downloading files larger than 2GB, sometimes referred to as "large
194 files", now works on systems that support them.  This includes the
195 majority of modern Unixes, as well as MS Windows.
196
197 ** IPv6 is now supported by Wget.  Unlike the experimental code in
198 1.9, this version supports dual-family systems.  The new flags
199 `--inet4' and `--inet6' (or `-4' and `-6' for short) force the use of
200 IPv4 and IPv6 respectively.  Note that IPv6 support has not yet been
201 tested on Windows.
202
203 ** Microsoft's proprietary "NTLM" method of HTTP authentication is now
204 supported.  This authentication method is undocumented and only used
205 by IIS.  Note that *proxy* authentication is not supported in this
206 release; you can only authenticate to the target web site.
207
208 ** Wget no longer truncates partially downloaded files when download
209 has to start over because the server doesn't support Range.  Instead,
210 with such servers Wget now simply ignores the data up to the byte
211 where the last attempt left off, and only then continues appending to
212 the file.  That way the downloaded file never shrinks, and download
213 retries from servers without support for partial downloads work even
214 when downloading to stdout.
215
216 ** SSL/TLS changes:
217
218 *** SSL/TLS downloads now attempt to verify the server's certificate
219 against the recognized certificate authorities.  This requires CA
220 certificates to have been installed in a location visible to the
221 OpenSSL library.  If this is not the case, you can get the bundle
222 yourself from a source you trust (for example, the bundle extracted
223 from Mozilla available at http://curl.haxx.se/docs/caextract.html),
224 and point Wget to the PEM file using the `--ca-certificate'
225 command-line option or the corresponding `.wgetrc' command.
226
227 *** Secure downloads now verify that the host name in the URL matches
228 the "common name" in the certificate presented by the server.
229
230 *** Although the above checks provide more secure downloads, they
231 unavoidably break interoperability with some sites that worked with
232 previous versions, particularly those using self-signed, expired, or
233 otherwise invalid certificates.  If you encounter "certificate
234 verification" errors or complaints that "common name doesn't match
235 requested host name" and are convinced of the site's authenticity, you
236 can use `--no-check-certificate' to bypass both checks.
237
238 *** Talking to SSL/TLS servers over proxies now actually works.
239 Previous versions of Wget erroneously sent GET requests for https
240 URLs.  Wget 1.10 utilizes the CONNECT method designed for this
241 purpose.
242
243 *** The SSL/TLS-related options have been redesigned and, for the
244 first time, documented in the manual.  The old, undocumented, options
245 are no longer supported.
246
247 ** Passive FTP is now the default FTP transfer mode.  Use
248 `--no-passive-ftp' or specify `passive_ftp = off' in your init file to
249 revert to the old behavior.
250
251 ** The `--header' option can now be used to override generated
252 headers.  For example, `wget --header="Host: foo.bar"
253 http://127.0.0.1' tells Wget to connect to localhost, but to specify
254 "foo.bar" in the `Host' header.  In previous versions such use of
255 `--header' lead to duplicate headers in HTTP requests.
256
257 ** The responses without headers, aka "HTTP 0.9" responses, are
258 detected and handled.  Although HTTP 0.9 has long been obsolete, it is
259 still occasionally used, sometimes by accident.
260
261 ** The progress bar is now updated regularly even when the data does
262 not arrive from the network.
263
264 ** Wget no longer preserves permissions of files retrieved by FTP by
265 default.  Anonymous FTP servers frequently use permissions like "664",
266 which might not be what the user wants.  The new option
267 `--preserve-permissions' and the corresponding `.wgetrc' variable can
268 be used to revert to the old behavior.
269
270 ** The new option `--protocol-directories' instructs Wget to also use
271 the protocol name as a directory component of local file names.
272
273 ** Options that previously unconditionally set or unset various flags
274 are now boolean options that can be invoked as either `--OPTION' or
275 `--no-OPTION'.  Options that required an argument "on" or "off" have
276 also been changed this way, but they still accept the old syntax for
277 backward compatibility.  For example, instead of `--glob=off' you can
278 write `--no-glob'.
279
280 Allowing `--no-OPTION' for every `--OPTION' and the other way around
281 is useful because it allows the user to override non-default behavior
282 specified via `.wgetrc'.
283
284 ** The new option `--keep-session-cookies' causes `--save-cookies' to
285 save session cookies (normally only kept in memory) along with the
286 permanent ones.  This is useful because many sites track important
287 information, such as whether the user has authenticated, in session
288 cookies.  With this option multiple Wget runs are treated as a single
289 browser session.
290
291 ** Wget now supports the --ftp-user and --ftp-password command
292 switches to set username and password for FTP, and the --user and
293 --password command switches to set username and password for both FTP
294 and HTTP.  The --http-passwd and --proxy-passwd command switches have
295 been renamed to --http-password and --proxy-password respectively, and
296 the related http_passwd and proxy_passwd .wgetrc commands to
297 http_password and proxy_password respectively.  The login and passwd
298 .wgetrc commands have been deprecated.
299
300 * `wget -b' now works correctly under Windows.
301 \f
302 * Wget 1.9.1 is a bugfix release with no user-visible changes.
303 \f
304 * Changes in Wget 1.9.
305
306 ** It is now possible to specify that POST method be used for HTTP
307 requests.  For example, `wget --post-data="id=foo&data=bar" URL' will
308 send a POST request with the specified contents.
309
310 ** IPv6 support is available, although it's still experimental.
311
312 ** The `--timeout' option now also affects DNS lookup and establishing
313 the TCP connection.  Previously it only affected reading and writing
314 data.  Those three timeouts can be set separately using
315 `--dns-timeout', `--connection-timeout', and `--read-timeout',
316 respectively.
317
318 ** Download speed shown by the progress bar is based on the data
319 recently read, rather than the average speed of the entire download.
320 The ETA projection is still based on the overall average.
321
322 ** It is now possible to connect to FTP servers through FWTK
323 firewalls.  Set ftp_proxy to an FTP URL, and Wget will automatically
324 log on to the proxy as "username@host".
325
326 ** The new option `--retry-connrefused' makes Wget retry downloads
327 even in the face of refused connections, which are otherwise
328 considered a fatal error.
329
330 ** The new option `--no-dns-cache' may be used to prevent Wget from
331 caching DNS lookups.
332
333 ** Wget no longer escapes characters in local file names based on
334 whether they're appropriate in URLs.  Escaping can still occur for
335 nonprintable characters or for '/', but no longer for frequent
336 characters such as space.  You can use the new option
337 --restrict-file-names to relax or strengthen these rules, which can be
338 useful if you dislike the default or if you're downloading to
339 non-native partitions.
340
341 ** Handling of HTML comments has been dumbed down to conform to what
342 users expect and other browsers do: instead of being treated as SGML
343 declaration, a comment is terminated at the first occurrence of "-->".
344 Use `--strict-comments' to revert to the old behavior.
345
346 ** Wget now correctly handles relative URIs that begin with "//", such
347 as "//img.foo.com/foo.jpg".
348
349 ** Boolean options in `.wgetrc' and on the command line now accept
350 values "yes" and "no" along with the traditional "on" and "off".
351
352 ** It is now possible to specify decimal values for timeouts, waiting
353 periods, and download rate.  For instance, `--wait=0.5' now works as
354 expected, as does `--dns-timeout=0.5' and even `--limit-rate=2.5k'.
355 \f
356 * Wget 1.8.2 is a bugfix release with no user-visible changes.
357 \f
358 * Wget 1.8.1 is a bugfix release with no user-visible changes.
359 \f
360 * Changes in Wget 1.8.
361
362 ** A new progress indicator is now available and used by default.
363 You can choose the progress bar type with `--progress=TYPE'.  Two
364 types are available, "bar" (the new default), and "dot" (the old
365 dotted indicator).  You can permanently revert to the old progress
366 indicator by putting `progress = dot' in your `.wgetrc'.
367
368 ** You can limit the download rate of the retrieval using the
369 `--limit-rate' option.  For example, `wget --limit-rate=15k URL' will
370 tell Wget not to download the body of the URL faster than 15 kilobytes
371 per second.
372
373 ** Recursive retrieval and link conversion have been revamped:
374
375 *** Wget now traverses links breadth-first.  This makes the
376 calculation of depth much more reliable than before.  Also, recursive
377 downloads are faster and consume *significantly* less memory than
378 before.
379
380 *** Links are converted only when the entire retrieval is complete.
381 This is the only safe thing to do, as only then is it known what URLs
382 have been downloaded.
383
384 *** BASE tags are handled correctly when converting links.  Since Wget
385 already resolves <base href="..."> when resolving handling URLs, link
386 conversion now makes the BASE tags point to an empty string.
387
388 *** HTML anchors are now handled correctly.  Links to an anchor in the
389 same document (<a href="#anchorname">), which used to confuse Wget,
390 are now converted correctly.
391
392 *** When in page-requisites (-p) mode, no-parent (-np) is ignored when
393 retrieving for inline images, stylesheets, and other documents needed
394 to display the page.
395
396 *** Page-requisites (-p) mode now works with frames.  In other words,
397 `wget -p URL-THAT-USES-FRAMES' will now download the frame HTML files,
398 and all the files that they need to be displayed properly.
399
400 ** `--base' now works conjunction with `--input-file', providing a
401 base for each URL and thereby allowing the URLs in the file to be
402 relative.
403
404 ** If a host has more than one IP address, Wget uses the other
405 addresses when accessing the first one fails.
406
407 ** Host directories now contain port information if the URL is at a
408 non-standard port.
409
410 ** Wget now supports the robots.txt directives specified in
411 <http://www.robotstxt.org/wc/norobots-rfc.txt>.
412
413 ** URL parser has been fixed, especially the infamous overzealous
414 quoting.  Wget no longer dequotes reserved characters, e.g. `%3F' is
415 no longer translated to `?', nor `%2B' to `+'.  Unsafe characters
416 which are not reserved are still escaped, of course.
417
418 ** No more than 20 successive redirections are allowed.
419 \f
420 * Wget 1.7.1 is a bugfix release with no user-visible changes.
421 \f
422 * Changes in Wget 1.7.
423
424 ** SSL (`https') pages now work if you compile Wget with SSL support;
425 use the `--with-ssl' configure flag.  You need to have OpenSSL
426 installed.
427
428 ** Cookies are now supported.  Wget will accept cookies sent by the
429 server and return them in later requests.  Additionally, it can load
430 and save cookies to disk, in the same format that Netscape uses.
431
432 ** "Keep-alive" (persistent) HTTP connections are now supported.
433 Using keep-alive allows Wget to share one TCP/IP connection for
434 many retrievals, making multiple-file downloads faster and less
435 stressing for the server and the network.
436
437 ** Wget now recognizes FTP directory listings generated by NT and VMS
438 servers.
439
440 ** It is now possible to recurse through FTP sites where logging in
441 puts you in some directory other than '/'.
442
443 ** You may now use `~' to mean home directory in `.wgetrc'.  For
444 example, `load_cookies = ~/.netscape/cookies.txt' works as you would
445 expect.
446
447 ** The HTML parser has been rewritten.  The new one works more
448 reliably, allows finer-grained control over which tags and attributes
449 are detected, and has better support for some features like correctly
450 skipping comments and declarations, decoding entities, etc.  It is
451 also more general.
452
453 ** <meta name="robots"> tags are now respected.
454
455 ** Wget's internal tables now use hash tables instead of linked lists
456 where appropriate.  This results in huge speedups when retrieving
457 large sites (thousands of documents).
458
459 ** Wget now has a man page, automatically generated from the Texinfo
460 documentation.  (The last version that shipped with a man page was
461 1.4.5).  To get this, you need to have pod2man from the Perl
462 distribution installed on your system.
463 \f
464 * Changes in Wget 1.6
465
466 ** Administrative changes.
467
468 *** Maintainership.  Due to Hrvoje being plagued with a "real job",
469 Dan Harkless is the most active maintainer (not that he doesn't have a
470 real job as well).  Hrvoje still participates occasionally, and both
471 are being helped by many other people.
472
473 *** Web page.  Thanks to Jan Prikryl, Wget has an "official" web page.
474 Take a look at:
475
476     http://sunsite.dk/wget/
477
478 *** Anonymous CVS.  Thanks to ever-helpful Karsten Thygesen, Wget
479 sources are now available at an anonymous CVS server.  Take a look at
480 the web page for downloading instructions.
481
482 ** New -K / --backup-converted / backup_converted = on option causes files
483 modified due to -k to be saved with a .orig prefix before being changed.  When
484 using -N as well, it is these .orig files that are compared against the server.
485
486 ** New --follow-tags / follow_tags = ... option allows you to restrict
487 Wget to following only certain HTML tags when doing a recursive
488 retrieval.  -G / --ignore-tags / ignore_tags = ... is just the
489 opposite -- all tags but the ones you specify will be followed.
490
491 ** New --waitretry / waitretry = SECONDS option allows waiting between retries
492 of failed downloads.  Wget will use "linear" backoff, waiting 1 second after the
493 first failure, 2 after the second, up to SECONDS.  waitretry is set to 10 by
494 default in the system wgetrc.
495
496 ** New -p / --page-requisites / page_requisites = on option causes
497 Wget to download all ancillary files necessary to display a given HTML
498 page properly (e.g. inlined images).
499
500 ** New -E / --html-extension / html_extension = on option causes Wget
501 to append ".html" to text/html filenames not ending in regexp
502 "\.[Hh][Tt][Mm][Ll]?".
503
504 ** New type of .wgetrc command -- "lockable Boolean".  Can be set to on, off,
505 always, or never.  This allows the .wgetrc to override the commandline.  So far,
506 passive_ftp is the only .wgetrc command which takes a lockable Boolean.
507
508 ** A number of new translation files have been added.
509
510 ** New --bind-address / bind_address = <address> option for people on hosts
511 bound to multiple IP addresses.
512
513 ** wget now accepts (illegal per HTTP spec) relative URLs in HTTP redirects.
514 \f
515 * Wget 1.5.3 is a bugfix release with no user-visible changes.
516 \f
517 * Wget 1.5.2 is a bugfix release with no user-visible changes.
518 \f
519 * Wget 1.5.1 is a bugfix release with no user-visible changes.
520 \f
521 * Changes in Wget 1.5.0
522
523 ** Wget speaks many languages!
524
525 On systems with gettext(), Wget will output messages in the language
526 set by the current locale, if available.  At this time we support
527 Czech, German, Croatian, Italian, Norwegian and Portuguese.
528
529 ** Opie (Skey) is now supported with FTP.
530
531 ** HTTP Digest Access Authentication (RFC2069) is now supported.
532
533 ** The new `-b' option makes Wget go to background automatically.
534
535 ** The `-I' and `-X' options now accept wildcard arguments.
536
537 ** The `-w' option now accepts suffixes `s' for seconds, `m' for
538 minutes, `h' for hours, `d' for days and `w' for weeks.
539
540 ** Upon getting SIGHUP, the whole previous log is now copied to
541 `wget-log'.
542
543 ** Wget now understands proxy settings with explicit usernames and
544 passwords, e.g. `http://user:password@proxy.foo.com/'.
545
546 ** You can use the new `--cut-dirs' option to make Wget create less
547 directories.
548
549 ** The `;type=a' appendix to FTP URLs is now recognized.  For
550 instance, the following command will retrieve the welcoming message in
551 ASCII type transfer:
552
553     wget "ftp://ftp.somewhere.com/welcome.msg;type=a"
554
555 ** `--help' and `--version' options have been redone to to conform to
556 standards set by other GNU utilities.
557
558 ** Wget should now be compilable under MS Windows environment.  MS
559 Visual C++ and Watcom C have been used successfully.
560
561 ** If the file length is known, percentages are displayed during
562 download.
563
564 ** The manual page, now hopelessly out of date, is no longer
565 distributed with Wget.
566 \f
567 * Wget 1.4.5 is a bugfix release with no user-visible changes.
568 \f
569 * Wget 1.4.4 is a bugfix release with no user-visible changes.
570 \f
571 * Changes in Wget 1.4.3
572
573 ** Wget is now a GNU utility.
574
575 ** Can do passive FTP.
576
577 ** Reads .netrc.
578
579 ** Info documentation expanded.
580
581 ** Compiles on pre-ANSI compilers.
582
583 ** Global wgetrc now goes to /usr/local/etc (i.e. $sysconfdir).
584
585 ** Lots of bugfixes.
586 \f
587 * Changes in Wget 1.4.2
588
589 ** New mirror site at ftp://sunsite.auc.dk/pub/infosystems/wget/,
590 thanks to Karsten Thygesen.
591
592 ** Mailing list!  Mail to wget-request@sunsite.auc.dk to subscribe.
593
594 ** New option --delete-after for proxy prefetching.
595
596 ** New option --retr-symlinks to retrieve symbolic links like plain
597 files.
598
599 ** rmold.pl -- script to remove files deleted on the remote server
600
601 ** --convert-links should work now.
602
603 ** Minor bugfixes.
604 \f
605 * Changes in Wget 1.4.1
606
607 ** Minor bugfixes.
608
609 ** Added -I (the opposite of -X).
610
611 ** Dot tracing is now customizable; try wget --dot-style=binary
612 \f
613 * Changes in Wget 1.4.0
614
615 ** Wget 1.4.0 [formerly known as Geturl] is an extensive rewrite of
616 Geturl.  Although many things look suspiciously similar, most of the
617 stuff was rewritten, like recursive retrieval, HTTP, FTP and mostly
618 everything else.  Wget should be now easier to debug, maintain and,
619 most importantly, use.
620
621 ** Recursive HTTP should now work without glitches, even with Location
622 changes, server-generated directory listings and other naughty stuff.
623
624 ** HTTP regetting is supported on servers that support Range
625 specification. WWW authorization is supported -- try
626 wget http://user:password@hostname/
627
628 ** FTP support was rewritten and widely enhanced. Globbing should now
629 work flawlessly. Symbolic links are created locally. All the
630 information the Unix-style ls listing can give is now recognized.
631
632 ** Recursive FTP is supported, e.g.
633     wget -r ftp://gnjilux.cc.fer.hr/pub/unix/util/
634
635 ** You can specify "rejected" directories, to which you do not want to
636 enter, e.g. with wget -X /pub
637
638 ** Time-stamping is supported, with both HTTP and FTP. Try wget -N URL.
639
640 ** A new texinfo reference manual is provided.  It can be read with
641 Emacs, standalone info, or converted to HTML, dvi or postscript.
642
643 ** Fixed a long-standing bug, so that Wget now works over SLIP
644 connections.
645
646 ** You can have a system-wide wgetrc (/usr/local/lib/wgetrc by
647 default). Settings in $HOME/.wgetrc override the global ones, of
648 course :-)
649
650 ** You can set up quota in .wgetrc to prevent sucking too much
651 data. Try `quota = 5M' in .wgetrc (or quota = 100K if you want your
652 sysadmin to like you).
653
654 ** Download rate is printed after retrieval.
655
656 ** Wget now sends the `Referer' header when retrieving
657 recursively.
658
659 ** With the new --no-parent option Wget can retrieve FTP recursively
660 through a proxy server.
661
662 ** HTML parser, as well as the whole of Wget was rewritten to be much
663 faster and less memory-consuming (yes, both).
664
665 ** Absolute links can be converted to relative links locally. Check
666 wget -k.
667
668 ** Wget catches hangup, filtering the output to a log file and
669 resuming work. Try kill -HUP %?wget.
670
671 ** User-defined headers can be sent.  Try
672
673     wget http://fly.cc.her.hr/ --header='Accept-Charset: iso-8859-2'
674
675 ** Acceptance/Rejection lists may contain wildcards.
676
677 ** Wget can display HTTP headers and/or FTP server response with the
678 new `-S' option.  It can save the original HTTP headers with `-s'.
679
680 ** socks library is now supported (thanks to Antonio Rosella
681 <Antonio.Rosella@agip.it>). Configure with --with-socks.
682
683 ** There is a nicer display of REST-ed output.
684
685 ** Many new options (like -x to force directory hierarchy, or -m to
686 turn on mirroring options).
687
688 ** Wget is now distributed under GNU General Public License (GPL).
689
690 ** Lots of small features I can't remember. :-)
691
692 ** A host of bugfixes.
693 \f
694 * Changes in Geturl 1.3
695
696 ** Added FTP globbing support (ftp://fly.cc.fer.hr/*)
697
698 ** Added support for no_proxy
699
700 ** Added support for ftp://user:password@host/
701
702 ** Added support for %xx in URL syntax
703
704 ** More natural command-line options
705
706 ** Added -e switch to execute .geturlrc commands from the command-line
707
708 ** Added support for robots.txt
709
710 ** Fixed some minor bugs
711 \f
712 * Geturl 1.2 is a bugfix release with no user-visible changes.
713 \f
714 * Changes in Geturl 1.1
715
716 ** REST supported in FTP
717
718 ** Proxy servers supported
719
720 ** GNU getopt used, which enables command-line arguments to be ordered
721 as you wish, e.g.  geturl http://fly.cc.fer.hr/ -vo log is the same as
722 geturl -vo log http://fly.cc.fer.hr/
723
724 ** Netscape-compatible URL syntax for HTTP supported: host[:port]/dir/file
725
726 ** NcFTP-compatible colon URL syntax for FTP supported: host:/dir/file
727
728 ** <base href="xxx"> supported
729
730 ** autoconf supported
731 \f
732 ----------------------------------------------------------------------
733 Copyright information:
734
735 Copyright (C) 1997-2005 Free Software Foundation, Inc.
736
737    Permission is granted to anyone to make or distribute verbatim
738    copies of this document as received, in any medium, provided that
739    the copyright notice and this permission notice are preserved, thus
740    giving the recipient permission to redistribute in turn.
741
742    Permission is granted to distribute modified versions of this
743    document, or of portions of it, under the above conditions,
744    provided also that they carry prominent notices stating who last
745    changed them.