]> sjero.net Git - wget/blob - NEWS
NEWS: cite the last change.
[wget] / NEWS
1 GNU Wget NEWS -- history of user-visible changes.
2
3 Copyright (C) 1997, 1998, 1999, 2000, 2001, 2002, 2003, 2004, 2005,
4 2006, 2007, 2008, 2009, 2010, 2011, 2012 Free Software Foundation, Inc.
5 See the end for copying conditions.
6
7 Please send GNU Wget bug reports to <bug-wget@gnu.org>.
8 \f
9 * Changes in Wget X.Y.Z
10
11 ** Add support for content-on-error.  It allows to store the HTTP
12    payload on 4xx or 5xx errors.
13
14 ** Add support for WARC files.
15
16 ** Fix a memory leak problem in the GNU TLS backend.
17
18 ** Autoreconf works again for distributed tarballs.
19
20 ** Print some diagnostic messages to stderr not to stdout.
21
22 ** Report stdout close errors.
23
24 ** Accept the --bit option.
25
26 ** Enable client certificates when GNU TLS is used.
27
28 ** Add support for TLS Server Name Indication.
29
30 ** Accept the arguments --accept-reject and --reject-regex.
31
32 ** The GNU TLS backend honors correctly the timeout value.
33 \f
34 * Changes in Wget 1.13.4
35
36 ** Now --version and --help work again.
37
38 ** Fix a build error on solaris 10 sparc.
39
40 ** Now --timestamping and --continue work well together.
41
42 ** Return a network failure when FTP downloads fail and --timestamping
43    is specified.
44
45 ** Fix a segfault on an incomplete STYLE tag.
46 \f
47 * Changes in Wget 1.13.3
48
49 ** Support HTTP/1.1
50
51 ** Now by default the GNU TLS library for secure connections, instead of
52    OpenSSL.
53
54 ** Fix some portability issues.
55
56 ** Handle properly malformed status line in a HTTP response.
57
58 ** Ignore zero length domains in $no_proxy.
59
60 ** Set new cookies after an authorization failure.
61
62 ** Exit with failure if -k is specified and -O is not a regular file.
63
64 ** Cope better with unclosed html tags.
65
66 ** Print diagnostic messages to stderr, not stdout.
67
68 ** Do not use an additional HEAD request when --content-disposition is used,
69    but use directly GET.
70
71 ** Report the average transfer speed correctly when multiple URL's are specified
72    and -c influences the transferred data amount.
73
74 ** GNU TLS backend works again.
75
76 ** Now --timestamping and --continue works well together.
77
78 ** By default, on server redirects, use the original URL to get the
79    local file name. Close CVE-2010-2252.  This introduces a
80    backward-incompatibility; any script that relies on the old
81    behaviour must use --trust-server-names.
82
83 ** Fix a problem when -k is used and some URLs are specified trough
84    CSS.
85
86 ** Convert correctly URLs that need to be encoded to local files when following
87    links.
88
89 ** Use persistent connections with proxies supporting them.
90
91 ** Print the total download time as part of the summary for recursive downloads.
92
93 ** Now it is possible to specify a different startup configuration file trough
94    the --config option.
95
96 ** Fix an infinite loop with the error '<filename> has sprung into existence'
97    on a network error and -nc is used.
98
99 ** Now --adjust-extension does not modify the file extension if the file ends
100    in .htm.
101
102 ** Support HTTP/1.1 307 redirects keep request method.
103
104 ** Now --no-parent doesn't fetch undesired files if HTTP and HTTPS are used
105    by the same host on different pages.
106
107 ** Do not attempt to remove the file if it is not in the accept rules but
108    it is the output destination file.
109
110 ** Introduce `show_all_dns_entries' to print all IP addresses corresponding to
111    a DNS name when it is resolved.
112 \f
113 * Changes in Wget 1.12
114
115 ** Mailing list MOVED to bug-wget@gnu.org
116
117 ** SECURITY FIX: It had been possible to trick Wget into accepting
118 SSL certificates that don't match the host name, through the trick of
119 embedding NUL characters into the certs' common name. Fixed by Joao
120 Ferreira <joao@joaoff.com>.
121
122 ** Added support for CSS. This includes:
123      - Parsing links from CSS files, and from CSS content found in HTML
124        style tags and attributes.
125      - Supporting conversion of links found within CSS content, when
126        --convert-links is specified.
127      - Ensuring that CSS files end in the ".css" filename extension,
128        when --convert-links is specified.
129
130    CSS support in Wget is thanks to Ted Mielczarek
131    <ted.mielczarek@gmail.com>.
132
133 ** Added support for Internationalized Resource Identifiers (IRIs, RFC
134 3987). When support is enabled (requires libidn and libiconv), links
135 with non-ASCII bytes are translated from their source encoding to UTF-8
136 before percent-encoding.  IRI support was added by Saint Xavier
137 <wget@sxav.eu>, as his project for the Google Summer of Code.
138
139 ** Wget now provides more sensible exit status codes when downloads
140 don't proceed as expected (see the manual).
141
142 ** --default-page option (and associated wgetrc command) added to
143 support alternative default names for index.html.
144
145 ** --ask-password option (and associated wgetrc command) added to
146 support password prompts at the console.
147
148 ** The --input-file option now also handles retrieving links from
149 an external file.
150
151 ** The output generated by the --version option now includes
152 information on how it was built, and the set of configure-time options
153 that were selected.
154
155 ** --html-extension has been renamed to --adjust-extension, to reflect
156 the fact that it now also applies to CSS content. --html-extension is
157 still acceptable, but is now deprecated.
158
159 ** An "ascii" specifier is now accepted by --restrict-file-names, which
160 forces the percent-encoding of all non-ASCII bytes
161
162 ** Several previously existing, but undocumented .wgetrc options are
163 now documented: save_headers, spider, and user_agent,
164 auth_no_challenge, and keep_session_cookies. Also added documentation
165 for the "lowercase" and "uppercase" values for --restrict-file-names, which had been present since Wget 1.11.
166 \f
167 * Changes in Wget 1.11.4
168
169 ** Fixed an issue (apparently a regression) where -O would refuse to
170 download when -nc was given, even though the file didn't exist.
171
172 ** Fixed a situation where Wget could abort with --continue if the
173 remote server gives a content-length of zero when the file exists
174 locally with content.
175
176 ** Fixed a crash on some systems, due to Wget casting a pointer-to-long
177 to a pointer-to-time_t.
178
179 ** Translation updates for Catalan.
180 \f
181 * Changes in Wget 1.11.3
182
183 ** Downgraded -N with -O to a warning, rather than an error.
184
185 ** Translation updates
186 \f
187 * Changes in Wget 1.11.2
188
189 ** Fixed a problem in authenticating over HTTPS through a proxy.
190 (Regression in 1.11 over 1.10.2.)
191
192 ** The combination of -r or -p with -O, which was disallowed in 1.11,
193 has been downgraded to a warning in 1.11.2. (-O and -N, which was never
194 meaningful, is still an error.)
195
196 ** Further improvements to progress bar displays in non-English locales
197 (too many spaces could be inserted, causing the display to scroll).
198
199 ** Successive invocations of Wget on FTP URLS, with --no-remove-listing
200 and --continue, was causing Wget to append, rather than replace,
201 information in the .listing file, and thereby download the same files
202 multiple times. This has been fixed in 1.11.2.
203
204 ** Wget 1.11 no longer allowed ".." to persist at the beginning of URLs,
205 for improved conformance with RFC 3986. However, this behavior presents
206 problems for some FTP setups, and so they are now preserved again, for
207 FTP URLs only.
208 \f
209 * Changes in Wget 1.11.1.
210
211 ** Interrupted downloads no longer result in renaming the file
212 (regression in 1.11 over 1.10.2).
213
214 ** Progress bar now displays correctly in non-English locales (and a
215 related assertion failure was fixed).
216
217 ** Wget no longer issues a GET request over HTTP for files it should
218 know it's not going to download (regression in 1.11 over 1.10.2).
219
220 ** Added option --auth-no-challenge, to support broken pre-1.11
221 authentication-before-server-challenge, which turns out to still be
222 useful for some limited cases.
223
224 ** Documentation of accept/reject lists in the manual's "Types of
225 Files" section now explains various aspects of their behavior that may
226 be surprising, and notes that they may change in the future.
227
228 ** Documentation of --no-parents now explains how a trailing slash, or
229 lack thereof, in the specified URL, will affect behavior.
230 \f
231 * Changes in Wget 1.11.
232
233 ** Timestamping now uses the value from the most recent HTTP response,
234 rather than the first one it got.
235
236 ** Authentication information is no longer sent as part of the Referer
237 header in recursive fetches.
238
239 ** No authentication credentials are sent until a challenge is issued,
240 for improved security. Authentication handling is still not
241 RFC-compliant, as once a Basic challenge has been received, it will
242 assume it can send credentials to any URL at that same host, and not
243 just the ones at or below the original authenticated location.
244 Credentials for Digest authentication are still never saved or issued
245 automatically, and continue to require a challenge for each resource.
246
247 ** Added --max-redirect option, allowing the user to specify what should
248 be the maximum number of HTTP redirects to follow.
249
250 ** Wget now supports saving HTTP downloads using file names specified by
251 the `Content-Disposition' header.  This is a standard way of specifying
252 the file name used by many web dynamically generated pages. However, the
253 current implementation is inefficient, and known to have bugs. It is
254 EXPERIMENTAL only, and not enabled by default. Use --content-disposition
255 to enable it.
256
257 ** The new option `--ignore-case' makes Wget ignore case when
258 matching files, directories, and wildcards.  This affects the -X, -I,
259 -A, and -R options, as well as globbing in FTP URLs.
260
261 ** ETA projection is now displayed in "dot" progress output as well as
262 in the default progress bar.  (The dot progress is used by default when
263 logging Wget's output to file using the `-o' option.)
264
265 ** The "lockable boolean" argument type is no longer supported.  It
266 was only used by the passive_ftp .wgetrc setting.  If you're running
267 broken scripts or Perl modules that unconditionally specify
268 `--passive-ftp' and your firewall disallows it, you can override them
269 by replacing wget with a script that execs wget "$@" --no-passive-ftp.
270
271 ** The source code has been migrated to Mercurial. The repositories are
272 available at http://hg.addictivecode.org/. Prior to this, the source
273 code was hosted on Subversion (migrated from the original CVS); you can
274 still get access to older tags and branches for Wget in the Subversion
275 repository at http://addictivecode.org/svn/wget/.
276 \f
277 * Changes in Wget 1.10.
278
279 ** Downloading files larger than 2GB, sometimes referred to as "large
280 files", now works on systems that support them.  This includes the
281 majority of modern Unixes, as well as MS Windows.
282
283 ** IPv6 is now supported by Wget.  Unlike the experimental code in
284 1.9, this version supports dual-family systems.  The new flags
285 `--inet4' and `--inet6' (or `-4' and `-6' for short) force the use of
286 IPv4 and IPv6 respectively.  Note that IPv6 support has not yet been
287 tested on Windows.
288
289 ** Microsoft's proprietary "NTLM" method of HTTP authentication is now
290 supported.  This authentication method is undocumented and only used
291 by IIS.  Note that *proxy* authentication is not supported in this
292 release; you can only authenticate to the target web site.
293
294 ** Wget no longer truncates partially downloaded files when download
295 has to start over because the server doesn't support Range.  Instead,
296 with such servers Wget now simply ignores the data up to the byte
297 where the last attempt left off, and only then continues appending to
298 the file.  That way the downloaded file never shrinks, and download
299 retries from servers without support for partial downloads work even
300 when downloading to stdout.
301
302 ** SSL/TLS changes:
303
304 *** SSL/TLS downloads now attempt to verify the server's certificate
305 against the recognized certificate authorities.  This requires CA
306 certificates to have been installed in a location visible to the
307 OpenSSL library.  If this is not the case, you can get the bundle
308 yourself from a source you trust (for example, the bundle extracted
309 from Mozilla available at http://curl.haxx.se/docs/caextract.html),
310 and point Wget to the PEM file using the `--ca-certificate'
311 command-line option or the corresponding `.wgetrc' command.
312
313 *** Secure downloads now verify that the host name in the URL matches
314 the "common name" in the certificate presented by the server.
315
316 *** Although the above checks provide more secure downloads, they
317 unavoidably break interoperability with some sites that worked with
318 previous versions, particularly those using self-signed, expired, or
319 otherwise invalid certificates.  If you encounter "certificate
320 verification" errors or complaints that "common name doesn't match
321 requested host name" and are convinced of the site's authenticity, you
322 can use `--no-check-certificate' to bypass both checks.
323
324 *** Talking to SSL/TLS servers over proxies now actually works.
325 Previous versions of Wget erroneously sent GET requests for https
326 URLs.  Wget 1.10 utilizes the CONNECT method designed for this
327 purpose.
328
329 *** The SSL/TLS-related options have been redesigned and, for the
330 first time, documented in the manual.  The old, undocumented, options
331 are no longer supported.
332
333 ** Passive FTP is now the default FTP transfer mode.  Use
334 `--no-passive-ftp' or specify `passive_ftp = off' in your init file to
335 revert to the old behavior.
336
337 ** The `--header' option can now be used to override generated
338 headers.  For example, `wget --header="Host: foo.bar"
339 http://127.0.0.1' tells Wget to connect to localhost, but to specify
340 "foo.bar" in the `Host' header.  In previous versions such use of
341 `--header' lead to duplicate headers in HTTP requests.
342
343 ** The responses without headers, aka "HTTP 0.9" responses, are
344 detected and handled.  Although HTTP 0.9 has long been obsolete, it is
345 still occasionally used, sometimes by accident.
346
347 ** The progress bar is now updated regularly even when the data does
348 not arrive from the network.
349
350 ** Wget no longer preserves permissions of files retrieved by FTP by
351 default.  Anonymous FTP servers frequently use permissions like "664",
352 which might not be what the user wants.  The new option
353 `--preserve-permissions' and the corresponding `.wgetrc' variable can
354 be used to revert to the old behavior.
355
356 ** The new option `--protocol-directories' instructs Wget to also use
357 the protocol name as a directory component of local file names.
358
359 ** Options that previously unconditionally set or unset various flags
360 are now boolean options that can be invoked as either `--OPTION' or
361 `--no-OPTION'.  Options that required an argument "on" or "off" have
362 also been changed this way, but they still accept the old syntax for
363 backward compatibility.  For example, instead of `--glob=off' you can
364 write `--no-glob'.
365
366 Allowing `--no-OPTION' for every `--OPTION' and the other way around
367 is useful because it allows the user to override non-default behavior
368 specified via `.wgetrc'.
369
370 ** The new option `--keep-session-cookies' causes `--save-cookies' to
371 save session cookies (normally only kept in memory) along with the
372 permanent ones.  This is useful because many sites track important
373 information, such as whether the user has authenticated, in session
374 cookies.  With this option multiple Wget runs are treated as a single
375 browser session.
376
377 ** Wget now supports the --ftp-user and --ftp-password command
378 switches to set username and password for FTP, and the --user and
379 --password command switches to set username and password for both FTP
380 and HTTP.  The --http-passwd and --proxy-passwd command switches have
381 been renamed to --http-password and --proxy-password respectively, and
382 the related http_passwd and proxy_passwd .wgetrc commands to
383 http_password and proxy_password respectively.  The login and passwd
384 .wgetrc commands have been deprecated.
385
386 * `wget -b' now works correctly under Windows.
387 \f
388 * Wget 1.9.1 is a bugfix release with no user-visible changes.
389 \f
390 * Changes in Wget 1.9.
391
392 ** It is now possible to specify that POST method be used for HTTP
393 requests.  For example, `wget --post-data="id=foo&data=bar" URL' will
394 send a POST request with the specified contents.
395
396 ** IPv6 support is available, although it's still experimental.
397
398 ** The `--timeout' option now also affects DNS lookup and establishing
399 the TCP connection.  Previously it only affected reading and writing
400 data.  Those three timeouts can be set separately using
401 `--dns-timeout', `--connection-timeout', and `--read-timeout',
402 respectively.
403
404 ** Download speed shown by the progress bar is based on the data
405 recently read, rather than the average speed of the entire download.
406 The ETA projection is still based on the overall average.
407
408 ** It is now possible to connect to FTP servers through FWTK
409 firewalls.  Set ftp_proxy to an FTP URL, and Wget will automatically
410 log on to the proxy as "username@host".
411
412 ** The new option `--retry-connrefused' makes Wget retry downloads
413 even in the face of refused connections, which are otherwise
414 considered a fatal error.
415
416 ** The new option `--no-dns-cache' may be used to prevent Wget from
417 caching DNS lookups.
418
419 ** Wget no longer escapes characters in local file names based on
420 whether they're appropriate in URLs.  Escaping can still occur for
421 nonprintable characters or for '/', but no longer for frequent
422 characters such as space.  You can use the new option
423 --restrict-file-names to relax or strengthen these rules, which can be
424 useful if you dislike the default or if you're downloading to
425 non-native partitions.
426
427 ** Handling of HTML comments has been dumbed down to conform to what
428 users expect and other browsers do: instead of being treated as SGML
429 declaration, a comment is terminated at the first occurrence of "-->".
430 Use `--strict-comments' to revert to the old behavior.
431
432 ** Wget now correctly handles relative URIs that begin with "//", such
433 as "//img.foo.com/foo.jpg".
434
435 ** Boolean options in `.wgetrc' and on the command line now accept
436 values "yes" and "no" along with the traditional "on" and "off".
437
438 ** It is now possible to specify decimal values for timeouts, waiting
439 periods, and download rate.  For instance, `--wait=0.5' now works as
440 expected, as does `--dns-timeout=0.5' and even `--limit-rate=2.5k'.
441 \f
442 * Wget 1.8.2 is a bugfix release with no user-visible changes.
443 \f
444 * Wget 1.8.1 is a bugfix release with no user-visible changes.
445 \f
446 * Changes in Wget 1.8.
447
448 ** A new progress indicator is now available and used by default.
449 You can choose the progress bar type with `--progress=TYPE'.  Two
450 types are available, "bar" (the new default), and "dot" (the old
451 dotted indicator).  You can permanently revert to the old progress
452 indicator by putting `progress = dot' in your `.wgetrc'.
453
454 ** You can limit the download rate of the retrieval using the
455 `--limit-rate' option.  For example, `wget --limit-rate=15k URL' will
456 tell Wget not to download the body of the URL faster than 15 kilobytes
457 per second.
458
459 ** Recursive retrieval and link conversion have been revamped:
460
461 *** Wget now traverses links breadth-first.  This makes the
462 calculation of depth much more reliable than before.  Also, recursive
463 downloads are faster and consume *significantly* less memory than
464 before.
465
466 *** Links are converted only when the entire retrieval is complete.
467 This is the only safe thing to do, as only then is it known what URLs
468 have been downloaded.
469
470 *** BASE tags are handled correctly when converting links.  Since Wget
471 already resolves <base href="..."> when resolving handling URLs, link
472 conversion now makes the BASE tags point to an empty string.
473
474 *** HTML anchors are now handled correctly.  Links to an anchor in the
475 same document (<a href="#anchorname">), which used to confuse Wget,
476 are now converted correctly.
477
478 *** When in page-requisites (-p) mode, no-parent (-np) is ignored when
479 retrieving for inline images, stylesheets, and other documents needed
480 to display the page.
481
482 *** Page-requisites (-p) mode now works with frames.  In other words,
483 `wget -p URL-THAT-USES-FRAMES' will now download the frame HTML files,
484 and all the files that they need to be displayed properly.
485
486 ** `--base' now works conjunction with `--input-file', providing a
487 base for each URL and thereby allowing the URLs in the file to be
488 relative.
489
490 ** If a host has more than one IP address, Wget uses the other
491 addresses when accessing the first one fails.
492
493 ** Host directories now contain port information if the URL is at a
494 non-standard port.
495
496 ** Wget now supports the robots.txt directives specified in
497 <http://www.robotstxt.org/wc/norobots-rfc.txt>.
498
499 ** URL parser has been fixed, especially the infamous overzealous
500 quoting.  Wget no longer dequotes reserved characters, e.g. `%3F' is
501 no longer translated to `?', nor `%2B' to `+'.  Unsafe characters
502 which are not reserved are still escaped, of course.
503
504 ** No more than 20 successive redirections are allowed.
505 \f
506 * Wget 1.7.1 is a bugfix release with no user-visible changes.
507 \f
508 * Changes in Wget 1.7.
509
510 ** SSL (`https') pages now work if you compile Wget with SSL support;
511 use the `--with-ssl' configure flag.  You need to have OpenSSL
512 installed.
513
514 ** Cookies are now supported.  Wget will accept cookies sent by the
515 server and return them in later requests.  Additionally, it can load
516 and save cookies to disk, in the same format that Netscape uses.
517
518 ** "Keep-alive" (persistent) HTTP connections are now supported.
519 Using keep-alive allows Wget to share one TCP/IP connection for
520 many retrievals, making multiple-file downloads faster and less
521 stressing for the server and the network.
522
523 ** Wget now recognizes FTP directory listings generated by NT and VMS
524 servers.
525
526 ** It is now possible to recurse through FTP sites where logging in
527 puts you in some directory other than '/'.
528
529 ** You may now use `~' to mean home directory in `.wgetrc'.  For
530 example, `load_cookies = ~/.netscape/cookies.txt' works as you would
531 expect.
532
533 ** The HTML parser has been rewritten.  The new one works more
534 reliably, allows finer-grained control over which tags and attributes
535 are detected, and has better support for some features like correctly
536 skipping comments and declarations, decoding entities, etc.  It is
537 also more general.
538
539 ** <meta name="robots"> tags are now respected.
540
541 ** Wget's internal tables now use hash tables instead of linked lists
542 where appropriate.  This results in huge speedups when retrieving
543 large sites (thousands of documents).
544
545 ** Wget now has a man page, automatically generated from the Texinfo
546 documentation.  (The last version that shipped with a man page was
547 1.4.5).  To get this, you need to have pod2man from the Perl
548 distribution installed on your system.
549 \f
550 * Changes in Wget 1.6
551
552 ** Administrative changes.
553
554 *** Maintainership.  Due to Hrvoje being plagued with a "real job",
555 Dan Harkless is the most active maintainer (not that he doesn't have a
556 real job as well).  Hrvoje still participates occasionally, and both
557 are being helped by many other people.
558
559 *** Web page.  Thanks to Jan Prikryl, Wget has an "official" web page.
560 Take a look at:
561
562     http://sunsite.dk/wget/
563
564 *** Anonymous CVS.  Thanks to ever-helpful Karsten Thygesen, Wget
565 sources are now available at an anonymous CVS server.  Take a look at
566 the web page for downloading instructions.
567
568 ** New -K / --backup-converted / backup_converted = on option causes files
569 modified due to -k to be saved with a .orig prefix before being changed.  When
570 using -N as well, it is these .orig files that are compared against the server.
571
572 ** New --follow-tags / follow_tags = ... option allows you to restrict
573 Wget to following only certain HTML tags when doing a recursive
574 retrieval.  -G / --ignore-tags / ignore_tags = ... is just the
575 opposite -- all tags but the ones you specify will be followed.
576
577 ** New --waitretry / waitretry = SECONDS option allows waiting between retries
578 of failed downloads.  Wget will use "linear" backoff, waiting 1 second after the
579 first failure, 2 after the second, up to SECONDS.  waitretry is set to 10 by
580 default in the system wgetrc.
581
582 ** New -p / --page-requisites / page_requisites = on option causes
583 Wget to download all ancillary files necessary to display a given HTML
584 page properly (e.g. inlined images).
585
586 ** New -E / --html-extension / html_extension = on option causes Wget
587 to append ".html" to text/html filenames not ending in regexp
588 "\.[Hh][Tt][Mm][Ll]?".
589
590 ** New type of .wgetrc command -- "lockable Boolean".  Can be set to on, off,
591 always, or never.  This allows the .wgetrc to override the commandline.  So far,
592 passive_ftp is the only .wgetrc command which takes a lockable Boolean.
593
594 ** A number of new translation files have been added.
595
596 ** New --bind-address / bind_address = <address> option for people on hosts
597 bound to multiple IP addresses.
598
599 ** wget now accepts (illegal per HTTP spec) relative URLs in HTTP redirects.
600 \f
601 * Wget 1.5.3 is a bugfix release with no user-visible changes.
602 \f
603 * Wget 1.5.2 is a bugfix release with no user-visible changes.
604 \f
605 * Wget 1.5.1 is a bugfix release with no user-visible changes.
606 \f
607 * Changes in Wget 1.5.0
608
609 ** Wget speaks many languages!
610
611 On systems with gettext(), Wget will output messages in the language
612 set by the current locale, if available.  At this time we support
613 Czech, German, Croatian, Italian, Norwegian and Portuguese.
614
615 ** Opie (Skey) is now supported with FTP.
616
617 ** HTTP Digest Access Authentication (RFC2069) is now supported.
618
619 ** The new `-b' option makes Wget go to background automatically.
620
621 ** The `-I' and `-X' options now accept wildcard arguments.
622
623 ** The `-w' option now accepts suffixes `s' for seconds, `m' for
624 minutes, `h' for hours, `d' for days and `w' for weeks.
625
626 ** Upon getting SIGHUP, the whole previous log is now copied to
627 `wget-log'.
628
629 ** Wget now understands proxy settings with explicit usernames and
630 passwords, e.g. `http://user:password@proxy.foo.com/'.
631
632 ** You can use the new `--cut-dirs' option to make Wget create less
633 directories.
634
635 ** The `;type=a' appendix to FTP URLs is now recognized.  For
636 instance, the following command will retrieve the welcoming message in
637 ASCII type transfer:
638
639     wget "ftp://ftp.somewhere.com/welcome.msg;type=a"
640
641 ** `--help' and `--version' options have been redone to to conform to
642 standards set by other GNU utilities.
643
644 ** Wget should now be compilable under MS Windows environment.  MS
645 Visual C++ and Watcom C have been used successfully.
646
647 ** If the file length is known, percentages are displayed during
648 download.
649
650 ** The manual page, now hopelessly out of date, is no longer
651 distributed with Wget.
652 \f
653 * Wget 1.4.5 is a bugfix release with no user-visible changes.
654 \f
655 * Wget 1.4.4 is a bugfix release with no user-visible changes.
656 \f
657 * Changes in Wget 1.4.3
658
659 ** Wget is now a GNU utility.
660
661 ** Can do passive FTP.
662
663 ** Reads .netrc.
664
665 ** Info documentation expanded.
666
667 ** Compiles on pre-ANSI compilers.
668
669 ** Global wgetrc now goes to /usr/local/etc (i.e. $sysconfdir).
670
671 ** Lots of bugfixes.
672 \f
673 * Changes in Wget 1.4.2
674
675 ** New mirror site at ftp://sunsite.auc.dk/pub/infosystems/wget/,
676 thanks to Karsten Thygesen.
677
678 ** Mailing list!  Mail to wget-request@sunsite.auc.dk to subscribe.
679
680 ** New option --delete-after for proxy prefetching.
681
682 ** New option --retr-symlinks to retrieve symbolic links like plain
683 files.
684
685 ** rmold.pl -- script to remove files deleted on the remote server
686
687 ** --convert-links should work now.
688
689 ** Minor bugfixes.
690 \f
691 * Changes in Wget 1.4.1
692
693 ** Minor bugfixes.
694
695 ** Added -I (the opposite of -X).
696
697 ** Dot tracing is now customizable; try wget --dot-style=binary
698 \f
699 * Changes in Wget 1.4.0
700
701 ** Wget 1.4.0 [formerly known as Geturl] is an extensive rewrite of
702 Geturl.  Although many things look suspiciously similar, most of the
703 stuff was rewritten, like recursive retrieval, HTTP, FTP and mostly
704 everything else.  Wget should be now easier to debug, maintain and,
705 most importantly, use.
706
707 ** Recursive HTTP should now work without glitches, even with Location
708 changes, server-generated directory listings and other naughty stuff.
709
710 ** HTTP regetting is supported on servers that support Range
711 specification. WWW authorization is supported -- try
712 wget http://user:password@hostname/
713
714 ** FTP support was rewritten and widely enhanced. Globbing should now
715 work flawlessly. Symbolic links are created locally. All the
716 information the Unix-style ls listing can give is now recognized.
717
718 ** Recursive FTP is supported, e.g.
719     wget -r ftp://gnjilux.cc.fer.hr/pub/unix/util/
720
721 ** You can specify "rejected" directories, to which you do not want to
722 enter, e.g. with wget -X /pub
723
724 ** Time-stamping is supported, with both HTTP and FTP. Try wget -N URL.
725
726 ** A new texinfo reference manual is provided.  It can be read with
727 Emacs, standalone info, or converted to HTML, dvi or postscript.
728
729 ** Fixed a long-standing bug, so that Wget now works over SLIP
730 connections.
731
732 ** You can have a system-wide wgetrc (/usr/local/lib/wgetrc by
733 default). Settings in $HOME/.wgetrc override the global ones, of
734 course :-)
735
736 ** You can set up quota in .wgetrc to prevent sucking too much
737 data. Try `quota = 5M' in .wgetrc (or quota = 100K if you want your
738 sysadmin to like you).
739
740 ** Download rate is printed after retrieval.
741
742 ** Wget now sends the `Referer' header when retrieving
743 recursively.
744
745 ** With the new --no-parent option Wget can retrieve FTP recursively
746 through a proxy server.
747
748 ** HTML parser, as well as the whole of Wget was rewritten to be much
749 faster and less memory-consuming (yes, both).
750
751 ** Absolute links can be converted to relative links locally. Check
752 wget -k.
753
754 ** Wget catches hangup, filtering the output to a log file and
755 resuming work. Try kill -HUP %?wget.
756
757 ** User-defined headers can be sent.  Try
758
759     wget http://fly.cc.her.hr/ --header='Accept-Charset: iso-8859-2'
760
761 ** Acceptance/Rejection lists may contain wildcards.
762
763 ** Wget can display HTTP headers and/or FTP server response with the
764 new `-S' option.  It can save the original HTTP headers with `-s'.
765
766 ** socks library is now supported (thanks to Antonio Rosella
767 <Antonio.Rosella@agip.it>). Configure with --with-socks.
768
769 ** There is a nicer display of REST-ed output.
770
771 ** Many new options (like -x to force directory hierarchy, or -m to
772 turn on mirroring options).
773
774 ** Wget is now distributed under GNU General Public License (GPL).
775
776 ** Lots of small features I can't remember. :-)
777
778 ** A host of bugfixes.
779 \f
780 * Changes in Geturl 1.3
781
782 ** Added FTP globbing support (ftp://fly.cc.fer.hr/*)
783
784 ** Added support for no_proxy
785
786 ** Added support for ftp://user:password@host/
787
788 ** Added support for %xx in URL syntax
789
790 ** More natural command-line options
791
792 ** Added -e switch to execute .geturlrc commands from the command-line
793
794 ** Added support for robots.txt
795
796 ** Fixed some minor bugs
797 \f
798 * Geturl 1.2 is a bugfix release with no user-visible changes.
799 \f
800 * Changes in Geturl 1.1
801
802 ** REST supported in FTP
803
804 ** Proxy servers supported
805
806 ** GNU getopt used, which enables command-line arguments to be ordered
807 as you wish, e.g.  geturl http://fly.cc.fer.hr/ -vo log is the same as
808 geturl -vo log http://fly.cc.fer.hr/
809
810 ** Netscape-compatible URL syntax for HTTP supported: host[:port]/dir/file
811
812 ** NcFTP-compatible colon URL syntax for FTP supported: host:/dir/file
813
814 ** <base href="xxx"> supported
815
816 ** autoconf supported
817 \f
818 ----------------------------------------------------------------------
819 Copyright information:
820
821 Copyright (C) 1997-2005 Free Software Foundation, Inc.
822
823    Permission is granted to anyone to make or distribute verbatim
824    copies of this document as received, in any medium, provided that
825    the copyright notice and this permission notice are preserved, thus
826    giving the recipient permission to redistribute in turn.
827
828    Permission is granted to distribute modified versions of this
829    document, or of portions of it, under the above conditions,
830    provided also that they carry prominent notices stating who last
831    changed them.