]> sjero.net Git - wget/blob - NEWS
NEWS: cite the new feature.
[wget] / NEWS
1 GNU Wget NEWS -- history of user-visible changes.
2
3 Copyright (C) 1997, 1998, 1999, 2000, 2001, 2002, 2003, 2004, 2005,
4 2006, 2007, 2008, 2009, 2010, 2011, 2012 Free Software Foundation, Inc.
5 See the end for copying conditions.
6
7 Please send GNU Wget bug reports to <bug-wget@gnu.org>.
8 \f
9 * Changes in Wget X.Y.Z
10
11 ** Add support for content-on-error.  It allows to store the HTTP
12    payload on 4xx or 5xx errors.
13
14 ** Add support for WARC files.
15
16 ** Fix a memory leak problem in the GNU TLS backend.
17
18 ** Autoreconf works again for distributed tarballs.
19
20 ** Print some diagnostic messages to stderr not to stdout.
21
22 ** Report stdout close errors.
23
24 ** Accept the --bit option.
25
26 ** Enable client certificates when GNU TLS is used.
27
28 ** Add support for TLS Server Name Indication.
29
30 ** Accept the arguments --accept-reject and --reject-regex.
31 \f
32 * Changes in Wget 1.13.4
33
34 ** Now --version and --help work again.
35
36 ** Fix a build error on solaris 10 sparc.
37
38 ** Now --timestamping and --continue work well together.
39
40 ** Return a network failure when FTP downloads fail and --timestamping
41    is specified.
42
43 ** Fix a segfault on an incomplete STYLE tag.
44 \f
45 * Changes in Wget 1.13.3
46
47 ** Support HTTP/1.1
48
49 ** Now by default the GNU TLS library for secure connections, instead of
50    OpenSSL.
51
52 ** Fix some portability issues.
53
54 ** Handle properly malformed status line in a HTTP response.
55
56 ** Ignore zero length domains in $no_proxy.
57
58 ** Set new cookies after an authorization failure.
59
60 ** Exit with failure if -k is specified and -O is not a regular file.
61
62 ** Cope better with unclosed html tags.
63
64 ** Print diagnostic messages to stderr, not stdout.
65
66 ** Do not use an additional HEAD request when --content-disposition is used,
67    but use directly GET.
68
69 ** Report the average transfer speed correctly when multiple URL's are specified
70    and -c influences the transferred data amount.
71
72 ** GNU TLS backend works again.
73
74 ** Now --timestamping and --continue works well together.
75
76 ** By default, on server redirects, use the original URL to get the
77    local file name. Close CVE-2010-2252.  This introduces a
78    backward-incompatibility; any script that relies on the old
79    behaviour must use --trust-server-names.
80
81 ** Fix a problem when -k is used and some URLs are specified trough
82    CSS.
83
84 ** Convert correctly URLs that need to be encoded to local files when following
85    links.
86
87 ** Use persistent connections with proxies supporting them.
88
89 ** Print the total download time as part of the summary for recursive downloads.
90
91 ** Now it is possible to specify a different startup configuration file trough
92    the --config option.
93
94 ** Fix an infinite loop with the error '<filename> has sprung into existence'
95    on a network error and -nc is used.
96
97 ** Now --adjust-extension does not modify the file extension if the file ends
98    in .htm.
99
100 ** Support HTTP/1.1 307 redirects keep request method.
101
102 ** Now --no-parent doesn't fetch undesired files if HTTP and HTTPS are used
103    by the same host on different pages.
104
105 ** Do not attempt to remove the file if it is not in the accept rules but
106    it is the output destination file.
107
108 ** Introduce `show_all_dns_entries' to print all IP addresses corresponding to
109    a DNS name when it is resolved.
110 \f
111 * Changes in Wget 1.12
112
113 ** Mailing list MOVED to bug-wget@gnu.org
114
115 ** SECURITY FIX: It had been possible to trick Wget into accepting
116 SSL certificates that don't match the host name, through the trick of
117 embedding NUL characters into the certs' common name. Fixed by Joao
118 Ferreira <joao@joaoff.com>.
119
120 ** Added support for CSS. This includes:
121      - Parsing links from CSS files, and from CSS content found in HTML
122        style tags and attributes.
123      - Supporting conversion of links found within CSS content, when
124        --convert-links is specified.
125      - Ensuring that CSS files end in the ".css" filename extension,
126        when --convert-links is specified.
127
128    CSS support in Wget is thanks to Ted Mielczarek
129    <ted.mielczarek@gmail.com>.
130
131 ** Added support for Internationalized Resource Identifiers (IRIs, RFC
132 3987). When support is enabled (requires libidn and libiconv), links
133 with non-ASCII bytes are translated from their source encoding to UTF-8
134 before percent-encoding.  IRI support was added by Saint Xavier
135 <wget@sxav.eu>, as his project for the Google Summer of Code.
136
137 ** Wget now provides more sensible exit status codes when downloads
138 don't proceed as expected (see the manual).
139
140 ** --default-page option (and associated wgetrc command) added to
141 support alternative default names for index.html.
142
143 ** --ask-password option (and associated wgetrc command) added to
144 support password prompts at the console.
145
146 ** The --input-file option now also handles retrieving links from
147 an external file.
148
149 ** The output generated by the --version option now includes
150 information on how it was built, and the set of configure-time options
151 that were selected.
152
153 ** --html-extension has been renamed to --adjust-extension, to reflect
154 the fact that it now also applies to CSS content. --html-extension is
155 still acceptable, but is now deprecated.
156
157 ** An "ascii" specifier is now accepted by --restrict-file-names, which
158 forces the percent-encoding of all non-ASCII bytes
159
160 ** Several previously existing, but undocumented .wgetrc options are
161 now documented: save_headers, spider, and user_agent,
162 auth_no_challenge, and keep_session_cookies. Also added documentation
163 for the "lowercase" and "uppercase" values for --restrict-file-names, which had been present since Wget 1.11.
164 \f
165 * Changes in Wget 1.11.4
166
167 ** Fixed an issue (apparently a regression) where -O would refuse to
168 download when -nc was given, even though the file didn't exist.
169
170 ** Fixed a situation where Wget could abort with --continue if the
171 remote server gives a content-length of zero when the file exists
172 locally with content.
173
174 ** Fixed a crash on some systems, due to Wget casting a pointer-to-long
175 to a pointer-to-time_t.
176
177 ** Translation updates for Catalan.
178 \f
179 * Changes in Wget 1.11.3
180
181 ** Downgraded -N with -O to a warning, rather than an error.
182
183 ** Translation updates
184 \f
185 * Changes in Wget 1.11.2
186
187 ** Fixed a problem in authenticating over HTTPS through a proxy.
188 (Regression in 1.11 over 1.10.2.)
189
190 ** The combination of -r or -p with -O, which was disallowed in 1.11,
191 has been downgraded to a warning in 1.11.2. (-O and -N, which was never
192 meaningful, is still an error.)
193
194 ** Further improvements to progress bar displays in non-English locales
195 (too many spaces could be inserted, causing the display to scroll).
196
197 ** Successive invocations of Wget on FTP URLS, with --no-remove-listing
198 and --continue, was causing Wget to append, rather than replace,
199 information in the .listing file, and thereby download the same files
200 multiple times. This has been fixed in 1.11.2.
201
202 ** Wget 1.11 no longer allowed ".." to persist at the beginning of URLs,
203 for improved conformance with RFC 3986. However, this behavior presents
204 problems for some FTP setups, and so they are now preserved again, for
205 FTP URLs only.
206 \f
207 * Changes in Wget 1.11.1.
208
209 ** Interrupted downloads no longer result in renaming the file
210 (regression in 1.11 over 1.10.2).
211
212 ** Progress bar now displays correctly in non-English locales (and a
213 related assertion failure was fixed).
214
215 ** Wget no longer issues a GET request over HTTP for files it should
216 know it's not going to download (regression in 1.11 over 1.10.2).
217
218 ** Added option --auth-no-challenge, to support broken pre-1.11
219 authentication-before-server-challenge, which turns out to still be
220 useful for some limited cases.
221
222 ** Documentation of accept/reject lists in the manual's "Types of
223 Files" section now explains various aspects of their behavior that may
224 be surprising, and notes that they may change in the future.
225
226 ** Documentation of --no-parents now explains how a trailing slash, or
227 lack thereof, in the specified URL, will affect behavior.
228 \f
229 * Changes in Wget 1.11.
230
231 ** Timestamping now uses the value from the most recent HTTP response,
232 rather than the first one it got.
233
234 ** Authentication information is no longer sent as part of the Referer
235 header in recursive fetches.
236
237 ** No authentication credentials are sent until a challenge is issued,
238 for improved security. Authentication handling is still not
239 RFC-compliant, as once a Basic challenge has been received, it will
240 assume it can send credentials to any URL at that same host, and not
241 just the ones at or below the original authenticated location.
242 Credentials for Digest authentication are still never saved or issued
243 automatically, and continue to require a challenge for each resource.
244
245 ** Added --max-redirect option, allowing the user to specify what should
246 be the maximum number of HTTP redirects to follow.
247
248 ** Wget now supports saving HTTP downloads using file names specified by
249 the `Content-Disposition' header.  This is a standard way of specifying
250 the file name used by many web dynamically generated pages. However, the
251 current implementation is inefficient, and known to have bugs. It is
252 EXPERIMENTAL only, and not enabled by default. Use --content-disposition
253 to enable it.
254
255 ** The new option `--ignore-case' makes Wget ignore case when
256 matching files, directories, and wildcards.  This affects the -X, -I,
257 -A, and -R options, as well as globbing in FTP URLs.
258
259 ** ETA projection is now displayed in "dot" progress output as well as
260 in the default progress bar.  (The dot progress is used by default when
261 logging Wget's output to file using the `-o' option.)
262
263 ** The "lockable boolean" argument type is no longer supported.  It
264 was only used by the passive_ftp .wgetrc setting.  If you're running
265 broken scripts or Perl modules that unconditionally specify
266 `--passive-ftp' and your firewall disallows it, you can override them
267 by replacing wget with a script that execs wget "$@" --no-passive-ftp.
268
269 ** The source code has been migrated to Mercurial. The repositories are
270 available at http://hg.addictivecode.org/. Prior to this, the source
271 code was hosted on Subversion (migrated from the original CVS); you can
272 still get access to older tags and branches for Wget in the Subversion
273 repository at http://addictivecode.org/svn/wget/.
274 \f
275 * Changes in Wget 1.10.
276
277 ** Downloading files larger than 2GB, sometimes referred to as "large
278 files", now works on systems that support them.  This includes the
279 majority of modern Unixes, as well as MS Windows.
280
281 ** IPv6 is now supported by Wget.  Unlike the experimental code in
282 1.9, this version supports dual-family systems.  The new flags
283 `--inet4' and `--inet6' (or `-4' and `-6' for short) force the use of
284 IPv4 and IPv6 respectively.  Note that IPv6 support has not yet been
285 tested on Windows.
286
287 ** Microsoft's proprietary "NTLM" method of HTTP authentication is now
288 supported.  This authentication method is undocumented and only used
289 by IIS.  Note that *proxy* authentication is not supported in this
290 release; you can only authenticate to the target web site.
291
292 ** Wget no longer truncates partially downloaded files when download
293 has to start over because the server doesn't support Range.  Instead,
294 with such servers Wget now simply ignores the data up to the byte
295 where the last attempt left off, and only then continues appending to
296 the file.  That way the downloaded file never shrinks, and download
297 retries from servers without support for partial downloads work even
298 when downloading to stdout.
299
300 ** SSL/TLS changes:
301
302 *** SSL/TLS downloads now attempt to verify the server's certificate
303 against the recognized certificate authorities.  This requires CA
304 certificates to have been installed in a location visible to the
305 OpenSSL library.  If this is not the case, you can get the bundle
306 yourself from a source you trust (for example, the bundle extracted
307 from Mozilla available at http://curl.haxx.se/docs/caextract.html),
308 and point Wget to the PEM file using the `--ca-certificate'
309 command-line option or the corresponding `.wgetrc' command.
310
311 *** Secure downloads now verify that the host name in the URL matches
312 the "common name" in the certificate presented by the server.
313
314 *** Although the above checks provide more secure downloads, they
315 unavoidably break interoperability with some sites that worked with
316 previous versions, particularly those using self-signed, expired, or
317 otherwise invalid certificates.  If you encounter "certificate
318 verification" errors or complaints that "common name doesn't match
319 requested host name" and are convinced of the site's authenticity, you
320 can use `--no-check-certificate' to bypass both checks.
321
322 *** Talking to SSL/TLS servers over proxies now actually works.
323 Previous versions of Wget erroneously sent GET requests for https
324 URLs.  Wget 1.10 utilizes the CONNECT method designed for this
325 purpose.
326
327 *** The SSL/TLS-related options have been redesigned and, for the
328 first time, documented in the manual.  The old, undocumented, options
329 are no longer supported.
330
331 ** Passive FTP is now the default FTP transfer mode.  Use
332 `--no-passive-ftp' or specify `passive_ftp = off' in your init file to
333 revert to the old behavior.
334
335 ** The `--header' option can now be used to override generated
336 headers.  For example, `wget --header="Host: foo.bar"
337 http://127.0.0.1' tells Wget to connect to localhost, but to specify
338 "foo.bar" in the `Host' header.  In previous versions such use of
339 `--header' lead to duplicate headers in HTTP requests.
340
341 ** The responses without headers, aka "HTTP 0.9" responses, are
342 detected and handled.  Although HTTP 0.9 has long been obsolete, it is
343 still occasionally used, sometimes by accident.
344
345 ** The progress bar is now updated regularly even when the data does
346 not arrive from the network.
347
348 ** Wget no longer preserves permissions of files retrieved by FTP by
349 default.  Anonymous FTP servers frequently use permissions like "664",
350 which might not be what the user wants.  The new option
351 `--preserve-permissions' and the corresponding `.wgetrc' variable can
352 be used to revert to the old behavior.
353
354 ** The new option `--protocol-directories' instructs Wget to also use
355 the protocol name as a directory component of local file names.
356
357 ** Options that previously unconditionally set or unset various flags
358 are now boolean options that can be invoked as either `--OPTION' or
359 `--no-OPTION'.  Options that required an argument "on" or "off" have
360 also been changed this way, but they still accept the old syntax for
361 backward compatibility.  For example, instead of `--glob=off' you can
362 write `--no-glob'.
363
364 Allowing `--no-OPTION' for every `--OPTION' and the other way around
365 is useful because it allows the user to override non-default behavior
366 specified via `.wgetrc'.
367
368 ** The new option `--keep-session-cookies' causes `--save-cookies' to
369 save session cookies (normally only kept in memory) along with the
370 permanent ones.  This is useful because many sites track important
371 information, such as whether the user has authenticated, in session
372 cookies.  With this option multiple Wget runs are treated as a single
373 browser session.
374
375 ** Wget now supports the --ftp-user and --ftp-password command
376 switches to set username and password for FTP, and the --user and
377 --password command switches to set username and password for both FTP
378 and HTTP.  The --http-passwd and --proxy-passwd command switches have
379 been renamed to --http-password and --proxy-password respectively, and
380 the related http_passwd and proxy_passwd .wgetrc commands to
381 http_password and proxy_password respectively.  The login and passwd
382 .wgetrc commands have been deprecated.
383
384 * `wget -b' now works correctly under Windows.
385 \f
386 * Wget 1.9.1 is a bugfix release with no user-visible changes.
387 \f
388 * Changes in Wget 1.9.
389
390 ** It is now possible to specify that POST method be used for HTTP
391 requests.  For example, `wget --post-data="id=foo&data=bar" URL' will
392 send a POST request with the specified contents.
393
394 ** IPv6 support is available, although it's still experimental.
395
396 ** The `--timeout' option now also affects DNS lookup and establishing
397 the TCP connection.  Previously it only affected reading and writing
398 data.  Those three timeouts can be set separately using
399 `--dns-timeout', `--connection-timeout', and `--read-timeout',
400 respectively.
401
402 ** Download speed shown by the progress bar is based on the data
403 recently read, rather than the average speed of the entire download.
404 The ETA projection is still based on the overall average.
405
406 ** It is now possible to connect to FTP servers through FWTK
407 firewalls.  Set ftp_proxy to an FTP URL, and Wget will automatically
408 log on to the proxy as "username@host".
409
410 ** The new option `--retry-connrefused' makes Wget retry downloads
411 even in the face of refused connections, which are otherwise
412 considered a fatal error.
413
414 ** The new option `--no-dns-cache' may be used to prevent Wget from
415 caching DNS lookups.
416
417 ** Wget no longer escapes characters in local file names based on
418 whether they're appropriate in URLs.  Escaping can still occur for
419 nonprintable characters or for '/', but no longer for frequent
420 characters such as space.  You can use the new option
421 --restrict-file-names to relax or strengthen these rules, which can be
422 useful if you dislike the default or if you're downloading to
423 non-native partitions.
424
425 ** Handling of HTML comments has been dumbed down to conform to what
426 users expect and other browsers do: instead of being treated as SGML
427 declaration, a comment is terminated at the first occurrence of "-->".
428 Use `--strict-comments' to revert to the old behavior.
429
430 ** Wget now correctly handles relative URIs that begin with "//", such
431 as "//img.foo.com/foo.jpg".
432
433 ** Boolean options in `.wgetrc' and on the command line now accept
434 values "yes" and "no" along with the traditional "on" and "off".
435
436 ** It is now possible to specify decimal values for timeouts, waiting
437 periods, and download rate.  For instance, `--wait=0.5' now works as
438 expected, as does `--dns-timeout=0.5' and even `--limit-rate=2.5k'.
439 \f
440 * Wget 1.8.2 is a bugfix release with no user-visible changes.
441 \f
442 * Wget 1.8.1 is a bugfix release with no user-visible changes.
443 \f
444 * Changes in Wget 1.8.
445
446 ** A new progress indicator is now available and used by default.
447 You can choose the progress bar type with `--progress=TYPE'.  Two
448 types are available, "bar" (the new default), and "dot" (the old
449 dotted indicator).  You can permanently revert to the old progress
450 indicator by putting `progress = dot' in your `.wgetrc'.
451
452 ** You can limit the download rate of the retrieval using the
453 `--limit-rate' option.  For example, `wget --limit-rate=15k URL' will
454 tell Wget not to download the body of the URL faster than 15 kilobytes
455 per second.
456
457 ** Recursive retrieval and link conversion have been revamped:
458
459 *** Wget now traverses links breadth-first.  This makes the
460 calculation of depth much more reliable than before.  Also, recursive
461 downloads are faster and consume *significantly* less memory than
462 before.
463
464 *** Links are converted only when the entire retrieval is complete.
465 This is the only safe thing to do, as only then is it known what URLs
466 have been downloaded.
467
468 *** BASE tags are handled correctly when converting links.  Since Wget
469 already resolves <base href="..."> when resolving handling URLs, link
470 conversion now makes the BASE tags point to an empty string.
471
472 *** HTML anchors are now handled correctly.  Links to an anchor in the
473 same document (<a href="#anchorname">), which used to confuse Wget,
474 are now converted correctly.
475
476 *** When in page-requisites (-p) mode, no-parent (-np) is ignored when
477 retrieving for inline images, stylesheets, and other documents needed
478 to display the page.
479
480 *** Page-requisites (-p) mode now works with frames.  In other words,
481 `wget -p URL-THAT-USES-FRAMES' will now download the frame HTML files,
482 and all the files that they need to be displayed properly.
483
484 ** `--base' now works conjunction with `--input-file', providing a
485 base for each URL and thereby allowing the URLs in the file to be
486 relative.
487
488 ** If a host has more than one IP address, Wget uses the other
489 addresses when accessing the first one fails.
490
491 ** Host directories now contain port information if the URL is at a
492 non-standard port.
493
494 ** Wget now supports the robots.txt directives specified in
495 <http://www.robotstxt.org/wc/norobots-rfc.txt>.
496
497 ** URL parser has been fixed, especially the infamous overzealous
498 quoting.  Wget no longer dequotes reserved characters, e.g. `%3F' is
499 no longer translated to `?', nor `%2B' to `+'.  Unsafe characters
500 which are not reserved are still escaped, of course.
501
502 ** No more than 20 successive redirections are allowed.
503 \f
504 * Wget 1.7.1 is a bugfix release with no user-visible changes.
505 \f
506 * Changes in Wget 1.7.
507
508 ** SSL (`https') pages now work if you compile Wget with SSL support;
509 use the `--with-ssl' configure flag.  You need to have OpenSSL
510 installed.
511
512 ** Cookies are now supported.  Wget will accept cookies sent by the
513 server and return them in later requests.  Additionally, it can load
514 and save cookies to disk, in the same format that Netscape uses.
515
516 ** "Keep-alive" (persistent) HTTP connections are now supported.
517 Using keep-alive allows Wget to share one TCP/IP connection for
518 many retrievals, making multiple-file downloads faster and less
519 stressing for the server and the network.
520
521 ** Wget now recognizes FTP directory listings generated by NT and VMS
522 servers.
523
524 ** It is now possible to recurse through FTP sites where logging in
525 puts you in some directory other than '/'.
526
527 ** You may now use `~' to mean home directory in `.wgetrc'.  For
528 example, `load_cookies = ~/.netscape/cookies.txt' works as you would
529 expect.
530
531 ** The HTML parser has been rewritten.  The new one works more
532 reliably, allows finer-grained control over which tags and attributes
533 are detected, and has better support for some features like correctly
534 skipping comments and declarations, decoding entities, etc.  It is
535 also more general.
536
537 ** <meta name="robots"> tags are now respected.
538
539 ** Wget's internal tables now use hash tables instead of linked lists
540 where appropriate.  This results in huge speedups when retrieving
541 large sites (thousands of documents).
542
543 ** Wget now has a man page, automatically generated from the Texinfo
544 documentation.  (The last version that shipped with a man page was
545 1.4.5).  To get this, you need to have pod2man from the Perl
546 distribution installed on your system.
547 \f
548 * Changes in Wget 1.6
549
550 ** Administrative changes.
551
552 *** Maintainership.  Due to Hrvoje being plagued with a "real job",
553 Dan Harkless is the most active maintainer (not that he doesn't have a
554 real job as well).  Hrvoje still participates occasionally, and both
555 are being helped by many other people.
556
557 *** Web page.  Thanks to Jan Prikryl, Wget has an "official" web page.
558 Take a look at:
559
560     http://sunsite.dk/wget/
561
562 *** Anonymous CVS.  Thanks to ever-helpful Karsten Thygesen, Wget
563 sources are now available at an anonymous CVS server.  Take a look at
564 the web page for downloading instructions.
565
566 ** New -K / --backup-converted / backup_converted = on option causes files
567 modified due to -k to be saved with a .orig prefix before being changed.  When
568 using -N as well, it is these .orig files that are compared against the server.
569
570 ** New --follow-tags / follow_tags = ... option allows you to restrict
571 Wget to following only certain HTML tags when doing a recursive
572 retrieval.  -G / --ignore-tags / ignore_tags = ... is just the
573 opposite -- all tags but the ones you specify will be followed.
574
575 ** New --waitretry / waitretry = SECONDS option allows waiting between retries
576 of failed downloads.  Wget will use "linear" backoff, waiting 1 second after the
577 first failure, 2 after the second, up to SECONDS.  waitretry is set to 10 by
578 default in the system wgetrc.
579
580 ** New -p / --page-requisites / page_requisites = on option causes
581 Wget to download all ancillary files necessary to display a given HTML
582 page properly (e.g. inlined images).
583
584 ** New -E / --html-extension / html_extension = on option causes Wget
585 to append ".html" to text/html filenames not ending in regexp
586 "\.[Hh][Tt][Mm][Ll]?".
587
588 ** New type of .wgetrc command -- "lockable Boolean".  Can be set to on, off,
589 always, or never.  This allows the .wgetrc to override the commandline.  So far,
590 passive_ftp is the only .wgetrc command which takes a lockable Boolean.
591
592 ** A number of new translation files have been added.
593
594 ** New --bind-address / bind_address = <address> option for people on hosts
595 bound to multiple IP addresses.
596
597 ** wget now accepts (illegal per HTTP spec) relative URLs in HTTP redirects.
598 \f
599 * Wget 1.5.3 is a bugfix release with no user-visible changes.
600 \f
601 * Wget 1.5.2 is a bugfix release with no user-visible changes.
602 \f
603 * Wget 1.5.1 is a bugfix release with no user-visible changes.
604 \f
605 * Changes in Wget 1.5.0
606
607 ** Wget speaks many languages!
608
609 On systems with gettext(), Wget will output messages in the language
610 set by the current locale, if available.  At this time we support
611 Czech, German, Croatian, Italian, Norwegian and Portuguese.
612
613 ** Opie (Skey) is now supported with FTP.
614
615 ** HTTP Digest Access Authentication (RFC2069) is now supported.
616
617 ** The new `-b' option makes Wget go to background automatically.
618
619 ** The `-I' and `-X' options now accept wildcard arguments.
620
621 ** The `-w' option now accepts suffixes `s' for seconds, `m' for
622 minutes, `h' for hours, `d' for days and `w' for weeks.
623
624 ** Upon getting SIGHUP, the whole previous log is now copied to
625 `wget-log'.
626
627 ** Wget now understands proxy settings with explicit usernames and
628 passwords, e.g. `http://user:password@proxy.foo.com/'.
629
630 ** You can use the new `--cut-dirs' option to make Wget create less
631 directories.
632
633 ** The `;type=a' appendix to FTP URLs is now recognized.  For
634 instance, the following command will retrieve the welcoming message in
635 ASCII type transfer:
636
637     wget "ftp://ftp.somewhere.com/welcome.msg;type=a"
638
639 ** `--help' and `--version' options have been redone to to conform to
640 standards set by other GNU utilities.
641
642 ** Wget should now be compilable under MS Windows environment.  MS
643 Visual C++ and Watcom C have been used successfully.
644
645 ** If the file length is known, percentages are displayed during
646 download.
647
648 ** The manual page, now hopelessly out of date, is no longer
649 distributed with Wget.
650 \f
651 * Wget 1.4.5 is a bugfix release with no user-visible changes.
652 \f
653 * Wget 1.4.4 is a bugfix release with no user-visible changes.
654 \f
655 * Changes in Wget 1.4.3
656
657 ** Wget is now a GNU utility.
658
659 ** Can do passive FTP.
660
661 ** Reads .netrc.
662
663 ** Info documentation expanded.
664
665 ** Compiles on pre-ANSI compilers.
666
667 ** Global wgetrc now goes to /usr/local/etc (i.e. $sysconfdir).
668
669 ** Lots of bugfixes.
670 \f
671 * Changes in Wget 1.4.2
672
673 ** New mirror site at ftp://sunsite.auc.dk/pub/infosystems/wget/,
674 thanks to Karsten Thygesen.
675
676 ** Mailing list!  Mail to wget-request@sunsite.auc.dk to subscribe.
677
678 ** New option --delete-after for proxy prefetching.
679
680 ** New option --retr-symlinks to retrieve symbolic links like plain
681 files.
682
683 ** rmold.pl -- script to remove files deleted on the remote server
684
685 ** --convert-links should work now.
686
687 ** Minor bugfixes.
688 \f
689 * Changes in Wget 1.4.1
690
691 ** Minor bugfixes.
692
693 ** Added -I (the opposite of -X).
694
695 ** Dot tracing is now customizable; try wget --dot-style=binary
696 \f
697 * Changes in Wget 1.4.0
698
699 ** Wget 1.4.0 [formerly known as Geturl] is an extensive rewrite of
700 Geturl.  Although many things look suspiciously similar, most of the
701 stuff was rewritten, like recursive retrieval, HTTP, FTP and mostly
702 everything else.  Wget should be now easier to debug, maintain and,
703 most importantly, use.
704
705 ** Recursive HTTP should now work without glitches, even with Location
706 changes, server-generated directory listings and other naughty stuff.
707
708 ** HTTP regetting is supported on servers that support Range
709 specification. WWW authorization is supported -- try
710 wget http://user:password@hostname/
711
712 ** FTP support was rewritten and widely enhanced. Globbing should now
713 work flawlessly. Symbolic links are created locally. All the
714 information the Unix-style ls listing can give is now recognized.
715
716 ** Recursive FTP is supported, e.g.
717     wget -r ftp://gnjilux.cc.fer.hr/pub/unix/util/
718
719 ** You can specify "rejected" directories, to which you do not want to
720 enter, e.g. with wget -X /pub
721
722 ** Time-stamping is supported, with both HTTP and FTP. Try wget -N URL.
723
724 ** A new texinfo reference manual is provided.  It can be read with
725 Emacs, standalone info, or converted to HTML, dvi or postscript.
726
727 ** Fixed a long-standing bug, so that Wget now works over SLIP
728 connections.
729
730 ** You can have a system-wide wgetrc (/usr/local/lib/wgetrc by
731 default). Settings in $HOME/.wgetrc override the global ones, of
732 course :-)
733
734 ** You can set up quota in .wgetrc to prevent sucking too much
735 data. Try `quota = 5M' in .wgetrc (or quota = 100K if you want your
736 sysadmin to like you).
737
738 ** Download rate is printed after retrieval.
739
740 ** Wget now sends the `Referer' header when retrieving
741 recursively.
742
743 ** With the new --no-parent option Wget can retrieve FTP recursively
744 through a proxy server.
745
746 ** HTML parser, as well as the whole of Wget was rewritten to be much
747 faster and less memory-consuming (yes, both).
748
749 ** Absolute links can be converted to relative links locally. Check
750 wget -k.
751
752 ** Wget catches hangup, filtering the output to a log file and
753 resuming work. Try kill -HUP %?wget.
754
755 ** User-defined headers can be sent.  Try
756
757     wget http://fly.cc.her.hr/ --header='Accept-Charset: iso-8859-2'
758
759 ** Acceptance/Rejection lists may contain wildcards.
760
761 ** Wget can display HTTP headers and/or FTP server response with the
762 new `-S' option.  It can save the original HTTP headers with `-s'.
763
764 ** socks library is now supported (thanks to Antonio Rosella
765 <Antonio.Rosella@agip.it>). Configure with --with-socks.
766
767 ** There is a nicer display of REST-ed output.
768
769 ** Many new options (like -x to force directory hierarchy, or -m to
770 turn on mirroring options).
771
772 ** Wget is now distributed under GNU General Public License (GPL).
773
774 ** Lots of small features I can't remember. :-)
775
776 ** A host of bugfixes.
777 \f
778 * Changes in Geturl 1.3
779
780 ** Added FTP globbing support (ftp://fly.cc.fer.hr/*)
781
782 ** Added support for no_proxy
783
784 ** Added support for ftp://user:password@host/
785
786 ** Added support for %xx in URL syntax
787
788 ** More natural command-line options
789
790 ** Added -e switch to execute .geturlrc commands from the command-line
791
792 ** Added support for robots.txt
793
794 ** Fixed some minor bugs
795 \f
796 * Geturl 1.2 is a bugfix release with no user-visible changes.
797 \f
798 * Changes in Geturl 1.1
799
800 ** REST supported in FTP
801
802 ** Proxy servers supported
803
804 ** GNU getopt used, which enables command-line arguments to be ordered
805 as you wish, e.g.  geturl http://fly.cc.fer.hr/ -vo log is the same as
806 geturl -vo log http://fly.cc.fer.hr/
807
808 ** Netscape-compatible URL syntax for HTTP supported: host[:port]/dir/file
809
810 ** NcFTP-compatible colon URL syntax for FTP supported: host:/dir/file
811
812 ** <base href="xxx"> supported
813
814 ** autoconf supported
815 \f
816 ----------------------------------------------------------------------
817 Copyright information:
818
819 Copyright (C) 1997-2005 Free Software Foundation, Inc.
820
821    Permission is granted to anyone to make or distribute verbatim
822    copies of this document as received, in any medium, provided that
823    the copyright notice and this permission notice are preserved, thus
824    giving the recipient permission to redistribute in turn.
825
826    Permission is granted to distribute modified versions of this
827    document, or of portions of it, under the above conditions,
828    provided also that they carry prominent notices stating who last
829    changed them.