]> sjero.net Git - wget/blob - NEWS
Fix regeneration of autotools files in a distributed tarball.
[wget] / NEWS
1 GNU Wget NEWS -- history of user-visible changes.
2
3 Copyright (C) 1997, 1998, 1999, 2000, 2001, 2002, 2003, 2004, 2005,
4 2006, 2007, 2008, 2009, 2010, 2011 Free Software Foundation, Inc.
5 See the end for copying conditions.
6
7 Please send GNU Wget bug reports to <bug-wget@gnu.org>.
8 \f
9 * Changes in Wget X.Y.Z
10
11 ** Add support for content-on-error.  It allows to store the HTTP
12    payload on 4xx or 5xx errors.
13
14 ** Add support for WARC files.
15
16 ** Fix a memory leak problem in the GNU TLS backend.
17
18 ** Autoreconf works again for distributed tarballs.
19 \f
20 * Changes in Wget 1.13.4
21
22 ** Now --version and --help work again.
23
24 ** Fix a build error on solaris 10 sparc.
25
26 ** Now --timestamping and --continue work well together.
27
28 ** Return a network failure when FTP downloads fail and --timestamping
29    is specified.
30
31 \f
32 * Changes in Wget 1.13.3
33
34 ** Support HTTP/1.1
35
36 ** Now by default the GNU TLS library for secure connections, instead of
37    OpenSSL.
38
39 ** Fix some portability issues.
40
41 ** Handle properly malformed status line in a HTTP response.
42
43 ** Ignore zero length domains in $no_proxy.
44
45 ** Set new cookies after an authorization failure.
46
47 ** Exit with failure if -k is specified and -O is not a regular file.
48
49 ** Cope better with unclosed html tags.
50
51 ** Print diagnostic messages to stderr, not stdout.
52
53 ** Do not use an additional HEAD request when --content-disposition is used,
54    but use directly GET.
55
56 ** Report the average transfer speed correctly when multiple URL's are specified
57    and -c influences the transferred data amount.
58
59 ** GNU TLS backend works again.
60
61 ** Now --timestamping and --continue works well together.
62
63 ** By default, on server redirects, use the original URL to get the
64    local file name. Close CVE-2010-2252.  This introduces a
65    backward-incompatibility; any script that relies on the old
66    behaviour must use --trust-server-names.
67
68 ** Fix a problem when -k is used and some URLs are specified trough
69    CSS.
70
71 ** Convert correctly URLs that need to be encoded to local files when following
72    links.
73
74 ** Use persistent connections with proxies supporting them.
75
76 ** Print the total download time as part of the summary for recursive downloads.
77
78 ** Now it is possible to specify a different startup configuration file trough
79    the --config option.
80
81 ** Fix an infinite loop with the error '<filename> has sprung into existence'
82    on a network error and -nc is used.
83
84 ** Now --adjust-extension does not modify the file extension if the file ends
85    in .htm.
86
87 ** Support HTTP/1.1 307 redirects keep request method.
88
89 ** Now --no-parent doesn't fetch undesired files if HTTP and HTTPS are used
90    by the same host on different pages.
91
92 ** Do not attempt to remove the file if it is not in the accept rules but
93    it is the output destination file.
94
95 ** Introduce `show_all_dns_entries' to print all IP addresses corresponding to
96    a DNS name when it is resolved.
97 \f
98 * Changes in Wget 1.12
99
100 ** Mailing list MOVED to bug-wget@gnu.org
101
102 ** SECURITY FIX: It had been possible to trick Wget into accepting
103 SSL certificates that don't match the host name, through the trick of
104 embedding NUL characters into the certs' common name. Fixed by Joao
105 Ferreira <joao@joaoff.com>.
106
107 ** Added support for CSS. This includes:
108      - Parsing links from CSS files, and from CSS content found in HTML
109        style tags and attributes.
110      - Supporting conversion of links found within CSS content, when
111        --convert-links is specified.
112      - Ensuring that CSS files end in the ".css" filename extension,
113        when --convert-links is specified.
114
115    CSS support in Wget is thanks to Ted Mielczarek
116    <ted.mielczarek@gmail.com>.
117
118 ** Added support for Internationalized Resource Identifiers (IRIs, RFC
119 3987). When support is enabled (requires libidn and libiconv), links
120 with non-ASCII bytes are translated from their source encoding to UTF-8
121 before percent-encoding.  IRI support was added by Saint Xavier
122 <wget@sxav.eu>, as his project for the Google Summer of Code.
123
124 ** Wget now provides more sensible exit status codes when downloads
125 don't proceed as expected (see the manual).
126
127 ** --default-page option (and associated wgetrc command) added to
128 support alternative default names for index.html.
129
130 ** --ask-password option (and associated wgetrc command) added to
131 support password prompts at the console.
132
133 ** The --input-file option now also handles retrieving links from
134 an external file.
135
136 ** The output generated by the --version option now includes
137 information on how it was built, and the set of configure-time options
138 that were selected.
139
140 ** --html-extension has been renamed to --adjust-extension, to reflect
141 the fact that it now also applies to CSS content. --html-extension is
142 still acceptable, but is now deprecated.
143
144 ** An "ascii" specifier is now accepted by --restrict-file-names, which
145 forces the percent-encoding of all non-ASCII bytes
146
147 ** Several previously existing, but undocumented .wgetrc options are
148 now documented: save_headers, spider, and user_agent,
149 auth_no_challenge, and keep_session_cookies. Also added documentation
150 for the "lowercase" and "uppercase" values for --restrict-file-names, which had been present since Wget 1.11.
151 \f
152 * Changes in Wget 1.11.4
153
154 ** Fixed an issue (apparently a regression) where -O would refuse to
155 download when -nc was given, even though the file didn't exist.
156
157 ** Fixed a situation where Wget could abort with --continue if the
158 remote server gives a content-length of zero when the file exists
159 locally with content.
160
161 ** Fixed a crash on some systems, due to Wget casting a pointer-to-long
162 to a pointer-to-time_t.
163
164 ** Translation updates for Catalan.
165 \f
166 * Changes in Wget 1.11.3
167
168 ** Downgraded -N with -O to a warning, rather than an error.
169
170 ** Translation updates
171 \f
172 * Changes in Wget 1.11.2
173
174 ** Fixed a problem in authenticating over HTTPS through a proxy.
175 (Regression in 1.11 over 1.10.2.)
176
177 ** The combination of -r or -p with -O, which was disallowed in 1.11,
178 has been downgraded to a warning in 1.11.2. (-O and -N, which was never
179 meaningful, is still an error.)
180
181 ** Further improvements to progress bar displays in non-English locales
182 (too many spaces could be inserted, causing the display to scroll).
183
184 ** Successive invocations of Wget on FTP URLS, with --no-remove-listing
185 and --continue, was causing Wget to append, rather than replace,
186 information in the .listing file, and thereby download the same files
187 multiple times. This has been fixed in 1.11.2.
188
189 ** Wget 1.11 no longer allowed ".." to persist at the beginning of URLs,
190 for improved conformance with RFC 3986. However, this behavior presents
191 problems for some FTP setups, and so they are now preserved again, for
192 FTP URLs only.
193 \f
194 * Changes in Wget 1.11.1.
195
196 ** Interrupted downloads no longer result in renaming the file
197 (regression in 1.11 over 1.10.2).
198
199 ** Progress bar now displays correctly in non-English locales (and a
200 related assertion failure was fixed).
201
202 ** Wget no longer issues a GET request over HTTP for files it should
203 know it's not going to download (regression in 1.11 over 1.10.2).
204
205 ** Added option --auth-no-challenge, to support broken pre-1.11
206 authentication-before-server-challenge, which turns out to still be
207 useful for some limited cases.
208
209 ** Documentation of accept/reject lists in the manual's "Types of
210 Files" section now explains various aspects of their behavior that may
211 be surprising, and notes that they may change in the future.
212
213 ** Documentation of --no-parents now explains how a trailing slash, or
214 lack thereof, in the specified URL, will affect behavior.
215 \f
216 * Changes in Wget 1.11.
217
218 ** Timestamping now uses the value from the most recent HTTP response,
219 rather than the first one it got.
220
221 ** Authentication information is no longer sent as part of the Referer
222 header in recursive fetches.
223
224 ** No authentication credentials are sent until a challenge is issued,
225 for improved security. Authentication handling is still not
226 RFC-compliant, as once a Basic challenge has been received, it will
227 assume it can send credentials to any URL at that same host, and not
228 just the ones at or below the original authenticated location.
229 Credentials for Digest authentication are still never saved or issued
230 automatically, and continue to require a challenge for each resource.
231
232 ** Added --max-redirect option, allowing the user to specify what should
233 be the maximum number of HTTP redirects to follow.
234
235 ** Wget now supports saving HTTP downloads using file names specified by
236 the `Content-Disposition' header.  This is a standard way of specifying
237 the file name used by many web dynamically generated pages. However, the
238 current implementation is inefficient, and known to have bugs. It is
239 EXPERIMENTAL only, and not enabled by default. Use --content-disposition
240 to enable it.
241
242 ** The new option `--ignore-case' makes Wget ignore case when
243 matching files, directories, and wildcards.  This affects the -X, -I,
244 -A, and -R options, as well as globbing in FTP URLs.
245
246 ** ETA projection is now displayed in "dot" progress output as well as
247 in the default progress bar.  (The dot progress is used by default when
248 logging Wget's output to file using the `-o' option.)
249
250 ** The "lockable boolean" argument type is no longer supported.  It
251 was only used by the passive_ftp .wgetrc setting.  If you're running
252 broken scripts or Perl modules that unconditionally specify
253 `--passive-ftp' and your firewall disallows it, you can override them
254 by replacing wget with a script that execs wget "$@" --no-passive-ftp.
255
256 ** The source code has been migrated to Mercurial. The repositories are
257 available at http://hg.addictivecode.org/. Prior to this, the source
258 code was hosted on Subversion (migrated from the original CVS); you can
259 still get access to older tags and branches for Wget in the Subversion
260 repository at http://addictivecode.org/svn/wget/.
261 \f
262 * Changes in Wget 1.10.
263
264 ** Downloading files larger than 2GB, sometimes referred to as "large
265 files", now works on systems that support them.  This includes the
266 majority of modern Unixes, as well as MS Windows.
267
268 ** IPv6 is now supported by Wget.  Unlike the experimental code in
269 1.9, this version supports dual-family systems.  The new flags
270 `--inet4' and `--inet6' (or `-4' and `-6' for short) force the use of
271 IPv4 and IPv6 respectively.  Note that IPv6 support has not yet been
272 tested on Windows.
273
274 ** Microsoft's proprietary "NTLM" method of HTTP authentication is now
275 supported.  This authentication method is undocumented and only used
276 by IIS.  Note that *proxy* authentication is not supported in this
277 release; you can only authenticate to the target web site.
278
279 ** Wget no longer truncates partially downloaded files when download
280 has to start over because the server doesn't support Range.  Instead,
281 with such servers Wget now simply ignores the data up to the byte
282 where the last attempt left off, and only then continues appending to
283 the file.  That way the downloaded file never shrinks, and download
284 retries from servers without support for partial downloads work even
285 when downloading to stdout.
286
287 ** SSL/TLS changes:
288
289 *** SSL/TLS downloads now attempt to verify the server's certificate
290 against the recognized certificate authorities.  This requires CA
291 certificates to have been installed in a location visible to the
292 OpenSSL library.  If this is not the case, you can get the bundle
293 yourself from a source you trust (for example, the bundle extracted
294 from Mozilla available at http://curl.haxx.se/docs/caextract.html),
295 and point Wget to the PEM file using the `--ca-certificate'
296 command-line option or the corresponding `.wgetrc' command.
297
298 *** Secure downloads now verify that the host name in the URL matches
299 the "common name" in the certificate presented by the server.
300
301 *** Although the above checks provide more secure downloads, they
302 unavoidably break interoperability with some sites that worked with
303 previous versions, particularly those using self-signed, expired, or
304 otherwise invalid certificates.  If you encounter "certificate
305 verification" errors or complaints that "common name doesn't match
306 requested host name" and are convinced of the site's authenticity, you
307 can use `--no-check-certificate' to bypass both checks.
308
309 *** Talking to SSL/TLS servers over proxies now actually works.
310 Previous versions of Wget erroneously sent GET requests for https
311 URLs.  Wget 1.10 utilizes the CONNECT method designed for this
312 purpose.
313
314 *** The SSL/TLS-related options have been redesigned and, for the
315 first time, documented in the manual.  The old, undocumented, options
316 are no longer supported.
317
318 ** Passive FTP is now the default FTP transfer mode.  Use
319 `--no-passive-ftp' or specify `passive_ftp = off' in your init file to
320 revert to the old behavior.
321
322 ** The `--header' option can now be used to override generated
323 headers.  For example, `wget --header="Host: foo.bar"
324 http://127.0.0.1' tells Wget to connect to localhost, but to specify
325 "foo.bar" in the `Host' header.  In previous versions such use of
326 `--header' lead to duplicate headers in HTTP requests.
327
328 ** The responses without headers, aka "HTTP 0.9" responses, are
329 detected and handled.  Although HTTP 0.9 has long been obsolete, it is
330 still occasionally used, sometimes by accident.
331
332 ** The progress bar is now updated regularly even when the data does
333 not arrive from the network.
334
335 ** Wget no longer preserves permissions of files retrieved by FTP by
336 default.  Anonymous FTP servers frequently use permissions like "664",
337 which might not be what the user wants.  The new option
338 `--preserve-permissions' and the corresponding `.wgetrc' variable can
339 be used to revert to the old behavior.
340
341 ** The new option `--protocol-directories' instructs Wget to also use
342 the protocol name as a directory component of local file names.
343
344 ** Options that previously unconditionally set or unset various flags
345 are now boolean options that can be invoked as either `--OPTION' or
346 `--no-OPTION'.  Options that required an argument "on" or "off" have
347 also been changed this way, but they still accept the old syntax for
348 backward compatibility.  For example, instead of `--glob=off' you can
349 write `--no-glob'.
350
351 Allowing `--no-OPTION' for every `--OPTION' and the other way around
352 is useful because it allows the user to override non-default behavior
353 specified via `.wgetrc'.
354
355 ** The new option `--keep-session-cookies' causes `--save-cookies' to
356 save session cookies (normally only kept in memory) along with the
357 permanent ones.  This is useful because many sites track important
358 information, such as whether the user has authenticated, in session
359 cookies.  With this option multiple Wget runs are treated as a single
360 browser session.
361
362 ** Wget now supports the --ftp-user and --ftp-password command
363 switches to set username and password for FTP, and the --user and
364 --password command switches to set username and password for both FTP
365 and HTTP.  The --http-passwd and --proxy-passwd command switches have
366 been renamed to --http-password and --proxy-password respectively, and
367 the related http_passwd and proxy_passwd .wgetrc commands to
368 http_password and proxy_password respectively.  The login and passwd
369 .wgetrc commands have been deprecated.
370
371 * `wget -b' now works correctly under Windows.
372 \f
373 * Wget 1.9.1 is a bugfix release with no user-visible changes.
374 \f
375 * Changes in Wget 1.9.
376
377 ** It is now possible to specify that POST method be used for HTTP
378 requests.  For example, `wget --post-data="id=foo&data=bar" URL' will
379 send a POST request with the specified contents.
380
381 ** IPv6 support is available, although it's still experimental.
382
383 ** The `--timeout' option now also affects DNS lookup and establishing
384 the TCP connection.  Previously it only affected reading and writing
385 data.  Those three timeouts can be set separately using
386 `--dns-timeout', `--connection-timeout', and `--read-timeout',
387 respectively.
388
389 ** Download speed shown by the progress bar is based on the data
390 recently read, rather than the average speed of the entire download.
391 The ETA projection is still based on the overall average.
392
393 ** It is now possible to connect to FTP servers through FWTK
394 firewalls.  Set ftp_proxy to an FTP URL, and Wget will automatically
395 log on to the proxy as "username@host".
396
397 ** The new option `--retry-connrefused' makes Wget retry downloads
398 even in the face of refused connections, which are otherwise
399 considered a fatal error.
400
401 ** The new option `--no-dns-cache' may be used to prevent Wget from
402 caching DNS lookups.
403
404 ** Wget no longer escapes characters in local file names based on
405 whether they're appropriate in URLs.  Escaping can still occur for
406 nonprintable characters or for '/', but no longer for frequent
407 characters such as space.  You can use the new option
408 --restrict-file-names to relax or strengthen these rules, which can be
409 useful if you dislike the default or if you're downloading to
410 non-native partitions.
411
412 ** Handling of HTML comments has been dumbed down to conform to what
413 users expect and other browsers do: instead of being treated as SGML
414 declaration, a comment is terminated at the first occurrence of "-->".
415 Use `--strict-comments' to revert to the old behavior.
416
417 ** Wget now correctly handles relative URIs that begin with "//", such
418 as "//img.foo.com/foo.jpg".
419
420 ** Boolean options in `.wgetrc' and on the command line now accept
421 values "yes" and "no" along with the traditional "on" and "off".
422
423 ** It is now possible to specify decimal values for timeouts, waiting
424 periods, and download rate.  For instance, `--wait=0.5' now works as
425 expected, as does `--dns-timeout=0.5' and even `--limit-rate=2.5k'.
426 \f
427 * Wget 1.8.2 is a bugfix release with no user-visible changes.
428 \f
429 * Wget 1.8.1 is a bugfix release with no user-visible changes.
430 \f
431 * Changes in Wget 1.8.
432
433 ** A new progress indicator is now available and used by default.
434 You can choose the progress bar type with `--progress=TYPE'.  Two
435 types are available, "bar" (the new default), and "dot" (the old
436 dotted indicator).  You can permanently revert to the old progress
437 indicator by putting `progress = dot' in your `.wgetrc'.
438
439 ** You can limit the download rate of the retrieval using the
440 `--limit-rate' option.  For example, `wget --limit-rate=15k URL' will
441 tell Wget not to download the body of the URL faster than 15 kilobytes
442 per second.
443
444 ** Recursive retrieval and link conversion have been revamped:
445
446 *** Wget now traverses links breadth-first.  This makes the
447 calculation of depth much more reliable than before.  Also, recursive
448 downloads are faster and consume *significantly* less memory than
449 before.
450
451 *** Links are converted only when the entire retrieval is complete.
452 This is the only safe thing to do, as only then is it known what URLs
453 have been downloaded.
454
455 *** BASE tags are handled correctly when converting links.  Since Wget
456 already resolves <base href="..."> when resolving handling URLs, link
457 conversion now makes the BASE tags point to an empty string.
458
459 *** HTML anchors are now handled correctly.  Links to an anchor in the
460 same document (<a href="#anchorname">), which used to confuse Wget,
461 are now converted correctly.
462
463 *** When in page-requisites (-p) mode, no-parent (-np) is ignored when
464 retrieving for inline images, stylesheets, and other documents needed
465 to display the page.
466
467 *** Page-requisites (-p) mode now works with frames.  In other words,
468 `wget -p URL-THAT-USES-FRAMES' will now download the frame HTML files,
469 and all the files that they need to be displayed properly.
470
471 ** `--base' now works conjunction with `--input-file', providing a
472 base for each URL and thereby allowing the URLs in the file to be
473 relative.
474
475 ** If a host has more than one IP address, Wget uses the other
476 addresses when accessing the first one fails.
477
478 ** Host directories now contain port information if the URL is at a
479 non-standard port.
480
481 ** Wget now supports the robots.txt directives specified in
482 <http://www.robotstxt.org/wc/norobots-rfc.txt>.
483
484 ** URL parser has been fixed, especially the infamous overzealous
485 quoting.  Wget no longer dequotes reserved characters, e.g. `%3F' is
486 no longer translated to `?', nor `%2B' to `+'.  Unsafe characters
487 which are not reserved are still escaped, of course.
488
489 ** No more than 20 successive redirections are allowed.
490 \f
491 * Wget 1.7.1 is a bugfix release with no user-visible changes.
492 \f
493 * Changes in Wget 1.7.
494
495 ** SSL (`https') pages now work if you compile Wget with SSL support;
496 use the `--with-ssl' configure flag.  You need to have OpenSSL
497 installed.
498
499 ** Cookies are now supported.  Wget will accept cookies sent by the
500 server and return them in later requests.  Additionally, it can load
501 and save cookies to disk, in the same format that Netscape uses.
502
503 ** "Keep-alive" (persistent) HTTP connections are now supported.
504 Using keep-alive allows Wget to share one TCP/IP connection for
505 many retrievals, making multiple-file downloads faster and less
506 stressing for the server and the network.
507
508 ** Wget now recognizes FTP directory listings generated by NT and VMS
509 servers.
510
511 ** It is now possible to recurse through FTP sites where logging in
512 puts you in some directory other than '/'.
513
514 ** You may now use `~' to mean home directory in `.wgetrc'.  For
515 example, `load_cookies = ~/.netscape/cookies.txt' works as you would
516 expect.
517
518 ** The HTML parser has been rewritten.  The new one works more
519 reliably, allows finer-grained control over which tags and attributes
520 are detected, and has better support for some features like correctly
521 skipping comments and declarations, decoding entities, etc.  It is
522 also more general.
523
524 ** <meta name="robots"> tags are now respected.
525
526 ** Wget's internal tables now use hash tables instead of linked lists
527 where appropriate.  This results in huge speedups when retrieving
528 large sites (thousands of documents).
529
530 ** Wget now has a man page, automatically generated from the Texinfo
531 documentation.  (The last version that shipped with a man page was
532 1.4.5).  To get this, you need to have pod2man from the Perl
533 distribution installed on your system.
534 \f
535 * Changes in Wget 1.6
536
537 ** Administrative changes.
538
539 *** Maintainership.  Due to Hrvoje being plagued with a "real job",
540 Dan Harkless is the most active maintainer (not that he doesn't have a
541 real job as well).  Hrvoje still participates occasionally, and both
542 are being helped by many other people.
543
544 *** Web page.  Thanks to Jan Prikryl, Wget has an "official" web page.
545 Take a look at:
546
547     http://sunsite.dk/wget/
548
549 *** Anonymous CVS.  Thanks to ever-helpful Karsten Thygesen, Wget
550 sources are now available at an anonymous CVS server.  Take a look at
551 the web page for downloading instructions.
552
553 ** New -K / --backup-converted / backup_converted = on option causes files
554 modified due to -k to be saved with a .orig prefix before being changed.  When
555 using -N as well, it is these .orig files that are compared against the server.
556
557 ** New --follow-tags / follow_tags = ... option allows you to restrict
558 Wget to following only certain HTML tags when doing a recursive
559 retrieval.  -G / --ignore-tags / ignore_tags = ... is just the
560 opposite -- all tags but the ones you specify will be followed.
561
562 ** New --waitretry / waitretry = SECONDS option allows waiting between retries
563 of failed downloads.  Wget will use "linear" backoff, waiting 1 second after the
564 first failure, 2 after the second, up to SECONDS.  waitretry is set to 10 by
565 default in the system wgetrc.
566
567 ** New -p / --page-requisites / page_requisites = on option causes
568 Wget to download all ancillary files necessary to display a given HTML
569 page properly (e.g. inlined images).
570
571 ** New -E / --html-extension / html_extension = on option causes Wget
572 to append ".html" to text/html filenames not ending in regexp
573 "\.[Hh][Tt][Mm][Ll]?".
574
575 ** New type of .wgetrc command -- "lockable Boolean".  Can be set to on, off,
576 always, or never.  This allows the .wgetrc to override the commandline.  So far,
577 passive_ftp is the only .wgetrc command which takes a lockable Boolean.
578
579 ** A number of new translation files have been added.
580
581 ** New --bind-address / bind_address = <address> option for people on hosts
582 bound to multiple IP addresses.
583
584 ** wget now accepts (illegal per HTTP spec) relative URLs in HTTP redirects.
585 \f
586 * Wget 1.5.3 is a bugfix release with no user-visible changes.
587 \f
588 * Wget 1.5.2 is a bugfix release with no user-visible changes.
589 \f
590 * Wget 1.5.1 is a bugfix release with no user-visible changes.
591 \f
592 * Changes in Wget 1.5.0
593
594 ** Wget speaks many languages!
595
596 On systems with gettext(), Wget will output messages in the language
597 set by the current locale, if available.  At this time we support
598 Czech, German, Croatian, Italian, Norwegian and Portuguese.
599
600 ** Opie (Skey) is now supported with FTP.
601
602 ** HTTP Digest Access Authentication (RFC2069) is now supported.
603
604 ** The new `-b' option makes Wget go to background automatically.
605
606 ** The `-I' and `-X' options now accept wildcard arguments.
607
608 ** The `-w' option now accepts suffixes `s' for seconds, `m' for
609 minutes, `h' for hours, `d' for days and `w' for weeks.
610
611 ** Upon getting SIGHUP, the whole previous log is now copied to
612 `wget-log'.
613
614 ** Wget now understands proxy settings with explicit usernames and
615 passwords, e.g. `http://user:password@proxy.foo.com/'.
616
617 ** You can use the new `--cut-dirs' option to make Wget create less
618 directories.
619
620 ** The `;type=a' appendix to FTP URLs is now recognized.  For
621 instance, the following command will retrieve the welcoming message in
622 ASCII type transfer:
623
624     wget "ftp://ftp.somewhere.com/welcome.msg;type=a"
625
626 ** `--help' and `--version' options have been redone to to conform to
627 standards set by other GNU utilities.
628
629 ** Wget should now be compilable under MS Windows environment.  MS
630 Visual C++ and Watcom C have been used successfully.
631
632 ** If the file length is known, percentages are displayed during
633 download.
634
635 ** The manual page, now hopelessly out of date, is no longer
636 distributed with Wget.
637 \f
638 * Wget 1.4.5 is a bugfix release with no user-visible changes.
639 \f
640 * Wget 1.4.4 is a bugfix release with no user-visible changes.
641 \f
642 * Changes in Wget 1.4.3
643
644 ** Wget is now a GNU utility.
645
646 ** Can do passive FTP.
647
648 ** Reads .netrc.
649
650 ** Info documentation expanded.
651
652 ** Compiles on pre-ANSI compilers.
653
654 ** Global wgetrc now goes to /usr/local/etc (i.e. $sysconfdir).
655
656 ** Lots of bugfixes.
657 \f
658 * Changes in Wget 1.4.2
659
660 ** New mirror site at ftp://sunsite.auc.dk/pub/infosystems/wget/,
661 thanks to Karsten Thygesen.
662
663 ** Mailing list!  Mail to wget-request@sunsite.auc.dk to subscribe.
664
665 ** New option --delete-after for proxy prefetching.
666
667 ** New option --retr-symlinks to retrieve symbolic links like plain
668 files.
669
670 ** rmold.pl -- script to remove files deleted on the remote server
671
672 ** --convert-links should work now.
673
674 ** Minor bugfixes.
675 \f
676 * Changes in Wget 1.4.1
677
678 ** Minor bugfixes.
679
680 ** Added -I (the opposite of -X).
681
682 ** Dot tracing is now customizable; try wget --dot-style=binary
683 \f
684 * Changes in Wget 1.4.0
685
686 ** Wget 1.4.0 [formerly known as Geturl] is an extensive rewrite of
687 Geturl.  Although many things look suspiciously similar, most of the
688 stuff was rewritten, like recursive retrieval, HTTP, FTP and mostly
689 everything else.  Wget should be now easier to debug, maintain and,
690 most importantly, use.
691
692 ** Recursive HTTP should now work without glitches, even with Location
693 changes, server-generated directory listings and other naughty stuff.
694
695 ** HTTP regetting is supported on servers that support Range
696 specification. WWW authorization is supported -- try
697 wget http://user:password@hostname/
698
699 ** FTP support was rewritten and widely enhanced. Globbing should now
700 work flawlessly. Symbolic links are created locally. All the
701 information the Unix-style ls listing can give is now recognized.
702
703 ** Recursive FTP is supported, e.g.
704     wget -r ftp://gnjilux.cc.fer.hr/pub/unix/util/
705
706 ** You can specify "rejected" directories, to which you do not want to
707 enter, e.g. with wget -X /pub
708
709 ** Time-stamping is supported, with both HTTP and FTP. Try wget -N URL.
710
711 ** A new texinfo reference manual is provided.  It can be read with
712 Emacs, standalone info, or converted to HTML, dvi or postscript.
713
714 ** Fixed a long-standing bug, so that Wget now works over SLIP
715 connections.
716
717 ** You can have a system-wide wgetrc (/usr/local/lib/wgetrc by
718 default). Settings in $HOME/.wgetrc override the global ones, of
719 course :-)
720
721 ** You can set up quota in .wgetrc to prevent sucking too much
722 data. Try `quota = 5M' in .wgetrc (or quota = 100K if you want your
723 sysadmin to like you).
724
725 ** Download rate is printed after retrieval.
726
727 ** Wget now sends the `Referer' header when retrieving
728 recursively.
729
730 ** With the new --no-parent option Wget can retrieve FTP recursively
731 through a proxy server.
732
733 ** HTML parser, as well as the whole of Wget was rewritten to be much
734 faster and less memory-consuming (yes, both).
735
736 ** Absolute links can be converted to relative links locally. Check
737 wget -k.
738
739 ** Wget catches hangup, filtering the output to a log file and
740 resuming work. Try kill -HUP %?wget.
741
742 ** User-defined headers can be sent.  Try
743
744     wget http://fly.cc.her.hr/ --header='Accept-Charset: iso-8859-2'
745
746 ** Acceptance/Rejection lists may contain wildcards.
747
748 ** Wget can display HTTP headers and/or FTP server response with the
749 new `-S' option.  It can save the original HTTP headers with `-s'.
750
751 ** socks library is now supported (thanks to Antonio Rosella
752 <Antonio.Rosella@agip.it>). Configure with --with-socks.
753
754 ** There is a nicer display of REST-ed output.
755
756 ** Many new options (like -x to force directory hierarchy, or -m to
757 turn on mirroring options).
758
759 ** Wget is now distributed under GNU General Public License (GPL).
760
761 ** Lots of small features I can't remember. :-)
762
763 ** A host of bugfixes.
764 \f
765 * Changes in Geturl 1.3
766
767 ** Added FTP globbing support (ftp://fly.cc.fer.hr/*)
768
769 ** Added support for no_proxy
770
771 ** Added support for ftp://user:password@host/
772
773 ** Added support for %xx in URL syntax
774
775 ** More natural command-line options
776
777 ** Added -e switch to execute .geturlrc commands from the command-line
778
779 ** Added support for robots.txt
780
781 ** Fixed some minor bugs
782 \f
783 * Geturl 1.2 is a bugfix release with no user-visible changes.
784 \f
785 * Changes in Geturl 1.1
786
787 ** REST supported in FTP
788
789 ** Proxy servers supported
790
791 ** GNU getopt used, which enables command-line arguments to be ordered
792 as you wish, e.g.  geturl http://fly.cc.fer.hr/ -vo log is the same as
793 geturl -vo log http://fly.cc.fer.hr/
794
795 ** Netscape-compatible URL syntax for HTTP supported: host[:port]/dir/file
796
797 ** NcFTP-compatible colon URL syntax for FTP supported: host:/dir/file
798
799 ** <base href="xxx"> supported
800
801 ** autoconf supported
802 \f
803 ----------------------------------------------------------------------
804 Copyright information:
805
806 Copyright (C) 1997-2005 Free Software Foundation, Inc.
807
808    Permission is granted to anyone to make or distribute verbatim
809    copies of this document as received, in any medium, provided that
810    the copyright notice and this permission notice are preserved, thus
811    giving the recipient permission to redistribute in turn.
812
813    Permission is granted to distribute modified versions of this
814    document, or of portions of it, under the above conditions,
815    provided also that they carry prominent notices stating who last
816    changed them.