]> sjero.net Git - wget/blob - NEWS
Return a network failure when FTP downloads fail and --timestamping is used.
[wget] / NEWS
1 GNU Wget NEWS -- history of user-visible changes.
2
3 Copyright (C) 1997, 1998, 1999, 2000, 2001, 2002, 2003, 2004, 2005,
4 2006, 2007, 2008, 2009, 2010, 2011 Free Software Foundation, Inc.
5 See the end for copying conditions.
6
7 Please send GNU Wget bug reports to <bug-wget@gnu.org>.
8 \f
9 * Changes in Wget X.Y.Z
10
11 ** Now --version and --help work again.
12
13 ** Fix a build error on solaris 10 sparc.
14
15 ** Now --timestamping and --continue work well together.
16
17 ** Return a network failure when FTP downloads fail and --timestamping
18    is specified.
19
20 \f
21 * Changes in Wget 1.13.3
22
23 ** Support HTTP/1.1
24
25 ** Now by default the GNU TLS library for secure connections, instead of
26    OpenSSL.
27
28 ** Fix some portability issues.
29
30 ** Handle properly malformed status line in a HTTP response.
31
32 ** Ignore zero length domains in $no_proxy.
33
34 ** Set new cookies after an authorization failure.
35
36 ** Exit with failure if -k is specified and -O is not a regular file.
37
38 ** Cope better with unclosed html tags.
39
40 ** Print diagnostic messages to stderr, not stdout.
41
42 ** Do not use an additional HEAD request when --content-disposition is used,
43    but use directly GET.
44
45 ** Report the average transfer speed correctly when multiple URL's are specified
46    and -c influences the transferred data amount.
47
48 ** GNU TLS backend works again.
49
50 ** Now --timestamping and --continue works well together.
51
52 ** By default, on server redirects, use the original URL to get the
53    local file name. Close CVE-2010-2252.  This introduces a
54    backward-incompatibility; any script that relies on the old
55    behaviour must use --trust-server-names.
56
57 ** Fix a problem when -k is used and some URLs are specified trough
58    CSS.
59
60 ** Convert correctly URLs that need to be encoded to local files when following
61    links.
62
63 ** Use persistent connections with proxies supporting them.
64
65 ** Print the total download time as part of the summary for recursive downloads.
66
67 ** Now it is possible to specify a different startup configuration file trough
68    the --config option.
69
70 ** Fix an infinite loop with the error '<filename> has sprung into existence'
71    on a network error and -nc is used.
72
73 ** Now --adjust-extension does not modify the file extension if the file ends
74    in .htm.
75
76 ** Support HTTP/1.1 307 redirects keep request method.
77
78 ** Now --no-parent doesn't fetch undesired files if HTTP and HTTPS are used
79    by the same host on different pages.
80
81 ** Do not attempt to remove the file if it is not in the accept rules but
82    it is the output destination file.
83
84 ** Introduce `show_all_dns_entries' to print all IP addresses corresponding to
85    a DNS name when it is resolved.
86 \f
87 * Changes in Wget 1.12
88
89 ** Mailing list MOVED to bug-wget@gnu.org
90
91 ** SECURITY FIX: It had been possible to trick Wget into accepting
92 SSL certificates that don't match the host name, through the trick of
93 embedding NUL characters into the certs' common name. Fixed by Joao
94 Ferreira <joao@joaoff.com>.
95
96 ** Added support for CSS. This includes:
97      - Parsing links from CSS files, and from CSS content found in HTML
98        style tags and attributes.
99      - Supporting conversion of links found within CSS content, when
100        --convert-links is specified.
101      - Ensuring that CSS files end in the ".css" filename extension,
102        when --convert-links is specified.
103
104    CSS support in Wget is thanks to Ted Mielczarek
105    <ted.mielczarek@gmail.com>.
106
107 ** Added support for Internationalized Resource Identifiers (IRIs, RFC
108 3987). When support is enabled (requires libidn and libiconv), links
109 with non-ASCII bytes are translated from their source encoding to UTF-8
110 before percent-encoding.  IRI support was added by Saint Xavier
111 <wget@sxav.eu>, as his project for the Google Summer of Code.
112
113 ** Wget now provides more sensible exit status codes when downloads
114 don't proceed as expected (see the manual).
115
116 ** --default-page option (and associated wgetrc command) added to
117 support alternative default names for index.html.
118
119 ** --ask-password option (and associated wgetrc command) added to
120 support password prompts at the console.
121
122 ** The --input-file option now also handles retrieving links from
123 an external file.
124
125 ** The output generated by the --version option now includes
126 information on how it was built, and the set of configure-time options
127 that were selected.
128
129 ** --html-extension has been renamed to --adjust-extension, to reflect
130 the fact that it now also applies to CSS content. --html-extension is
131 still acceptable, but is now deprecated.
132
133 ** An "ascii" specifier is now accepted by --restrict-file-names, which
134 forces the percent-encoding of all non-ASCII bytes
135
136 ** Several previously existing, but undocumented .wgetrc options are
137 now documented: save_headers, spider, and user_agent,
138 auth_no_challenge, and keep_session_cookies. Also added documentation
139 for the "lowercase" and "uppercase" values for --restrict-file-names, which had been present since Wget 1.11.
140 \f
141 * Changes in Wget 1.11.4
142
143 ** Fixed an issue (apparently a regression) where -O would refuse to
144 download when -nc was given, even though the file didn't exist.
145
146 ** Fixed a situation where Wget could abort with --continue if the
147 remote server gives a content-length of zero when the file exists
148 locally with content.
149
150 ** Fixed a crash on some systems, due to Wget casting a pointer-to-long
151 to a pointer-to-time_t.
152
153 ** Translation updates for Catalan.
154 \f
155 * Changes in Wget 1.11.3
156
157 ** Downgraded -N with -O to a warning, rather than an error.
158
159 ** Translation updates
160 \f
161 * Changes in Wget 1.11.2
162
163 ** Fixed a problem in authenticating over HTTPS through a proxy.
164 (Regression in 1.11 over 1.10.2.)
165
166 ** The combination of -r or -p with -O, which was disallowed in 1.11,
167 has been downgraded to a warning in 1.11.2. (-O and -N, which was never
168 meaningful, is still an error.)
169
170 ** Further improvements to progress bar displays in non-English locales
171 (too many spaces could be inserted, causing the display to scroll).
172
173 ** Successive invocations of Wget on FTP URLS, with --no-remove-listing
174 and --continue, was causing Wget to append, rather than replace,
175 information in the .listing file, and thereby download the same files
176 multiple times. This has been fixed in 1.11.2.
177
178 ** Wget 1.11 no longer allowed ".." to persist at the beginning of URLs,
179 for improved conformance with RFC 3986. However, this behavior presents
180 problems for some FTP setups, and so they are now preserved again, for
181 FTP URLs only.
182 \f
183 * Changes in Wget 1.11.1.
184
185 ** Interrupted downloads no longer result in renaming the file
186 (regression in 1.11 over 1.10.2).
187
188 ** Progress bar now displays correctly in non-English locales (and a
189 related assertion failure was fixed).
190
191 ** Wget no longer issues a GET request over HTTP for files it should
192 know it's not going to download (regression in 1.11 over 1.10.2).
193
194 ** Added option --auth-no-challenge, to support broken pre-1.11
195 authentication-before-server-challenge, which turns out to still be
196 useful for some limited cases.
197
198 ** Documentation of accept/reject lists in the manual's "Types of
199 Files" section now explains various aspects of their behavior that may
200 be surprising, and notes that they may change in the future.
201
202 ** Documentation of --no-parents now explains how a trailing slash, or
203 lack thereof, in the specified URL, will affect behavior.
204 \f
205 * Changes in Wget 1.11.
206
207 ** Timestamping now uses the value from the most recent HTTP response,
208 rather than the first one it got.
209
210 ** Authentication information is no longer sent as part of the Referer
211 header in recursive fetches.
212
213 ** No authentication credentials are sent until a challenge is issued,
214 for improved security. Authentication handling is still not
215 RFC-compliant, as once a Basic challenge has been received, it will
216 assume it can send credentials to any URL at that same host, and not
217 just the ones at or below the original authenticated location.
218 Credentials for Digest authentication are still never saved or issued
219 automatically, and continue to require a challenge for each resource.
220
221 ** Added --max-redirect option, allowing the user to specify what should
222 be the maximum number of HTTP redirects to follow.
223
224 ** Wget now supports saving HTTP downloads using file names specified by
225 the `Content-Disposition' header.  This is a standard way of specifying
226 the file name used by many web dynamically generated pages. However, the
227 current implementation is inefficient, and known to have bugs. It is
228 EXPERIMENTAL only, and not enabled by default. Use --content-disposition
229 to enable it.
230
231 ** The new option `--ignore-case' makes Wget ignore case when
232 matching files, directories, and wildcards.  This affects the -X, -I,
233 -A, and -R options, as well as globbing in FTP URLs.
234
235 ** ETA projection is now displayed in "dot" progress output as well as
236 in the default progress bar.  (The dot progress is used by default when
237 logging Wget's output to file using the `-o' option.)
238
239 ** The "lockable boolean" argument type is no longer supported.  It
240 was only used by the passive_ftp .wgetrc setting.  If you're running
241 broken scripts or Perl modules that unconditionally specify
242 `--passive-ftp' and your firewall disallows it, you can override them
243 by replacing wget with a script that execs wget "$@" --no-passive-ftp.
244
245 ** The source code has been migrated to Mercurial. The repositories are
246 available at http://hg.addictivecode.org/. Prior to this, the source
247 code was hosted on Subversion (migrated from the original CVS); you can
248 still get access to older tags and branches for Wget in the Subversion
249 repository at http://addictivecode.org/svn/wget/.
250 \f
251 * Changes in Wget 1.10.
252
253 ** Downloading files larger than 2GB, sometimes referred to as "large
254 files", now works on systems that support them.  This includes the
255 majority of modern Unixes, as well as MS Windows.
256
257 ** IPv6 is now supported by Wget.  Unlike the experimental code in
258 1.9, this version supports dual-family systems.  The new flags
259 `--inet4' and `--inet6' (or `-4' and `-6' for short) force the use of
260 IPv4 and IPv6 respectively.  Note that IPv6 support has not yet been
261 tested on Windows.
262
263 ** Microsoft's proprietary "NTLM" method of HTTP authentication is now
264 supported.  This authentication method is undocumented and only used
265 by IIS.  Note that *proxy* authentication is not supported in this
266 release; you can only authenticate to the target web site.
267
268 ** Wget no longer truncates partially downloaded files when download
269 has to start over because the server doesn't support Range.  Instead,
270 with such servers Wget now simply ignores the data up to the byte
271 where the last attempt left off, and only then continues appending to
272 the file.  That way the downloaded file never shrinks, and download
273 retries from servers without support for partial downloads work even
274 when downloading to stdout.
275
276 ** SSL/TLS changes:
277
278 *** SSL/TLS downloads now attempt to verify the server's certificate
279 against the recognized certificate authorities.  This requires CA
280 certificates to have been installed in a location visible to the
281 OpenSSL library.  If this is not the case, you can get the bundle
282 yourself from a source you trust (for example, the bundle extracted
283 from Mozilla available at http://curl.haxx.se/docs/caextract.html),
284 and point Wget to the PEM file using the `--ca-certificate'
285 command-line option or the corresponding `.wgetrc' command.
286
287 *** Secure downloads now verify that the host name in the URL matches
288 the "common name" in the certificate presented by the server.
289
290 *** Although the above checks provide more secure downloads, they
291 unavoidably break interoperability with some sites that worked with
292 previous versions, particularly those using self-signed, expired, or
293 otherwise invalid certificates.  If you encounter "certificate
294 verification" errors or complaints that "common name doesn't match
295 requested host name" and are convinced of the site's authenticity, you
296 can use `--no-check-certificate' to bypass both checks.
297
298 *** Talking to SSL/TLS servers over proxies now actually works.
299 Previous versions of Wget erroneously sent GET requests for https
300 URLs.  Wget 1.10 utilizes the CONNECT method designed for this
301 purpose.
302
303 *** The SSL/TLS-related options have been redesigned and, for the
304 first time, documented in the manual.  The old, undocumented, options
305 are no longer supported.
306
307 ** Passive FTP is now the default FTP transfer mode.  Use
308 `--no-passive-ftp' or specify `passive_ftp = off' in your init file to
309 revert to the old behavior.
310
311 ** The `--header' option can now be used to override generated
312 headers.  For example, `wget --header="Host: foo.bar"
313 http://127.0.0.1' tells Wget to connect to localhost, but to specify
314 "foo.bar" in the `Host' header.  In previous versions such use of
315 `--header' lead to duplicate headers in HTTP requests.
316
317 ** The responses without headers, aka "HTTP 0.9" responses, are
318 detected and handled.  Although HTTP 0.9 has long been obsolete, it is
319 still occasionally used, sometimes by accident.
320
321 ** The progress bar is now updated regularly even when the data does
322 not arrive from the network.
323
324 ** Wget no longer preserves permissions of files retrieved by FTP by
325 default.  Anonymous FTP servers frequently use permissions like "664",
326 which might not be what the user wants.  The new option
327 `--preserve-permissions' and the corresponding `.wgetrc' variable can
328 be used to revert to the old behavior.
329
330 ** The new option `--protocol-directories' instructs Wget to also use
331 the protocol name as a directory component of local file names.
332
333 ** Options that previously unconditionally set or unset various flags
334 are now boolean options that can be invoked as either `--OPTION' or
335 `--no-OPTION'.  Options that required an argument "on" or "off" have
336 also been changed this way, but they still accept the old syntax for
337 backward compatibility.  For example, instead of `--glob=off' you can
338 write `--no-glob'.
339
340 Allowing `--no-OPTION' for every `--OPTION' and the other way around
341 is useful because it allows the user to override non-default behavior
342 specified via `.wgetrc'.
343
344 ** The new option `--keep-session-cookies' causes `--save-cookies' to
345 save session cookies (normally only kept in memory) along with the
346 permanent ones.  This is useful because many sites track important
347 information, such as whether the user has authenticated, in session
348 cookies.  With this option multiple Wget runs are treated as a single
349 browser session.
350
351 ** Wget now supports the --ftp-user and --ftp-password command
352 switches to set username and password for FTP, and the --user and
353 --password command switches to set username and password for both FTP
354 and HTTP.  The --http-passwd and --proxy-passwd command switches have
355 been renamed to --http-password and --proxy-password respectively, and
356 the related http_passwd and proxy_passwd .wgetrc commands to
357 http_password and proxy_password respectively.  The login and passwd
358 .wgetrc commands have been deprecated.
359
360 * `wget -b' now works correctly under Windows.
361 \f
362 * Wget 1.9.1 is a bugfix release with no user-visible changes.
363 \f
364 * Changes in Wget 1.9.
365
366 ** It is now possible to specify that POST method be used for HTTP
367 requests.  For example, `wget --post-data="id=foo&data=bar" URL' will
368 send a POST request with the specified contents.
369
370 ** IPv6 support is available, although it's still experimental.
371
372 ** The `--timeout' option now also affects DNS lookup and establishing
373 the TCP connection.  Previously it only affected reading and writing
374 data.  Those three timeouts can be set separately using
375 `--dns-timeout', `--connection-timeout', and `--read-timeout',
376 respectively.
377
378 ** Download speed shown by the progress bar is based on the data
379 recently read, rather than the average speed of the entire download.
380 The ETA projection is still based on the overall average.
381
382 ** It is now possible to connect to FTP servers through FWTK
383 firewalls.  Set ftp_proxy to an FTP URL, and Wget will automatically
384 log on to the proxy as "username@host".
385
386 ** The new option `--retry-connrefused' makes Wget retry downloads
387 even in the face of refused connections, which are otherwise
388 considered a fatal error.
389
390 ** The new option `--no-dns-cache' may be used to prevent Wget from
391 caching DNS lookups.
392
393 ** Wget no longer escapes characters in local file names based on
394 whether they're appropriate in URLs.  Escaping can still occur for
395 nonprintable characters or for '/', but no longer for frequent
396 characters such as space.  You can use the new option
397 --restrict-file-names to relax or strengthen these rules, which can be
398 useful if you dislike the default or if you're downloading to
399 non-native partitions.
400
401 ** Handling of HTML comments has been dumbed down to conform to what
402 users expect and other browsers do: instead of being treated as SGML
403 declaration, a comment is terminated at the first occurrence of "-->".
404 Use `--strict-comments' to revert to the old behavior.
405
406 ** Wget now correctly handles relative URIs that begin with "//", such
407 as "//img.foo.com/foo.jpg".
408
409 ** Boolean options in `.wgetrc' and on the command line now accept
410 values "yes" and "no" along with the traditional "on" and "off".
411
412 ** It is now possible to specify decimal values for timeouts, waiting
413 periods, and download rate.  For instance, `--wait=0.5' now works as
414 expected, as does `--dns-timeout=0.5' and even `--limit-rate=2.5k'.
415 \f
416 * Wget 1.8.2 is a bugfix release with no user-visible changes.
417 \f
418 * Wget 1.8.1 is a bugfix release with no user-visible changes.
419 \f
420 * Changes in Wget 1.8.
421
422 ** A new progress indicator is now available and used by default.
423 You can choose the progress bar type with `--progress=TYPE'.  Two
424 types are available, "bar" (the new default), and "dot" (the old
425 dotted indicator).  You can permanently revert to the old progress
426 indicator by putting `progress = dot' in your `.wgetrc'.
427
428 ** You can limit the download rate of the retrieval using the
429 `--limit-rate' option.  For example, `wget --limit-rate=15k URL' will
430 tell Wget not to download the body of the URL faster than 15 kilobytes
431 per second.
432
433 ** Recursive retrieval and link conversion have been revamped:
434
435 *** Wget now traverses links breadth-first.  This makes the
436 calculation of depth much more reliable than before.  Also, recursive
437 downloads are faster and consume *significantly* less memory than
438 before.
439
440 *** Links are converted only when the entire retrieval is complete.
441 This is the only safe thing to do, as only then is it known what URLs
442 have been downloaded.
443
444 *** BASE tags are handled correctly when converting links.  Since Wget
445 already resolves <base href="..."> when resolving handling URLs, link
446 conversion now makes the BASE tags point to an empty string.
447
448 *** HTML anchors are now handled correctly.  Links to an anchor in the
449 same document (<a href="#anchorname">), which used to confuse Wget,
450 are now converted correctly.
451
452 *** When in page-requisites (-p) mode, no-parent (-np) is ignored when
453 retrieving for inline images, stylesheets, and other documents needed
454 to display the page.
455
456 *** Page-requisites (-p) mode now works with frames.  In other words,
457 `wget -p URL-THAT-USES-FRAMES' will now download the frame HTML files,
458 and all the files that they need to be displayed properly.
459
460 ** `--base' now works conjunction with `--input-file', providing a
461 base for each URL and thereby allowing the URLs in the file to be
462 relative.
463
464 ** If a host has more than one IP address, Wget uses the other
465 addresses when accessing the first one fails.
466
467 ** Host directories now contain port information if the URL is at a
468 non-standard port.
469
470 ** Wget now supports the robots.txt directives specified in
471 <http://www.robotstxt.org/wc/norobots-rfc.txt>.
472
473 ** URL parser has been fixed, especially the infamous overzealous
474 quoting.  Wget no longer dequotes reserved characters, e.g. `%3F' is
475 no longer translated to `?', nor `%2B' to `+'.  Unsafe characters
476 which are not reserved are still escaped, of course.
477
478 ** No more than 20 successive redirections are allowed.
479 \f
480 * Wget 1.7.1 is a bugfix release with no user-visible changes.
481 \f
482 * Changes in Wget 1.7.
483
484 ** SSL (`https') pages now work if you compile Wget with SSL support;
485 use the `--with-ssl' configure flag.  You need to have OpenSSL
486 installed.
487
488 ** Cookies are now supported.  Wget will accept cookies sent by the
489 server and return them in later requests.  Additionally, it can load
490 and save cookies to disk, in the same format that Netscape uses.
491
492 ** "Keep-alive" (persistent) HTTP connections are now supported.
493 Using keep-alive allows Wget to share one TCP/IP connection for
494 many retrievals, making multiple-file downloads faster and less
495 stressing for the server and the network.
496
497 ** Wget now recognizes FTP directory listings generated by NT and VMS
498 servers.
499
500 ** It is now possible to recurse through FTP sites where logging in
501 puts you in some directory other than '/'.
502
503 ** You may now use `~' to mean home directory in `.wgetrc'.  For
504 example, `load_cookies = ~/.netscape/cookies.txt' works as you would
505 expect.
506
507 ** The HTML parser has been rewritten.  The new one works more
508 reliably, allows finer-grained control over which tags and attributes
509 are detected, and has better support for some features like correctly
510 skipping comments and declarations, decoding entities, etc.  It is
511 also more general.
512
513 ** <meta name="robots"> tags are now respected.
514
515 ** Wget's internal tables now use hash tables instead of linked lists
516 where appropriate.  This results in huge speedups when retrieving
517 large sites (thousands of documents).
518
519 ** Wget now has a man page, automatically generated from the Texinfo
520 documentation.  (The last version that shipped with a man page was
521 1.4.5).  To get this, you need to have pod2man from the Perl
522 distribution installed on your system.
523 \f
524 * Changes in Wget 1.6
525
526 ** Administrative changes.
527
528 *** Maintainership.  Due to Hrvoje being plagued with a "real job",
529 Dan Harkless is the most active maintainer (not that he doesn't have a
530 real job as well).  Hrvoje still participates occasionally, and both
531 are being helped by many other people.
532
533 *** Web page.  Thanks to Jan Prikryl, Wget has an "official" web page.
534 Take a look at:
535
536     http://sunsite.dk/wget/
537
538 *** Anonymous CVS.  Thanks to ever-helpful Karsten Thygesen, Wget
539 sources are now available at an anonymous CVS server.  Take a look at
540 the web page for downloading instructions.
541
542 ** New -K / --backup-converted / backup_converted = on option causes files
543 modified due to -k to be saved with a .orig prefix before being changed.  When
544 using -N as well, it is these .orig files that are compared against the server.
545
546 ** New --follow-tags / follow_tags = ... option allows you to restrict
547 Wget to following only certain HTML tags when doing a recursive
548 retrieval.  -G / --ignore-tags / ignore_tags = ... is just the
549 opposite -- all tags but the ones you specify will be followed.
550
551 ** New --waitretry / waitretry = SECONDS option allows waiting between retries
552 of failed downloads.  Wget will use "linear" backoff, waiting 1 second after the
553 first failure, 2 after the second, up to SECONDS.  waitretry is set to 10 by
554 default in the system wgetrc.
555
556 ** New -p / --page-requisites / page_requisites = on option causes
557 Wget to download all ancillary files necessary to display a given HTML
558 page properly (e.g. inlined images).
559
560 ** New -E / --html-extension / html_extension = on option causes Wget
561 to append ".html" to text/html filenames not ending in regexp
562 "\.[Hh][Tt][Mm][Ll]?".
563
564 ** New type of .wgetrc command -- "lockable Boolean".  Can be set to on, off,
565 always, or never.  This allows the .wgetrc to override the commandline.  So far,
566 passive_ftp is the only .wgetrc command which takes a lockable Boolean.
567
568 ** A number of new translation files have been added.
569
570 ** New --bind-address / bind_address = <address> option for people on hosts
571 bound to multiple IP addresses.
572
573 ** wget now accepts (illegal per HTTP spec) relative URLs in HTTP redirects.
574 \f
575 * Wget 1.5.3 is a bugfix release with no user-visible changes.
576 \f
577 * Wget 1.5.2 is a bugfix release with no user-visible changes.
578 \f
579 * Wget 1.5.1 is a bugfix release with no user-visible changes.
580 \f
581 * Changes in Wget 1.5.0
582
583 ** Wget speaks many languages!
584
585 On systems with gettext(), Wget will output messages in the language
586 set by the current locale, if available.  At this time we support
587 Czech, German, Croatian, Italian, Norwegian and Portuguese.
588
589 ** Opie (Skey) is now supported with FTP.
590
591 ** HTTP Digest Access Authentication (RFC2069) is now supported.
592
593 ** The new `-b' option makes Wget go to background automatically.
594
595 ** The `-I' and `-X' options now accept wildcard arguments.
596
597 ** The `-w' option now accepts suffixes `s' for seconds, `m' for
598 minutes, `h' for hours, `d' for days and `w' for weeks.
599
600 ** Upon getting SIGHUP, the whole previous log is now copied to
601 `wget-log'.
602
603 ** Wget now understands proxy settings with explicit usernames and
604 passwords, e.g. `http://user:password@proxy.foo.com/'.
605
606 ** You can use the new `--cut-dirs' option to make Wget create less
607 directories.
608
609 ** The `;type=a' appendix to FTP URLs is now recognized.  For
610 instance, the following command will retrieve the welcoming message in
611 ASCII type transfer:
612
613     wget "ftp://ftp.somewhere.com/welcome.msg;type=a"
614
615 ** `--help' and `--version' options have been redone to to conform to
616 standards set by other GNU utilities.
617
618 ** Wget should now be compilable under MS Windows environment.  MS
619 Visual C++ and Watcom C have been used successfully.
620
621 ** If the file length is known, percentages are displayed during
622 download.
623
624 ** The manual page, now hopelessly out of date, is no longer
625 distributed with Wget.
626 \f
627 * Wget 1.4.5 is a bugfix release with no user-visible changes.
628 \f
629 * Wget 1.4.4 is a bugfix release with no user-visible changes.
630 \f
631 * Changes in Wget 1.4.3
632
633 ** Wget is now a GNU utility.
634
635 ** Can do passive FTP.
636
637 ** Reads .netrc.
638
639 ** Info documentation expanded.
640
641 ** Compiles on pre-ANSI compilers.
642
643 ** Global wgetrc now goes to /usr/local/etc (i.e. $sysconfdir).
644
645 ** Lots of bugfixes.
646 \f
647 * Changes in Wget 1.4.2
648
649 ** New mirror site at ftp://sunsite.auc.dk/pub/infosystems/wget/,
650 thanks to Karsten Thygesen.
651
652 ** Mailing list!  Mail to wget-request@sunsite.auc.dk to subscribe.
653
654 ** New option --delete-after for proxy prefetching.
655
656 ** New option --retr-symlinks to retrieve symbolic links like plain
657 files.
658
659 ** rmold.pl -- script to remove files deleted on the remote server
660
661 ** --convert-links should work now.
662
663 ** Minor bugfixes.
664 \f
665 * Changes in Wget 1.4.1
666
667 ** Minor bugfixes.
668
669 ** Added -I (the opposite of -X).
670
671 ** Dot tracing is now customizable; try wget --dot-style=binary
672 \f
673 * Changes in Wget 1.4.0
674
675 ** Wget 1.4.0 [formerly known as Geturl] is an extensive rewrite of
676 Geturl.  Although many things look suspiciously similar, most of the
677 stuff was rewritten, like recursive retrieval, HTTP, FTP and mostly
678 everything else.  Wget should be now easier to debug, maintain and,
679 most importantly, use.
680
681 ** Recursive HTTP should now work without glitches, even with Location
682 changes, server-generated directory listings and other naughty stuff.
683
684 ** HTTP regetting is supported on servers that support Range
685 specification. WWW authorization is supported -- try
686 wget http://user:password@hostname/
687
688 ** FTP support was rewritten and widely enhanced. Globbing should now
689 work flawlessly. Symbolic links are created locally. All the
690 information the Unix-style ls listing can give is now recognized.
691
692 ** Recursive FTP is supported, e.g.
693     wget -r ftp://gnjilux.cc.fer.hr/pub/unix/util/
694
695 ** You can specify "rejected" directories, to which you do not want to
696 enter, e.g. with wget -X /pub
697
698 ** Time-stamping is supported, with both HTTP and FTP. Try wget -N URL.
699
700 ** A new texinfo reference manual is provided.  It can be read with
701 Emacs, standalone info, or converted to HTML, dvi or postscript.
702
703 ** Fixed a long-standing bug, so that Wget now works over SLIP
704 connections.
705
706 ** You can have a system-wide wgetrc (/usr/local/lib/wgetrc by
707 default). Settings in $HOME/.wgetrc override the global ones, of
708 course :-)
709
710 ** You can set up quota in .wgetrc to prevent sucking too much
711 data. Try `quota = 5M' in .wgetrc (or quota = 100K if you want your
712 sysadmin to like you).
713
714 ** Download rate is printed after retrieval.
715
716 ** Wget now sends the `Referer' header when retrieving
717 recursively.
718
719 ** With the new --no-parent option Wget can retrieve FTP recursively
720 through a proxy server.
721
722 ** HTML parser, as well as the whole of Wget was rewritten to be much
723 faster and less memory-consuming (yes, both).
724
725 ** Absolute links can be converted to relative links locally. Check
726 wget -k.
727
728 ** Wget catches hangup, filtering the output to a log file and
729 resuming work. Try kill -HUP %?wget.
730
731 ** User-defined headers can be sent.  Try
732
733     wget http://fly.cc.her.hr/ --header='Accept-Charset: iso-8859-2'
734
735 ** Acceptance/Rejection lists may contain wildcards.
736
737 ** Wget can display HTTP headers and/or FTP server response with the
738 new `-S' option.  It can save the original HTTP headers with `-s'.
739
740 ** socks library is now supported (thanks to Antonio Rosella
741 <Antonio.Rosella@agip.it>). Configure with --with-socks.
742
743 ** There is a nicer display of REST-ed output.
744
745 ** Many new options (like -x to force directory hierarchy, or -m to
746 turn on mirroring options).
747
748 ** Wget is now distributed under GNU General Public License (GPL).
749
750 ** Lots of small features I can't remember. :-)
751
752 ** A host of bugfixes.
753 \f
754 * Changes in Geturl 1.3
755
756 ** Added FTP globbing support (ftp://fly.cc.fer.hr/*)
757
758 ** Added support for no_proxy
759
760 ** Added support for ftp://user:password@host/
761
762 ** Added support for %xx in URL syntax
763
764 ** More natural command-line options
765
766 ** Added -e switch to execute .geturlrc commands from the command-line
767
768 ** Added support for robots.txt
769
770 ** Fixed some minor bugs
771 \f
772 * Geturl 1.2 is a bugfix release with no user-visible changes.
773 \f
774 * Changes in Geturl 1.1
775
776 ** REST supported in FTP
777
778 ** Proxy servers supported
779
780 ** GNU getopt used, which enables command-line arguments to be ordered
781 as you wish, e.g.  geturl http://fly.cc.fer.hr/ -vo log is the same as
782 geturl -vo log http://fly.cc.fer.hr/
783
784 ** Netscape-compatible URL syntax for HTTP supported: host[:port]/dir/file
785
786 ** NcFTP-compatible colon URL syntax for FTP supported: host:/dir/file
787
788 ** <base href="xxx"> supported
789
790 ** autoconf supported
791 \f
792 ----------------------------------------------------------------------
793 Copyright information:
794
795 Copyright (C) 1997-2005 Free Software Foundation, Inc.
796
797    Permission is granted to anyone to make or distribute verbatim
798    copies of this document as received, in any medium, provided that
799    the copyright notice and this permission notice are preserved, thus
800    giving the recipient permission to redistribute in turn.
801
802    Permission is granted to distribute modified versions of this
803    document, or of portions of it, under the above conditions,
804    provided also that they carry prominent notices stating who last
805    changed them.