]> sjero.net Git - wget/blob - NEWS
Implement --config.
[wget] / NEWS
1 GNU Wget NEWS -- history of user-visible changes.
2
3 Copyright (C) 1997, 1998, 1999, 2000, 2001, 2002, 2003, 2004, 2005,
4 2006, 2007, 2008, 2009, 2010 Free Software Foundation, Inc.
5 See the end for copying conditions.
6
7 Please send GNU Wget bug reports to <bug-wget@gnu.org>.
8 \f
9 * Changes in Wget X.Y.Z
10
11 ** Support HTTP/1.1
12
13 ** Fix some portability issues.
14
15 ** Handle properly malformed status line in a HTTP response.
16
17 ** Ignore zero length domains in $no_proxy.
18
19 ** Set new cookies after an authorization failure.
20
21 ** Exit with failure if -k is specified and -O is not a regular file.
22
23 ** Cope better with unclosed html tags.
24
25 ** Print diagnostic messages to stderr, not stdout.
26
27 ** Do not use an additional HEAD request when --content-disposition is used,
28    but use directly GET.
29
30 ** Report the average transfer speed correctly when multiple URL's are specified
31    and -c influences the transferred data amount.
32
33 ** GNU TLS backend works again.
34
35 ** Now --timestamping and --continue works well together.
36
37 ** By default, on server redirects, use the original URL to get the
38    local file name. Close CVE-2010-2252.  This introduces a
39    backward-incompatibility; any script that relies on the old
40    behaviour must use --trust-server-names.
41
42 ** Fix a problem when -k is used and some URLs are specified trough
43    CSS.
44
45 ** Convert correctly URLs that need to be encoded to local files when following
46    links.
47
48 ** Use persistent connections with proxies supporting them.
49
50 ** Print the total download time as part of the summary for recursive downloads.
51
52 ** Now it is possible to specify a different startup configuration file trough
53    the --config option.
54 \f
55 * Changes in Wget 1.12
56
57 ** Mailing list MOVED to bug-wget@gnu.org
58
59 ** SECURITY FIX: It had been possible to trick Wget into accepting
60 SSL certificates that don't match the host name, through the trick of
61 embedding NUL characters into the certs' common name. Fixed by Joao
62 Ferreira <joao@joaoff.com>.
63
64 ** Added support for CSS. This includes:
65      - Parsing links from CSS files, and from CSS content found in HTML
66        style tags and attributes.
67      - Supporting conversion of links found within CSS content, when
68        --convert-links is specified.
69      - Ensuring that CSS files end in the ".css" filename extension,
70        when --convert-links is specified.
71
72    CSS support in Wget is thanks to Ted Mielczarek
73    <ted.mielczarek@gmail.com>.
74
75 ** Added support for Internationalized Resource Identifiers (IRIs, RFC
76 3987). When support is enabled (requires libidn and libiconv), links
77 with non-ASCII bytes are translated from their source encoding to UTF-8
78 before percent-encoding.  IRI support was added by Saint Xavier
79 <wget@sxav.eu>, as his project for the Google Summer of Code.
80
81 ** Wget now provides more sensible exit status codes when downloads
82 don't proceed as expected (see the manual).
83
84 ** --default-page option (and associated wgetrc command) added to
85 support alternative default names for index.html.
86
87 ** --ask-password option (and associated wgetrc command) added to
88 support password prompts at the console.
89
90 ** The --input-file option now also handles retrieving links from
91 an external file.
92
93 ** The output generated by the --version option now includes
94 information on how it was built, and the set of configure-time options
95 that were selected.
96
97 ** --html-extension has been renamed to --adjust-extension, to reflect
98 the fact that it now also applies to CSS content. --html-extension is
99 still acceptable, but is now deprecated.
100
101 ** An "ascii" specifier is now accepted by --restrict-file-names, which
102 forces the percent-encoding of all non-ASCII bytes
103
104 ** Several previously existing, but undocumented .wgetrc options are
105 now documented: save_headers, spider, and user_agent,
106 auth_no_challenge, and keep_session_cookies. Also added documentation
107 for the "lowercase" and "uppercase" values for --restrict-file-names, which had been present since Wget 1.11.
108 \f
109 * Changes in Wget 1.11.4
110
111 ** Fixed an issue (apparently a regression) where -O would refuse to
112 download when -nc was given, even though the file didn't exist.
113
114 ** Fixed a situation where Wget could abort with --continue if the
115 remote server gives a content-length of zero when the file exists
116 locally with content.
117
118 ** Fixed a crash on some systems, due to Wget casting a pointer-to-long
119 to a pointer-to-time_t.
120
121 ** Translation updates for Catalan.
122 \f
123 * Changes in Wget 1.11.3
124
125 ** Downgraded -N with -O to a warning, rather than an error.
126
127 ** Translation updates
128 \f
129 * Changes in Wget 1.11.2
130
131 ** Fixed a problem in authenticating over HTTPS through a proxy.
132 (Regression in 1.11 over 1.10.2.)
133
134 ** The combination of -r or -p with -O, which was disallowed in 1.11,
135 has been downgraded to a warning in 1.11.2. (-O and -N, which was never
136 meaningful, is still an error.)
137
138 ** Further improvements to progress bar displays in non-English locales
139 (too many spaces could be inserted, causing the display to scroll).
140
141 ** Successive invocations of Wget on FTP URLS, with --no-remove-listing
142 and --continue, was causing Wget to append, rather than replace,
143 information in the .listing file, and thereby download the same files
144 multiple times. This has been fixed in 1.11.2.
145
146 ** Wget 1.11 no longer allowed ".." to persist at the beginning of URLs,
147 for improved conformance with RFC 3986. However, this behavior presents
148 problems for some FTP setups, and so they are now preserved again, for
149 FTP URLs only.
150 \f
151 * Changes in Wget 1.11.1.
152
153 ** Interrupted downloads no longer result in renaming the file
154 (regression in 1.11 over 1.10.2).
155
156 ** Progress bar now displays correctly in non-English locales (and a
157 related assertion failure was fixed).
158
159 ** Wget no longer issues a GET request over HTTP for files it should
160 know it's not going to download (regression in 1.11 over 1.10.2).
161
162 ** Added option --auth-no-challenge, to support broken pre-1.11
163 authentication-before-server-challenge, which turns out to still be
164 useful for some limited cases.
165
166 ** Documentation of accept/reject lists in the manual's "Types of
167 Files" section now explains various aspects of their behavior that may
168 be surprising, and notes that they may change in the future.
169
170 ** Documentation of --no-parents now explains how a trailing slash, or
171 lack thereof, in the specified URL, will affect behavior.
172 \f
173 * Changes in Wget 1.11.
174
175 ** Timestamping now uses the value from the most recent HTTP response,
176 rather than the first one it got.
177
178 ** Authentication information is no longer sent as part of the Referer
179 header in recursive fetches.
180
181 ** No authentication credentials are sent until a challenge is issued,
182 for improved security. Authentication handling is still not
183 RFC-compliant, as once a Basic challenge has been received, it will
184 assume it can send credentials to any URL at that same host, and not
185 just the ones at or below the original authenticated location.
186 Credentials for Digest authentication are still never saved or issued
187 automatically, and continue to require a challenge for each resource.
188
189 ** Added --max-redirect option, allowing the user to specify what should
190 be the maximum number of HTTP redirects to follow.
191
192 ** Wget now supports saving HTTP downloads using file names specified by
193 the `Content-Disposition' header.  This is a standard way of specifying
194 the file name used by many web dynamically generated pages. However, the
195 current implementation is inefficient, and known to have bugs. It is
196 EXPERIMENTAL only, and not enabled by default. Use --content-disposition
197 to enable it.
198
199 ** The new option `--ignore-case' makes Wget ignore case when
200 matching files, directories, and wildcards.  This affects the -X, -I,
201 -A, and -R options, as well as globbing in FTP URLs.
202
203 ** ETA projection is now displayed in "dot" progress output as well as
204 in the default progress bar.  (The dot progress is used by default when
205 logging Wget's output to file using the `-o' option.)
206
207 ** The "lockable boolean" argument type is no longer supported.  It
208 was only used by the passive_ftp .wgetrc setting.  If you're running
209 broken scripts or Perl modules that unconditionally specify
210 `--passive-ftp' and your firewall disallows it, you can override them
211 by replacing wget with a script that execs wget "$@" --no-passive-ftp.
212
213 ** The source code has been migrated to Mercurial. The repositories are
214 available at http://hg.addictivecode.org/. Prior to this, the source
215 code was hosted on Subversion (migrated from the original CVS); you can
216 still get access to older tags and branches for Wget in the Subversion
217 repository at http://addictivecode.org/svn/wget/.
218 \f
219 * Changes in Wget 1.10.
220
221 ** Downloading files larger than 2GB, sometimes referred to as "large
222 files", now works on systems that support them.  This includes the
223 majority of modern Unixes, as well as MS Windows.
224
225 ** IPv6 is now supported by Wget.  Unlike the experimental code in
226 1.9, this version supports dual-family systems.  The new flags
227 `--inet4' and `--inet6' (or `-4' and `-6' for short) force the use of
228 IPv4 and IPv6 respectively.  Note that IPv6 support has not yet been
229 tested on Windows.
230
231 ** Microsoft's proprietary "NTLM" method of HTTP authentication is now
232 supported.  This authentication method is undocumented and only used
233 by IIS.  Note that *proxy* authentication is not supported in this
234 release; you can only authenticate to the target web site.
235
236 ** Wget no longer truncates partially downloaded files when download
237 has to start over because the server doesn't support Range.  Instead,
238 with such servers Wget now simply ignores the data up to the byte
239 where the last attempt left off, and only then continues appending to
240 the file.  That way the downloaded file never shrinks, and download
241 retries from servers without support for partial downloads work even
242 when downloading to stdout.
243
244 ** SSL/TLS changes:
245
246 *** SSL/TLS downloads now attempt to verify the server's certificate
247 against the recognized certificate authorities.  This requires CA
248 certificates to have been installed in a location visible to the
249 OpenSSL library.  If this is not the case, you can get the bundle
250 yourself from a source you trust (for example, the bundle extracted
251 from Mozilla available at http://curl.haxx.se/docs/caextract.html),
252 and point Wget to the PEM file using the `--ca-certificate'
253 command-line option or the corresponding `.wgetrc' command.
254
255 *** Secure downloads now verify that the host name in the URL matches
256 the "common name" in the certificate presented by the server.
257
258 *** Although the above checks provide more secure downloads, they
259 unavoidably break interoperability with some sites that worked with
260 previous versions, particularly those using self-signed, expired, or
261 otherwise invalid certificates.  If you encounter "certificate
262 verification" errors or complaints that "common name doesn't match
263 requested host name" and are convinced of the site's authenticity, you
264 can use `--no-check-certificate' to bypass both checks.
265
266 *** Talking to SSL/TLS servers over proxies now actually works.
267 Previous versions of Wget erroneously sent GET requests for https
268 URLs.  Wget 1.10 utilizes the CONNECT method designed for this
269 purpose.
270
271 *** The SSL/TLS-related options have been redesigned and, for the
272 first time, documented in the manual.  The old, undocumented, options
273 are no longer supported.
274
275 ** Passive FTP is now the default FTP transfer mode.  Use
276 `--no-passive-ftp' or specify `passive_ftp = off' in your init file to
277 revert to the old behavior.
278
279 ** The `--header' option can now be used to override generated
280 headers.  For example, `wget --header="Host: foo.bar"
281 http://127.0.0.1' tells Wget to connect to localhost, but to specify
282 "foo.bar" in the `Host' header.  In previous versions such use of
283 `--header' lead to duplicate headers in HTTP requests.
284
285 ** The responses without headers, aka "HTTP 0.9" responses, are
286 detected and handled.  Although HTTP 0.9 has long been obsolete, it is
287 still occasionally used, sometimes by accident.
288
289 ** The progress bar is now updated regularly even when the data does
290 not arrive from the network.
291
292 ** Wget no longer preserves permissions of files retrieved by FTP by
293 default.  Anonymous FTP servers frequently use permissions like "664",
294 which might not be what the user wants.  The new option
295 `--preserve-permissions' and the corresponding `.wgetrc' variable can
296 be used to revert to the old behavior.
297
298 ** The new option `--protocol-directories' instructs Wget to also use
299 the protocol name as a directory component of local file names.
300
301 ** Options that previously unconditionally set or unset various flags
302 are now boolean options that can be invoked as either `--OPTION' or
303 `--no-OPTION'.  Options that required an argument "on" or "off" have
304 also been changed this way, but they still accept the old syntax for
305 backward compatibility.  For example, instead of `--glob=off' you can
306 write `--no-glob'.
307
308 Allowing `--no-OPTION' for every `--OPTION' and the other way around
309 is useful because it allows the user to override non-default behavior
310 specified via `.wgetrc'.
311
312 ** The new option `--keep-session-cookies' causes `--save-cookies' to
313 save session cookies (normally only kept in memory) along with the
314 permanent ones.  This is useful because many sites track important
315 information, such as whether the user has authenticated, in session
316 cookies.  With this option multiple Wget runs are treated as a single
317 browser session.
318
319 ** Wget now supports the --ftp-user and --ftp-password command
320 switches to set username and password for FTP, and the --user and
321 --password command switches to set username and password for both FTP
322 and HTTP.  The --http-passwd and --proxy-passwd command switches have
323 been renamed to --http-password and --proxy-password respectively, and
324 the related http_passwd and proxy_passwd .wgetrc commands to
325 http_password and proxy_password respectively.  The login and passwd
326 .wgetrc commands have been deprecated.
327
328 * `wget -b' now works correctly under Windows.
329 \f
330 * Wget 1.9.1 is a bugfix release with no user-visible changes.
331 \f
332 * Changes in Wget 1.9.
333
334 ** It is now possible to specify that POST method be used for HTTP
335 requests.  For example, `wget --post-data="id=foo&data=bar" URL' will
336 send a POST request with the specified contents.
337
338 ** IPv6 support is available, although it's still experimental.
339
340 ** The `--timeout' option now also affects DNS lookup and establishing
341 the TCP connection.  Previously it only affected reading and writing
342 data.  Those three timeouts can be set separately using
343 `--dns-timeout', `--connection-timeout', and `--read-timeout',
344 respectively.
345
346 ** Download speed shown by the progress bar is based on the data
347 recently read, rather than the average speed of the entire download.
348 The ETA projection is still based on the overall average.
349
350 ** It is now possible to connect to FTP servers through FWTK
351 firewalls.  Set ftp_proxy to an FTP URL, and Wget will automatically
352 log on to the proxy as "username@host".
353
354 ** The new option `--retry-connrefused' makes Wget retry downloads
355 even in the face of refused connections, which are otherwise
356 considered a fatal error.
357
358 ** The new option `--no-dns-cache' may be used to prevent Wget from
359 caching DNS lookups.
360
361 ** Wget no longer escapes characters in local file names based on
362 whether they're appropriate in URLs.  Escaping can still occur for
363 nonprintable characters or for '/', but no longer for frequent
364 characters such as space.  You can use the new option
365 --restrict-file-names to relax or strengthen these rules, which can be
366 useful if you dislike the default or if you're downloading to
367 non-native partitions.
368
369 ** Handling of HTML comments has been dumbed down to conform to what
370 users expect and other browsers do: instead of being treated as SGML
371 declaration, a comment is terminated at the first occurrence of "-->".
372 Use `--strict-comments' to revert to the old behavior.
373
374 ** Wget now correctly handles relative URIs that begin with "//", such
375 as "//img.foo.com/foo.jpg".
376
377 ** Boolean options in `.wgetrc' and on the command line now accept
378 values "yes" and "no" along with the traditional "on" and "off".
379
380 ** It is now possible to specify decimal values for timeouts, waiting
381 periods, and download rate.  For instance, `--wait=0.5' now works as
382 expected, as does `--dns-timeout=0.5' and even `--limit-rate=2.5k'.
383 \f
384 * Wget 1.8.2 is a bugfix release with no user-visible changes.
385 \f
386 * Wget 1.8.1 is a bugfix release with no user-visible changes.
387 \f
388 * Changes in Wget 1.8.
389
390 ** A new progress indicator is now available and used by default.
391 You can choose the progress bar type with `--progress=TYPE'.  Two
392 types are available, "bar" (the new default), and "dot" (the old
393 dotted indicator).  You can permanently revert to the old progress
394 indicator by putting `progress = dot' in your `.wgetrc'.
395
396 ** You can limit the download rate of the retrieval using the
397 `--limit-rate' option.  For example, `wget --limit-rate=15k URL' will
398 tell Wget not to download the body of the URL faster than 15 kilobytes
399 per second.
400
401 ** Recursive retrieval and link conversion have been revamped:
402
403 *** Wget now traverses links breadth-first.  This makes the
404 calculation of depth much more reliable than before.  Also, recursive
405 downloads are faster and consume *significantly* less memory than
406 before.
407
408 *** Links are converted only when the entire retrieval is complete.
409 This is the only safe thing to do, as only then is it known what URLs
410 have been downloaded.
411
412 *** BASE tags are handled correctly when converting links.  Since Wget
413 already resolves <base href="..."> when resolving handling URLs, link
414 conversion now makes the BASE tags point to an empty string.
415
416 *** HTML anchors are now handled correctly.  Links to an anchor in the
417 same document (<a href="#anchorname">), which used to confuse Wget,
418 are now converted correctly.
419
420 *** When in page-requisites (-p) mode, no-parent (-np) is ignored when
421 retrieving for inline images, stylesheets, and other documents needed
422 to display the page.
423
424 *** Page-requisites (-p) mode now works with frames.  In other words,
425 `wget -p URL-THAT-USES-FRAMES' will now download the frame HTML files,
426 and all the files that they need to be displayed properly.
427
428 ** `--base' now works conjunction with `--input-file', providing a
429 base for each URL and thereby allowing the URLs in the file to be
430 relative.
431
432 ** If a host has more than one IP address, Wget uses the other
433 addresses when accessing the first one fails.
434
435 ** Host directories now contain port information if the URL is at a
436 non-standard port.
437
438 ** Wget now supports the robots.txt directives specified in
439 <http://www.robotstxt.org/wc/norobots-rfc.txt>.
440
441 ** URL parser has been fixed, especially the infamous overzealous
442 quoting.  Wget no longer dequotes reserved characters, e.g. `%3F' is
443 no longer translated to `?', nor `%2B' to `+'.  Unsafe characters
444 which are not reserved are still escaped, of course.
445
446 ** No more than 20 successive redirections are allowed.
447 \f
448 * Wget 1.7.1 is a bugfix release with no user-visible changes.
449 \f
450 * Changes in Wget 1.7.
451
452 ** SSL (`https') pages now work if you compile Wget with SSL support;
453 use the `--with-ssl' configure flag.  You need to have OpenSSL
454 installed.
455
456 ** Cookies are now supported.  Wget will accept cookies sent by the
457 server and return them in later requests.  Additionally, it can load
458 and save cookies to disk, in the same format that Netscape uses.
459
460 ** "Keep-alive" (persistent) HTTP connections are now supported.
461 Using keep-alive allows Wget to share one TCP/IP connection for
462 many retrievals, making multiple-file downloads faster and less
463 stressing for the server and the network.
464
465 ** Wget now recognizes FTP directory listings generated by NT and VMS
466 servers.
467
468 ** It is now possible to recurse through FTP sites where logging in
469 puts you in some directory other than '/'.
470
471 ** You may now use `~' to mean home directory in `.wgetrc'.  For
472 example, `load_cookies = ~/.netscape/cookies.txt' works as you would
473 expect.
474
475 ** The HTML parser has been rewritten.  The new one works more
476 reliably, allows finer-grained control over which tags and attributes
477 are detected, and has better support for some features like correctly
478 skipping comments and declarations, decoding entities, etc.  It is
479 also more general.
480
481 ** <meta name="robots"> tags are now respected.
482
483 ** Wget's internal tables now use hash tables instead of linked lists
484 where appropriate.  This results in huge speedups when retrieving
485 large sites (thousands of documents).
486
487 ** Wget now has a man page, automatically generated from the Texinfo
488 documentation.  (The last version that shipped with a man page was
489 1.4.5).  To get this, you need to have pod2man from the Perl
490 distribution installed on your system.
491 \f
492 * Changes in Wget 1.6
493
494 ** Administrative changes.
495
496 *** Maintainership.  Due to Hrvoje being plagued with a "real job",
497 Dan Harkless is the most active maintainer (not that he doesn't have a
498 real job as well).  Hrvoje still participates occasionally, and both
499 are being helped by many other people.
500
501 *** Web page.  Thanks to Jan Prikryl, Wget has an "official" web page.
502 Take a look at:
503
504     http://sunsite.dk/wget/
505
506 *** Anonymous CVS.  Thanks to ever-helpful Karsten Thygesen, Wget
507 sources are now available at an anonymous CVS server.  Take a look at
508 the web page for downloading instructions.
509
510 ** New -K / --backup-converted / backup_converted = on option causes files
511 modified due to -k to be saved with a .orig prefix before being changed.  When
512 using -N as well, it is these .orig files that are compared against the server.
513
514 ** New --follow-tags / follow_tags = ... option allows you to restrict
515 Wget to following only certain HTML tags when doing a recursive
516 retrieval.  -G / --ignore-tags / ignore_tags = ... is just the
517 opposite -- all tags but the ones you specify will be followed.
518
519 ** New --waitretry / waitretry = SECONDS option allows waiting between retries
520 of failed downloads.  Wget will use "linear" backoff, waiting 1 second after the
521 first failure, 2 after the second, up to SECONDS.  waitretry is set to 10 by
522 default in the system wgetrc.
523
524 ** New -p / --page-requisites / page_requisites = on option causes
525 Wget to download all ancillary files necessary to display a given HTML
526 page properly (e.g. inlined images).
527
528 ** New -E / --html-extension / html_extension = on option causes Wget
529 to append ".html" to text/html filenames not ending in regexp
530 "\.[Hh][Tt][Mm][Ll]?".
531
532 ** New type of .wgetrc command -- "lockable Boolean".  Can be set to on, off,
533 always, or never.  This allows the .wgetrc to override the commandline.  So far,
534 passive_ftp is the only .wgetrc command which takes a lockable Boolean.
535
536 ** A number of new translation files have been added.
537
538 ** New --bind-address / bind_address = <address> option for people on hosts
539 bound to multiple IP addresses.
540
541 ** wget now accepts (illegal per HTTP spec) relative URLs in HTTP redirects.
542 \f
543 * Wget 1.5.3 is a bugfix release with no user-visible changes.
544 \f
545 * Wget 1.5.2 is a bugfix release with no user-visible changes.
546 \f
547 * Wget 1.5.1 is a bugfix release with no user-visible changes.
548 \f
549 * Changes in Wget 1.5.0
550
551 ** Wget speaks many languages!
552
553 On systems with gettext(), Wget will output messages in the language
554 set by the current locale, if available.  At this time we support
555 Czech, German, Croatian, Italian, Norwegian and Portuguese.
556
557 ** Opie (Skey) is now supported with FTP.
558
559 ** HTTP Digest Access Authentication (RFC2069) is now supported.
560
561 ** The new `-b' option makes Wget go to background automatically.
562
563 ** The `-I' and `-X' options now accept wildcard arguments.
564
565 ** The `-w' option now accepts suffixes `s' for seconds, `m' for
566 minutes, `h' for hours, `d' for days and `w' for weeks.
567
568 ** Upon getting SIGHUP, the whole previous log is now copied to
569 `wget-log'.
570
571 ** Wget now understands proxy settings with explicit usernames and
572 passwords, e.g. `http://user:password@proxy.foo.com/'.
573
574 ** You can use the new `--cut-dirs' option to make Wget create less
575 directories.
576
577 ** The `;type=a' appendix to FTP URLs is now recognized.  For
578 instance, the following command will retrieve the welcoming message in
579 ASCII type transfer:
580
581     wget "ftp://ftp.somewhere.com/welcome.msg;type=a"
582
583 ** `--help' and `--version' options have been redone to to conform to
584 standards set by other GNU utilities.
585
586 ** Wget should now be compilable under MS Windows environment.  MS
587 Visual C++ and Watcom C have been used successfully.
588
589 ** If the file length is known, percentages are displayed during
590 download.
591
592 ** The manual page, now hopelessly out of date, is no longer
593 distributed with Wget.
594 \f
595 * Wget 1.4.5 is a bugfix release with no user-visible changes.
596 \f
597 * Wget 1.4.4 is a bugfix release with no user-visible changes.
598 \f
599 * Changes in Wget 1.4.3
600
601 ** Wget is now a GNU utility.
602
603 ** Can do passive FTP.
604
605 ** Reads .netrc.
606
607 ** Info documentation expanded.
608
609 ** Compiles on pre-ANSI compilers.
610
611 ** Global wgetrc now goes to /usr/local/etc (i.e. $sysconfdir).
612
613 ** Lots of bugfixes.
614 \f
615 * Changes in Wget 1.4.2
616
617 ** New mirror site at ftp://sunsite.auc.dk/pub/infosystems/wget/,
618 thanks to Karsten Thygesen.
619
620 ** Mailing list!  Mail to wget-request@sunsite.auc.dk to subscribe.
621
622 ** New option --delete-after for proxy prefetching.
623
624 ** New option --retr-symlinks to retrieve symbolic links like plain
625 files.
626
627 ** rmold.pl -- script to remove files deleted on the remote server
628
629 ** --convert-links should work now.
630
631 ** Minor bugfixes.
632 \f
633 * Changes in Wget 1.4.1
634
635 ** Minor bugfixes.
636
637 ** Added -I (the opposite of -X).
638
639 ** Dot tracing is now customizable; try wget --dot-style=binary
640 \f
641 * Changes in Wget 1.4.0
642
643 ** Wget 1.4.0 [formerly known as Geturl] is an extensive rewrite of
644 Geturl.  Although many things look suspiciously similar, most of the
645 stuff was rewritten, like recursive retrieval, HTTP, FTP and mostly
646 everything else.  Wget should be now easier to debug, maintain and,
647 most importantly, use.
648
649 ** Recursive HTTP should now work without glitches, even with Location
650 changes, server-generated directory listings and other naughty stuff.
651
652 ** HTTP regetting is supported on servers that support Range
653 specification. WWW authorization is supported -- try
654 wget http://user:password@hostname/
655
656 ** FTP support was rewritten and widely enhanced. Globbing should now
657 work flawlessly. Symbolic links are created locally. All the
658 information the Unix-style ls listing can give is now recognized.
659
660 ** Recursive FTP is supported, e.g.
661     wget -r ftp://gnjilux.cc.fer.hr/pub/unix/util/
662
663 ** You can specify "rejected" directories, to which you do not want to
664 enter, e.g. with wget -X /pub
665
666 ** Time-stamping is supported, with both HTTP and FTP. Try wget -N URL.
667
668 ** A new texinfo reference manual is provided.  It can be read with
669 Emacs, standalone info, or converted to HTML, dvi or postscript.
670
671 ** Fixed a long-standing bug, so that Wget now works over SLIP
672 connections.
673
674 ** You can have a system-wide wgetrc (/usr/local/lib/wgetrc by
675 default). Settings in $HOME/.wgetrc override the global ones, of
676 course :-)
677
678 ** You can set up quota in .wgetrc to prevent sucking too much
679 data. Try `quota = 5M' in .wgetrc (or quota = 100K if you want your
680 sysadmin to like you).
681
682 ** Download rate is printed after retrieval.
683
684 ** Wget now sends the `Referer' header when retrieving
685 recursively.
686
687 ** With the new --no-parent option Wget can retrieve FTP recursively
688 through a proxy server.
689
690 ** HTML parser, as well as the whole of Wget was rewritten to be much
691 faster and less memory-consuming (yes, both).
692
693 ** Absolute links can be converted to relative links locally. Check
694 wget -k.
695
696 ** Wget catches hangup, filtering the output to a log file and
697 resuming work. Try kill -HUP %?wget.
698
699 ** User-defined headers can be sent.  Try
700
701     wget http://fly.cc.her.hr/ --header='Accept-Charset: iso-8859-2'
702
703 ** Acceptance/Rejection lists may contain wildcards.
704
705 ** Wget can display HTTP headers and/or FTP server response with the
706 new `-S' option.  It can save the original HTTP headers with `-s'.
707
708 ** socks library is now supported (thanks to Antonio Rosella
709 <Antonio.Rosella@agip.it>). Configure with --with-socks.
710
711 ** There is a nicer display of REST-ed output.
712
713 ** Many new options (like -x to force directory hierarchy, or -m to
714 turn on mirroring options).
715
716 ** Wget is now distributed under GNU General Public License (GPL).
717
718 ** Lots of small features I can't remember. :-)
719
720 ** A host of bugfixes.
721 \f
722 * Changes in Geturl 1.3
723
724 ** Added FTP globbing support (ftp://fly.cc.fer.hr/*)
725
726 ** Added support for no_proxy
727
728 ** Added support for ftp://user:password@host/
729
730 ** Added support for %xx in URL syntax
731
732 ** More natural command-line options
733
734 ** Added -e switch to execute .geturlrc commands from the command-line
735
736 ** Added support for robots.txt
737
738 ** Fixed some minor bugs
739 \f
740 * Geturl 1.2 is a bugfix release with no user-visible changes.
741 \f
742 * Changes in Geturl 1.1
743
744 ** REST supported in FTP
745
746 ** Proxy servers supported
747
748 ** GNU getopt used, which enables command-line arguments to be ordered
749 as you wish, e.g.  geturl http://fly.cc.fer.hr/ -vo log is the same as
750 geturl -vo log http://fly.cc.fer.hr/
751
752 ** Netscape-compatible URL syntax for HTTP supported: host[:port]/dir/file
753
754 ** NcFTP-compatible colon URL syntax for FTP supported: host:/dir/file
755
756 ** <base href="xxx"> supported
757
758 ** autoconf supported
759 \f
760 ----------------------------------------------------------------------
761 Copyright information:
762
763 Copyright (C) 1997-2005 Free Software Foundation, Inc.
764
765    Permission is granted to anyone to make or distribute verbatim
766    copies of this document as received, in any medium, provided that
767    the copyright notice and this permission notice are preserved, thus
768    giving the recipient permission to redistribute in turn.
769
770    Permission is granted to distribute modified versions of this
771    document, or of portions of it, under the above conditions,
772    provided also that they carry prominent notices stating who last
773    changed them.