]> sjero.net Git - wget/blob - NEWS
Accept always the file if it is the specified output destination.
[wget] / NEWS
1 GNU Wget NEWS -- history of user-visible changes.
2
3 Copyright (C) 1997, 1998, 1999, 2000, 2001, 2002, 2003, 2004, 2005,
4 2006, 2007, 2008, 2009, 2010, 2011 Free Software Foundation, Inc.
5 See the end for copying conditions.
6
7 Please send GNU Wget bug reports to <bug-wget@gnu.org>.
8 \f
9 * Changes in Wget X.Y.Z
10
11 ** Support HTTP/1.1
12
13 ** Fix some portability issues.
14
15 ** Handle properly malformed status line in a HTTP response.
16
17 ** Ignore zero length domains in $no_proxy.
18
19 ** Set new cookies after an authorization failure.
20
21 ** Exit with failure if -k is specified and -O is not a regular file.
22
23 ** Cope better with unclosed html tags.
24
25 ** Print diagnostic messages to stderr, not stdout.
26
27 ** Do not use an additional HEAD request when --content-disposition is used,
28    but use directly GET.
29
30 ** Report the average transfer speed correctly when multiple URL's are specified
31    and -c influences the transferred data amount.
32
33 ** GNU TLS backend works again.
34
35 ** Now --timestamping and --continue works well together.
36
37 ** By default, on server redirects, use the original URL to get the
38    local file name. Close CVE-2010-2252.  This introduces a
39    backward-incompatibility; any script that relies on the old
40    behaviour must use --trust-server-names.
41
42 ** Fix a problem when -k is used and some URLs are specified trough
43    CSS.
44
45 ** Convert correctly URLs that need to be encoded to local files when following
46    links.
47
48 ** Use persistent connections with proxies supporting them.
49
50 ** Print the total download time as part of the summary for recursive downloads.
51
52 ** Now it is possible to specify a different startup configuration file trough
53    the --config option.
54
55 ** Fix an infinite loop with the error '<filename> has sprung into existence'
56    on a network error and -nc is used.
57
58 ** Now --adjust-extension does not modify the file extension if the file ends
59    in .htm.
60
61 ** Support HTTP/1.1 307 redirects keep request method.
62
63 ** Now --no-parent doesn't fetch undesired files if HTTP and HTTPS are used
64    by the same host on different pages.
65
66 ** Do not attempt to remove the file if it is not in the accept rules but
67    it is the output destination file.
68 \f
69 * Changes in Wget 1.12
70
71 ** Mailing list MOVED to bug-wget@gnu.org
72
73 ** SECURITY FIX: It had been possible to trick Wget into accepting
74 SSL certificates that don't match the host name, through the trick of
75 embedding NUL characters into the certs' common name. Fixed by Joao
76 Ferreira <joao@joaoff.com>.
77
78 ** Added support for CSS. This includes:
79      - Parsing links from CSS files, and from CSS content found in HTML
80        style tags and attributes.
81      - Supporting conversion of links found within CSS content, when
82        --convert-links is specified.
83      - Ensuring that CSS files end in the ".css" filename extension,
84        when --convert-links is specified.
85
86    CSS support in Wget is thanks to Ted Mielczarek
87    <ted.mielczarek@gmail.com>.
88
89 ** Added support for Internationalized Resource Identifiers (IRIs, RFC
90 3987). When support is enabled (requires libidn and libiconv), links
91 with non-ASCII bytes are translated from their source encoding to UTF-8
92 before percent-encoding.  IRI support was added by Saint Xavier
93 <wget@sxav.eu>, as his project for the Google Summer of Code.
94
95 ** Wget now provides more sensible exit status codes when downloads
96 don't proceed as expected (see the manual).
97
98 ** --default-page option (and associated wgetrc command) added to
99 support alternative default names for index.html.
100
101 ** --ask-password option (and associated wgetrc command) added to
102 support password prompts at the console.
103
104 ** The --input-file option now also handles retrieving links from
105 an external file.
106
107 ** The output generated by the --version option now includes
108 information on how it was built, and the set of configure-time options
109 that were selected.
110
111 ** --html-extension has been renamed to --adjust-extension, to reflect
112 the fact that it now also applies to CSS content. --html-extension is
113 still acceptable, but is now deprecated.
114
115 ** An "ascii" specifier is now accepted by --restrict-file-names, which
116 forces the percent-encoding of all non-ASCII bytes
117
118 ** Several previously existing, but undocumented .wgetrc options are
119 now documented: save_headers, spider, and user_agent,
120 auth_no_challenge, and keep_session_cookies. Also added documentation
121 for the "lowercase" and "uppercase" values for --restrict-file-names, which had been present since Wget 1.11.
122 \f
123 * Changes in Wget 1.11.4
124
125 ** Fixed an issue (apparently a regression) where -O would refuse to
126 download when -nc was given, even though the file didn't exist.
127
128 ** Fixed a situation where Wget could abort with --continue if the
129 remote server gives a content-length of zero when the file exists
130 locally with content.
131
132 ** Fixed a crash on some systems, due to Wget casting a pointer-to-long
133 to a pointer-to-time_t.
134
135 ** Translation updates for Catalan.
136 \f
137 * Changes in Wget 1.11.3
138
139 ** Downgraded -N with -O to a warning, rather than an error.
140
141 ** Translation updates
142 \f
143 * Changes in Wget 1.11.2
144
145 ** Fixed a problem in authenticating over HTTPS through a proxy.
146 (Regression in 1.11 over 1.10.2.)
147
148 ** The combination of -r or -p with -O, which was disallowed in 1.11,
149 has been downgraded to a warning in 1.11.2. (-O and -N, which was never
150 meaningful, is still an error.)
151
152 ** Further improvements to progress bar displays in non-English locales
153 (too many spaces could be inserted, causing the display to scroll).
154
155 ** Successive invocations of Wget on FTP URLS, with --no-remove-listing
156 and --continue, was causing Wget to append, rather than replace,
157 information in the .listing file, and thereby download the same files
158 multiple times. This has been fixed in 1.11.2.
159
160 ** Wget 1.11 no longer allowed ".." to persist at the beginning of URLs,
161 for improved conformance with RFC 3986. However, this behavior presents
162 problems for some FTP setups, and so they are now preserved again, for
163 FTP URLs only.
164 \f
165 * Changes in Wget 1.11.1.
166
167 ** Interrupted downloads no longer result in renaming the file
168 (regression in 1.11 over 1.10.2).
169
170 ** Progress bar now displays correctly in non-English locales (and a
171 related assertion failure was fixed).
172
173 ** Wget no longer issues a GET request over HTTP for files it should
174 know it's not going to download (regression in 1.11 over 1.10.2).
175
176 ** Added option --auth-no-challenge, to support broken pre-1.11
177 authentication-before-server-challenge, which turns out to still be
178 useful for some limited cases.
179
180 ** Documentation of accept/reject lists in the manual's "Types of
181 Files" section now explains various aspects of their behavior that may
182 be surprising, and notes that they may change in the future.
183
184 ** Documentation of --no-parents now explains how a trailing slash, or
185 lack thereof, in the specified URL, will affect behavior.
186 \f
187 * Changes in Wget 1.11.
188
189 ** Timestamping now uses the value from the most recent HTTP response,
190 rather than the first one it got.
191
192 ** Authentication information is no longer sent as part of the Referer
193 header in recursive fetches.
194
195 ** No authentication credentials are sent until a challenge is issued,
196 for improved security. Authentication handling is still not
197 RFC-compliant, as once a Basic challenge has been received, it will
198 assume it can send credentials to any URL at that same host, and not
199 just the ones at or below the original authenticated location.
200 Credentials for Digest authentication are still never saved or issued
201 automatically, and continue to require a challenge for each resource.
202
203 ** Added --max-redirect option, allowing the user to specify what should
204 be the maximum number of HTTP redirects to follow.
205
206 ** Wget now supports saving HTTP downloads using file names specified by
207 the `Content-Disposition' header.  This is a standard way of specifying
208 the file name used by many web dynamically generated pages. However, the
209 current implementation is inefficient, and known to have bugs. It is
210 EXPERIMENTAL only, and not enabled by default. Use --content-disposition
211 to enable it.
212
213 ** The new option `--ignore-case' makes Wget ignore case when
214 matching files, directories, and wildcards.  This affects the -X, -I,
215 -A, and -R options, as well as globbing in FTP URLs.
216
217 ** ETA projection is now displayed in "dot" progress output as well as
218 in the default progress bar.  (The dot progress is used by default when
219 logging Wget's output to file using the `-o' option.)
220
221 ** The "lockable boolean" argument type is no longer supported.  It
222 was only used by the passive_ftp .wgetrc setting.  If you're running
223 broken scripts or Perl modules that unconditionally specify
224 `--passive-ftp' and your firewall disallows it, you can override them
225 by replacing wget with a script that execs wget "$@" --no-passive-ftp.
226
227 ** The source code has been migrated to Mercurial. The repositories are
228 available at http://hg.addictivecode.org/. Prior to this, the source
229 code was hosted on Subversion (migrated from the original CVS); you can
230 still get access to older tags and branches for Wget in the Subversion
231 repository at http://addictivecode.org/svn/wget/.
232 \f
233 * Changes in Wget 1.10.
234
235 ** Downloading files larger than 2GB, sometimes referred to as "large
236 files", now works on systems that support them.  This includes the
237 majority of modern Unixes, as well as MS Windows.
238
239 ** IPv6 is now supported by Wget.  Unlike the experimental code in
240 1.9, this version supports dual-family systems.  The new flags
241 `--inet4' and `--inet6' (or `-4' and `-6' for short) force the use of
242 IPv4 and IPv6 respectively.  Note that IPv6 support has not yet been
243 tested on Windows.
244
245 ** Microsoft's proprietary "NTLM" method of HTTP authentication is now
246 supported.  This authentication method is undocumented and only used
247 by IIS.  Note that *proxy* authentication is not supported in this
248 release; you can only authenticate to the target web site.
249
250 ** Wget no longer truncates partially downloaded files when download
251 has to start over because the server doesn't support Range.  Instead,
252 with such servers Wget now simply ignores the data up to the byte
253 where the last attempt left off, and only then continues appending to
254 the file.  That way the downloaded file never shrinks, and download
255 retries from servers without support for partial downloads work even
256 when downloading to stdout.
257
258 ** SSL/TLS changes:
259
260 *** SSL/TLS downloads now attempt to verify the server's certificate
261 against the recognized certificate authorities.  This requires CA
262 certificates to have been installed in a location visible to the
263 OpenSSL library.  If this is not the case, you can get the bundle
264 yourself from a source you trust (for example, the bundle extracted
265 from Mozilla available at http://curl.haxx.se/docs/caextract.html),
266 and point Wget to the PEM file using the `--ca-certificate'
267 command-line option or the corresponding `.wgetrc' command.
268
269 *** Secure downloads now verify that the host name in the URL matches
270 the "common name" in the certificate presented by the server.
271
272 *** Although the above checks provide more secure downloads, they
273 unavoidably break interoperability with some sites that worked with
274 previous versions, particularly those using self-signed, expired, or
275 otherwise invalid certificates.  If you encounter "certificate
276 verification" errors or complaints that "common name doesn't match
277 requested host name" and are convinced of the site's authenticity, you
278 can use `--no-check-certificate' to bypass both checks.
279
280 *** Talking to SSL/TLS servers over proxies now actually works.
281 Previous versions of Wget erroneously sent GET requests for https
282 URLs.  Wget 1.10 utilizes the CONNECT method designed for this
283 purpose.
284
285 *** The SSL/TLS-related options have been redesigned and, for the
286 first time, documented in the manual.  The old, undocumented, options
287 are no longer supported.
288
289 ** Passive FTP is now the default FTP transfer mode.  Use
290 `--no-passive-ftp' or specify `passive_ftp = off' in your init file to
291 revert to the old behavior.
292
293 ** The `--header' option can now be used to override generated
294 headers.  For example, `wget --header="Host: foo.bar"
295 http://127.0.0.1' tells Wget to connect to localhost, but to specify
296 "foo.bar" in the `Host' header.  In previous versions such use of
297 `--header' lead to duplicate headers in HTTP requests.
298
299 ** The responses without headers, aka "HTTP 0.9" responses, are
300 detected and handled.  Although HTTP 0.9 has long been obsolete, it is
301 still occasionally used, sometimes by accident.
302
303 ** The progress bar is now updated regularly even when the data does
304 not arrive from the network.
305
306 ** Wget no longer preserves permissions of files retrieved by FTP by
307 default.  Anonymous FTP servers frequently use permissions like "664",
308 which might not be what the user wants.  The new option
309 `--preserve-permissions' and the corresponding `.wgetrc' variable can
310 be used to revert to the old behavior.
311
312 ** The new option `--protocol-directories' instructs Wget to also use
313 the protocol name as a directory component of local file names.
314
315 ** Options that previously unconditionally set or unset various flags
316 are now boolean options that can be invoked as either `--OPTION' or
317 `--no-OPTION'.  Options that required an argument "on" or "off" have
318 also been changed this way, but they still accept the old syntax for
319 backward compatibility.  For example, instead of `--glob=off' you can
320 write `--no-glob'.
321
322 Allowing `--no-OPTION' for every `--OPTION' and the other way around
323 is useful because it allows the user to override non-default behavior
324 specified via `.wgetrc'.
325
326 ** The new option `--keep-session-cookies' causes `--save-cookies' to
327 save session cookies (normally only kept in memory) along with the
328 permanent ones.  This is useful because many sites track important
329 information, such as whether the user has authenticated, in session
330 cookies.  With this option multiple Wget runs are treated as a single
331 browser session.
332
333 ** Wget now supports the --ftp-user and --ftp-password command
334 switches to set username and password for FTP, and the --user and
335 --password command switches to set username and password for both FTP
336 and HTTP.  The --http-passwd and --proxy-passwd command switches have
337 been renamed to --http-password and --proxy-password respectively, and
338 the related http_passwd and proxy_passwd .wgetrc commands to
339 http_password and proxy_password respectively.  The login and passwd
340 .wgetrc commands have been deprecated.
341
342 * `wget -b' now works correctly under Windows.
343 \f
344 * Wget 1.9.1 is a bugfix release with no user-visible changes.
345 \f
346 * Changes in Wget 1.9.
347
348 ** It is now possible to specify that POST method be used for HTTP
349 requests.  For example, `wget --post-data="id=foo&data=bar" URL' will
350 send a POST request with the specified contents.
351
352 ** IPv6 support is available, although it's still experimental.
353
354 ** The `--timeout' option now also affects DNS lookup and establishing
355 the TCP connection.  Previously it only affected reading and writing
356 data.  Those three timeouts can be set separately using
357 `--dns-timeout', `--connection-timeout', and `--read-timeout',
358 respectively.
359
360 ** Download speed shown by the progress bar is based on the data
361 recently read, rather than the average speed of the entire download.
362 The ETA projection is still based on the overall average.
363
364 ** It is now possible to connect to FTP servers through FWTK
365 firewalls.  Set ftp_proxy to an FTP URL, and Wget will automatically
366 log on to the proxy as "username@host".
367
368 ** The new option `--retry-connrefused' makes Wget retry downloads
369 even in the face of refused connections, which are otherwise
370 considered a fatal error.
371
372 ** The new option `--no-dns-cache' may be used to prevent Wget from
373 caching DNS lookups.
374
375 ** Wget no longer escapes characters in local file names based on
376 whether they're appropriate in URLs.  Escaping can still occur for
377 nonprintable characters or for '/', but no longer for frequent
378 characters such as space.  You can use the new option
379 --restrict-file-names to relax or strengthen these rules, which can be
380 useful if you dislike the default or if you're downloading to
381 non-native partitions.
382
383 ** Handling of HTML comments has been dumbed down to conform to what
384 users expect and other browsers do: instead of being treated as SGML
385 declaration, a comment is terminated at the first occurrence of "-->".
386 Use `--strict-comments' to revert to the old behavior.
387
388 ** Wget now correctly handles relative URIs that begin with "//", such
389 as "//img.foo.com/foo.jpg".
390
391 ** Boolean options in `.wgetrc' and on the command line now accept
392 values "yes" and "no" along with the traditional "on" and "off".
393
394 ** It is now possible to specify decimal values for timeouts, waiting
395 periods, and download rate.  For instance, `--wait=0.5' now works as
396 expected, as does `--dns-timeout=0.5' and even `--limit-rate=2.5k'.
397 \f
398 * Wget 1.8.2 is a bugfix release with no user-visible changes.
399 \f
400 * Wget 1.8.1 is a bugfix release with no user-visible changes.
401 \f
402 * Changes in Wget 1.8.
403
404 ** A new progress indicator is now available and used by default.
405 You can choose the progress bar type with `--progress=TYPE'.  Two
406 types are available, "bar" (the new default), and "dot" (the old
407 dotted indicator).  You can permanently revert to the old progress
408 indicator by putting `progress = dot' in your `.wgetrc'.
409
410 ** You can limit the download rate of the retrieval using the
411 `--limit-rate' option.  For example, `wget --limit-rate=15k URL' will
412 tell Wget not to download the body of the URL faster than 15 kilobytes
413 per second.
414
415 ** Recursive retrieval and link conversion have been revamped:
416
417 *** Wget now traverses links breadth-first.  This makes the
418 calculation of depth much more reliable than before.  Also, recursive
419 downloads are faster and consume *significantly* less memory than
420 before.
421
422 *** Links are converted only when the entire retrieval is complete.
423 This is the only safe thing to do, as only then is it known what URLs
424 have been downloaded.
425
426 *** BASE tags are handled correctly when converting links.  Since Wget
427 already resolves <base href="..."> when resolving handling URLs, link
428 conversion now makes the BASE tags point to an empty string.
429
430 *** HTML anchors are now handled correctly.  Links to an anchor in the
431 same document (<a href="#anchorname">), which used to confuse Wget,
432 are now converted correctly.
433
434 *** When in page-requisites (-p) mode, no-parent (-np) is ignored when
435 retrieving for inline images, stylesheets, and other documents needed
436 to display the page.
437
438 *** Page-requisites (-p) mode now works with frames.  In other words,
439 `wget -p URL-THAT-USES-FRAMES' will now download the frame HTML files,
440 and all the files that they need to be displayed properly.
441
442 ** `--base' now works conjunction with `--input-file', providing a
443 base for each URL and thereby allowing the URLs in the file to be
444 relative.
445
446 ** If a host has more than one IP address, Wget uses the other
447 addresses when accessing the first one fails.
448
449 ** Host directories now contain port information if the URL is at a
450 non-standard port.
451
452 ** Wget now supports the robots.txt directives specified in
453 <http://www.robotstxt.org/wc/norobots-rfc.txt>.
454
455 ** URL parser has been fixed, especially the infamous overzealous
456 quoting.  Wget no longer dequotes reserved characters, e.g. `%3F' is
457 no longer translated to `?', nor `%2B' to `+'.  Unsafe characters
458 which are not reserved are still escaped, of course.
459
460 ** No more than 20 successive redirections are allowed.
461 \f
462 * Wget 1.7.1 is a bugfix release with no user-visible changes.
463 \f
464 * Changes in Wget 1.7.
465
466 ** SSL (`https') pages now work if you compile Wget with SSL support;
467 use the `--with-ssl' configure flag.  You need to have OpenSSL
468 installed.
469
470 ** Cookies are now supported.  Wget will accept cookies sent by the
471 server and return them in later requests.  Additionally, it can load
472 and save cookies to disk, in the same format that Netscape uses.
473
474 ** "Keep-alive" (persistent) HTTP connections are now supported.
475 Using keep-alive allows Wget to share one TCP/IP connection for
476 many retrievals, making multiple-file downloads faster and less
477 stressing for the server and the network.
478
479 ** Wget now recognizes FTP directory listings generated by NT and VMS
480 servers.
481
482 ** It is now possible to recurse through FTP sites where logging in
483 puts you in some directory other than '/'.
484
485 ** You may now use `~' to mean home directory in `.wgetrc'.  For
486 example, `load_cookies = ~/.netscape/cookies.txt' works as you would
487 expect.
488
489 ** The HTML parser has been rewritten.  The new one works more
490 reliably, allows finer-grained control over which tags and attributes
491 are detected, and has better support for some features like correctly
492 skipping comments and declarations, decoding entities, etc.  It is
493 also more general.
494
495 ** <meta name="robots"> tags are now respected.
496
497 ** Wget's internal tables now use hash tables instead of linked lists
498 where appropriate.  This results in huge speedups when retrieving
499 large sites (thousands of documents).
500
501 ** Wget now has a man page, automatically generated from the Texinfo
502 documentation.  (The last version that shipped with a man page was
503 1.4.5).  To get this, you need to have pod2man from the Perl
504 distribution installed on your system.
505 \f
506 * Changes in Wget 1.6
507
508 ** Administrative changes.
509
510 *** Maintainership.  Due to Hrvoje being plagued with a "real job",
511 Dan Harkless is the most active maintainer (not that he doesn't have a
512 real job as well).  Hrvoje still participates occasionally, and both
513 are being helped by many other people.
514
515 *** Web page.  Thanks to Jan Prikryl, Wget has an "official" web page.
516 Take a look at:
517
518     http://sunsite.dk/wget/
519
520 *** Anonymous CVS.  Thanks to ever-helpful Karsten Thygesen, Wget
521 sources are now available at an anonymous CVS server.  Take a look at
522 the web page for downloading instructions.
523
524 ** New -K / --backup-converted / backup_converted = on option causes files
525 modified due to -k to be saved with a .orig prefix before being changed.  When
526 using -N as well, it is these .orig files that are compared against the server.
527
528 ** New --follow-tags / follow_tags = ... option allows you to restrict
529 Wget to following only certain HTML tags when doing a recursive
530 retrieval.  -G / --ignore-tags / ignore_tags = ... is just the
531 opposite -- all tags but the ones you specify will be followed.
532
533 ** New --waitretry / waitretry = SECONDS option allows waiting between retries
534 of failed downloads.  Wget will use "linear" backoff, waiting 1 second after the
535 first failure, 2 after the second, up to SECONDS.  waitretry is set to 10 by
536 default in the system wgetrc.
537
538 ** New -p / --page-requisites / page_requisites = on option causes
539 Wget to download all ancillary files necessary to display a given HTML
540 page properly (e.g. inlined images).
541
542 ** New -E / --html-extension / html_extension = on option causes Wget
543 to append ".html" to text/html filenames not ending in regexp
544 "\.[Hh][Tt][Mm][Ll]?".
545
546 ** New type of .wgetrc command -- "lockable Boolean".  Can be set to on, off,
547 always, or never.  This allows the .wgetrc to override the commandline.  So far,
548 passive_ftp is the only .wgetrc command which takes a lockable Boolean.
549
550 ** A number of new translation files have been added.
551
552 ** New --bind-address / bind_address = <address> option for people on hosts
553 bound to multiple IP addresses.
554
555 ** wget now accepts (illegal per HTTP spec) relative URLs in HTTP redirects.
556 \f
557 * Wget 1.5.3 is a bugfix release with no user-visible changes.
558 \f
559 * Wget 1.5.2 is a bugfix release with no user-visible changes.
560 \f
561 * Wget 1.5.1 is a bugfix release with no user-visible changes.
562 \f
563 * Changes in Wget 1.5.0
564
565 ** Wget speaks many languages!
566
567 On systems with gettext(), Wget will output messages in the language
568 set by the current locale, if available.  At this time we support
569 Czech, German, Croatian, Italian, Norwegian and Portuguese.
570
571 ** Opie (Skey) is now supported with FTP.
572
573 ** HTTP Digest Access Authentication (RFC2069) is now supported.
574
575 ** The new `-b' option makes Wget go to background automatically.
576
577 ** The `-I' and `-X' options now accept wildcard arguments.
578
579 ** The `-w' option now accepts suffixes `s' for seconds, `m' for
580 minutes, `h' for hours, `d' for days and `w' for weeks.
581
582 ** Upon getting SIGHUP, the whole previous log is now copied to
583 `wget-log'.
584
585 ** Wget now understands proxy settings with explicit usernames and
586 passwords, e.g. `http://user:password@proxy.foo.com/'.
587
588 ** You can use the new `--cut-dirs' option to make Wget create less
589 directories.
590
591 ** The `;type=a' appendix to FTP URLs is now recognized.  For
592 instance, the following command will retrieve the welcoming message in
593 ASCII type transfer:
594
595     wget "ftp://ftp.somewhere.com/welcome.msg;type=a"
596
597 ** `--help' and `--version' options have been redone to to conform to
598 standards set by other GNU utilities.
599
600 ** Wget should now be compilable under MS Windows environment.  MS
601 Visual C++ and Watcom C have been used successfully.
602
603 ** If the file length is known, percentages are displayed during
604 download.
605
606 ** The manual page, now hopelessly out of date, is no longer
607 distributed with Wget.
608 \f
609 * Wget 1.4.5 is a bugfix release with no user-visible changes.
610 \f
611 * Wget 1.4.4 is a bugfix release with no user-visible changes.
612 \f
613 * Changes in Wget 1.4.3
614
615 ** Wget is now a GNU utility.
616
617 ** Can do passive FTP.
618
619 ** Reads .netrc.
620
621 ** Info documentation expanded.
622
623 ** Compiles on pre-ANSI compilers.
624
625 ** Global wgetrc now goes to /usr/local/etc (i.e. $sysconfdir).
626
627 ** Lots of bugfixes.
628 \f
629 * Changes in Wget 1.4.2
630
631 ** New mirror site at ftp://sunsite.auc.dk/pub/infosystems/wget/,
632 thanks to Karsten Thygesen.
633
634 ** Mailing list!  Mail to wget-request@sunsite.auc.dk to subscribe.
635
636 ** New option --delete-after for proxy prefetching.
637
638 ** New option --retr-symlinks to retrieve symbolic links like plain
639 files.
640
641 ** rmold.pl -- script to remove files deleted on the remote server
642
643 ** --convert-links should work now.
644
645 ** Minor bugfixes.
646 \f
647 * Changes in Wget 1.4.1
648
649 ** Minor bugfixes.
650
651 ** Added -I (the opposite of -X).
652
653 ** Dot tracing is now customizable; try wget --dot-style=binary
654 \f
655 * Changes in Wget 1.4.0
656
657 ** Wget 1.4.0 [formerly known as Geturl] is an extensive rewrite of
658 Geturl.  Although many things look suspiciously similar, most of the
659 stuff was rewritten, like recursive retrieval, HTTP, FTP and mostly
660 everything else.  Wget should be now easier to debug, maintain and,
661 most importantly, use.
662
663 ** Recursive HTTP should now work without glitches, even with Location
664 changes, server-generated directory listings and other naughty stuff.
665
666 ** HTTP regetting is supported on servers that support Range
667 specification. WWW authorization is supported -- try
668 wget http://user:password@hostname/
669
670 ** FTP support was rewritten and widely enhanced. Globbing should now
671 work flawlessly. Symbolic links are created locally. All the
672 information the Unix-style ls listing can give is now recognized.
673
674 ** Recursive FTP is supported, e.g.
675     wget -r ftp://gnjilux.cc.fer.hr/pub/unix/util/
676
677 ** You can specify "rejected" directories, to which you do not want to
678 enter, e.g. with wget -X /pub
679
680 ** Time-stamping is supported, with both HTTP and FTP. Try wget -N URL.
681
682 ** A new texinfo reference manual is provided.  It can be read with
683 Emacs, standalone info, or converted to HTML, dvi or postscript.
684
685 ** Fixed a long-standing bug, so that Wget now works over SLIP
686 connections.
687
688 ** You can have a system-wide wgetrc (/usr/local/lib/wgetrc by
689 default). Settings in $HOME/.wgetrc override the global ones, of
690 course :-)
691
692 ** You can set up quota in .wgetrc to prevent sucking too much
693 data. Try `quota = 5M' in .wgetrc (or quota = 100K if you want your
694 sysadmin to like you).
695
696 ** Download rate is printed after retrieval.
697
698 ** Wget now sends the `Referer' header when retrieving
699 recursively.
700
701 ** With the new --no-parent option Wget can retrieve FTP recursively
702 through a proxy server.
703
704 ** HTML parser, as well as the whole of Wget was rewritten to be much
705 faster and less memory-consuming (yes, both).
706
707 ** Absolute links can be converted to relative links locally. Check
708 wget -k.
709
710 ** Wget catches hangup, filtering the output to a log file and
711 resuming work. Try kill -HUP %?wget.
712
713 ** User-defined headers can be sent.  Try
714
715     wget http://fly.cc.her.hr/ --header='Accept-Charset: iso-8859-2'
716
717 ** Acceptance/Rejection lists may contain wildcards.
718
719 ** Wget can display HTTP headers and/or FTP server response with the
720 new `-S' option.  It can save the original HTTP headers with `-s'.
721
722 ** socks library is now supported (thanks to Antonio Rosella
723 <Antonio.Rosella@agip.it>). Configure with --with-socks.
724
725 ** There is a nicer display of REST-ed output.
726
727 ** Many new options (like -x to force directory hierarchy, or -m to
728 turn on mirroring options).
729
730 ** Wget is now distributed under GNU General Public License (GPL).
731
732 ** Lots of small features I can't remember. :-)
733
734 ** A host of bugfixes.
735 \f
736 * Changes in Geturl 1.3
737
738 ** Added FTP globbing support (ftp://fly.cc.fer.hr/*)
739
740 ** Added support for no_proxy
741
742 ** Added support for ftp://user:password@host/
743
744 ** Added support for %xx in URL syntax
745
746 ** More natural command-line options
747
748 ** Added -e switch to execute .geturlrc commands from the command-line
749
750 ** Added support for robots.txt
751
752 ** Fixed some minor bugs
753 \f
754 * Geturl 1.2 is a bugfix release with no user-visible changes.
755 \f
756 * Changes in Geturl 1.1
757
758 ** REST supported in FTP
759
760 ** Proxy servers supported
761
762 ** GNU getopt used, which enables command-line arguments to be ordered
763 as you wish, e.g.  geturl http://fly.cc.fer.hr/ -vo log is the same as
764 geturl -vo log http://fly.cc.fer.hr/
765
766 ** Netscape-compatible URL syntax for HTTP supported: host[:port]/dir/file
767
768 ** NcFTP-compatible colon URL syntax for FTP supported: host:/dir/file
769
770 ** <base href="xxx"> supported
771
772 ** autoconf supported
773 \f
774 ----------------------------------------------------------------------
775 Copyright information:
776
777 Copyright (C) 1997-2005 Free Software Foundation, Inc.
778
779    Permission is granted to anyone to make or distribute verbatim
780    copies of this document as received, in any medium, provided that
781    the copyright notice and this permission notice are preserved, thus
782    giving the recipient permission to redistribute in turn.
783
784    Permission is granted to distribute modified versions of this
785    document, or of portions of it, under the above conditions,
786    provided also that they carry prominent notices stating who last
787    changed them.