]> sjero.net Git - wget/blob - NEWS
Cope better with unclosed html tags.
[wget] / NEWS
1 GNU Wget NEWS -- history of user-visible changes.
2
3 Copyright (C) 1997, 1998, 1999, 2000, 2001, 2002, 2003, 2004, 2005,
4 2006, 2007, 2008, 2009, 2010 Free Software Foundation, Inc.
5 See the end for copying conditions.
6
7 Please send GNU Wget bug reports to <bug-wget@gnu.org>.
8 \f
9 * Changes in Wget X.Y.Z
10
11 ** Support HTTP/1.1
12
13 ** Fix some portability issues.
14
15 ** Handle properly malformed status line in a HTTP response.
16
17 ** Ignore zero length domains in $no_proxy.
18
19 ** Set new cookies after an authorization failure.
20
21 ** Exit with failure if -k is specified and -O is not a regular file.
22
23 ** Cope better with unclosed html tags.
24 \f
25 * Changes in Wget 1.12
26
27 ** Mailing list MOVED to bug-wget@gnu.org
28
29 ** SECURITY FIX: It had been possible to trick Wget into accepting
30 SSL certificates that don't match the host name, through the trick of
31 embedding NUL characters into the certs' common name. Fixed by Joao
32 Ferreira <joao@joaoff.com>.
33
34 ** Added support for CSS. This includes:
35      - Parsing links from CSS files, and from CSS content found in HTML
36        style tags and attributes.
37      - Supporting conversion of links found within CSS content, when
38        --convert-links is specified.
39      - Ensuring that CSS files end in the ".css" filename extension,
40        when --convert-links is specified.
41
42    CSS support in Wget is thanks to Ted Mielczarek
43    <ted.mielczarek@gmail.com>.
44
45 ** Added support for Internationalized Resource Identifiers (IRIs, RFC
46 3987). When support is enabled (requires libidn and libiconv), links
47 with non-ASCII bytes are translated from their source encoding to UTF-8
48 before percent-encoding.  IRI support was added by Saint Xavier
49 <wget@sxav.eu>, as his project for the Google Summer of Code.
50
51 ** Wget now provides more sensible exit status codes when downloads
52 don't proceed as expected (see the manual).
53
54 ** --default-page option (and associated wgetrc command) added to
55 support alternative default names for index.html.
56
57 ** --ask-password option (and associated wgetrc command) added to
58 support password prompts at the console.
59
60 ** The --input-file option now also handles retrieving links from
61 an external file.
62
63 ** The output generated by the --version option now includes
64 information on how it was built, and the set of configure-time options
65 that were selected.
66
67 ** --html-extension has been renamed to --adjust-extension, to reflect
68 the fact that it now also applies to CSS content. --html-extension is
69 still acceptable, but is now deprecated.
70
71 ** An "ascii" specifier is now accepted by --restrict-file-names, which
72 forces the percent-encoding of all non-ASCII bytes
73
74 ** Several previously existing, but undocumented .wgetrc options are
75 now documented: save_headers, spider, and user_agent,
76 auth_no_challenge, and keep_session_cookies. Also added documentation
77 for the "lowercase" and "uppercase" values for --restrict-file-names, which had been present since Wget 1.11.
78 \f
79 * Changes in Wget 1.11.4
80
81 ** Fixed an issue (apparently a regression) where -O would refuse to
82 download when -nc was given, even though the file didn't exist.
83
84 ** Fixed a situation where Wget could abort with --continue if the
85 remote server gives a content-length of zero when the file exists
86 locally with content.
87
88 ** Fixed a crash on some systems, due to Wget casting a pointer-to-long
89 to a pointer-to-time_t.
90
91 ** Translation updates for Catalan.
92 \f
93 * Changes in Wget 1.11.3
94
95 ** Downgraded -N with -O to a warning, rather than an error.
96
97 ** Translation updates
98 \f
99 * Changes in Wget 1.11.2
100
101 ** Fixed a problem in authenticating over HTTPS through a proxy.
102 (Regression in 1.11 over 1.10.2.)
103
104 ** The combination of -r or -p with -O, which was disallowed in 1.11,
105 has been downgraded to a warning in 1.11.2. (-O and -N, which was never
106 meaningful, is still an error.)
107
108 ** Further improvements to progress bar displays in non-English locales
109 (too many spaces could be inserted, causing the display to scroll).
110
111 ** Successive invocations of Wget on FTP URLS, with --no-remove-listing
112 and --continue, was causing Wget to append, rather than replace,
113 information in the .listing file, and thereby download the same files
114 multiple times. This has been fixed in 1.11.2.
115
116 ** Wget 1.11 no longer allowed ".." to persist at the beginning of URLs,
117 for improved conformance with RFC 3986. However, this behavior presents
118 problems for some FTP setups, and so they are now preserved again, for
119 FTP URLs only.
120 \f
121 * Changes in Wget 1.11.1.
122
123 ** Interrupted downloads no longer result in renaming the file
124 (regression in 1.11 over 1.10.2).
125
126 ** Progress bar now displays correctly in non-English locales (and a
127 related assertion failure was fixed).
128
129 ** Wget no longer issues a GET request over HTTP for files it should
130 know it's not going to download (regression in 1.11 over 1.10.2).
131
132 ** Added option --auth-no-challenge, to support broken pre-1.11
133 authentication-before-server-challenge, which turns out to still be
134 useful for some limited cases.
135
136 ** Documentation of accept/reject lists in the manual's "Types of
137 Files" section now explains various aspects of their behavior that may
138 be surprising, and notes that they may change in the future.
139
140 ** Documentation of --no-parents now explains how a trailing slash, or
141 lack thereof, in the specified URL, will affect behavior.
142 \f
143 * Changes in Wget 1.11.
144
145 ** Timestamping now uses the value from the most recent HTTP response,
146 rather than the first one it got.
147
148 ** Authentication information is no longer sent as part of the Referer
149 header in recursive fetches.
150
151 ** No authentication credentials are sent until a challenge is issued,
152 for improved security. Authentication handling is still not
153 RFC-compliant, as once a Basic challenge has been received, it will
154 assume it can send credentials to any URL at that same host, and not
155 just the ones at or below the original authenticated location.
156 Credentials for Digest authentication are still never saved or issued
157 automatically, and continue to require a challenge for each resource.
158
159 ** Added --max-redirect option, allowing the user to specify what should
160 be the maximum number of HTTP redirects to follow.
161
162 ** Wget now supports saving HTTP downloads using file names specified by
163 the `Content-Disposition' header.  This is a standard way of specifying
164 the file name used by many web dynamically generated pages. However, the
165 current implementation is inefficient, and known to have bugs. It is
166 EXPERIMENTAL only, and not enabled by default. Use --content-disposition
167 to enable it.
168
169 ** The new option `--ignore-case' makes Wget ignore case when
170 matching files, directories, and wildcards.  This affects the -X, -I,
171 -A, and -R options, as well as globbing in FTP URLs.
172
173 ** ETA projection is now displayed in "dot" progress output as well as
174 in the default progress bar.  (The dot progress is used by default when
175 logging Wget's output to file using the `-o' option.)
176
177 ** The "lockable boolean" argument type is no longer supported.  It
178 was only used by the passive_ftp .wgetrc setting.  If you're running
179 broken scripts or Perl modules that unconditionally specify
180 `--passive-ftp' and your firewall disallows it, you can override them
181 by replacing wget with a script that execs wget "$@" --no-passive-ftp.
182
183 ** The source code has been migrated to Mercurial. The repositories are
184 available at http://hg.addictivecode.org/. Prior to this, the source
185 code was hosted on Subversion (migrated from the original CVS); you can
186 still get access to older tags and branches for Wget in the Subversion
187 repository at http://addictivecode.org/svn/wget/.
188 \f
189 * Changes in Wget 1.10.
190
191 ** Downloading files larger than 2GB, sometimes referred to as "large
192 files", now works on systems that support them.  This includes the
193 majority of modern Unixes, as well as MS Windows.
194
195 ** IPv6 is now supported by Wget.  Unlike the experimental code in
196 1.9, this version supports dual-family systems.  The new flags
197 `--inet4' and `--inet6' (or `-4' and `-6' for short) force the use of
198 IPv4 and IPv6 respectively.  Note that IPv6 support has not yet been
199 tested on Windows.
200
201 ** Microsoft's proprietary "NTLM" method of HTTP authentication is now
202 supported.  This authentication method is undocumented and only used
203 by IIS.  Note that *proxy* authentication is not supported in this
204 release; you can only authenticate to the target web site.
205
206 ** Wget no longer truncates partially downloaded files when download
207 has to start over because the server doesn't support Range.  Instead,
208 with such servers Wget now simply ignores the data up to the byte
209 where the last attempt left off, and only then continues appending to
210 the file.  That way the downloaded file never shrinks, and download
211 retries from servers without support for partial downloads work even
212 when downloading to stdout.
213
214 ** SSL/TLS changes:
215
216 *** SSL/TLS downloads now attempt to verify the server's certificate
217 against the recognized certificate authorities.  This requires CA
218 certificates to have been installed in a location visible to the
219 OpenSSL library.  If this is not the case, you can get the bundle
220 yourself from a source you trust (for example, the bundle extracted
221 from Mozilla available at http://curl.haxx.se/docs/caextract.html),
222 and point Wget to the PEM file using the `--ca-certificate'
223 command-line option or the corresponding `.wgetrc' command.
224
225 *** Secure downloads now verify that the host name in the URL matches
226 the "common name" in the certificate presented by the server.
227
228 *** Although the above checks provide more secure downloads, they
229 unavoidably break interoperability with some sites that worked with
230 previous versions, particularly those using self-signed, expired, or
231 otherwise invalid certificates.  If you encounter "certificate
232 verification" errors or complaints that "common name doesn't match
233 requested host name" and are convinced of the site's authenticity, you
234 can use `--no-check-certificate' to bypass both checks.
235
236 *** Talking to SSL/TLS servers over proxies now actually works.
237 Previous versions of Wget erroneously sent GET requests for https
238 URLs.  Wget 1.10 utilizes the CONNECT method designed for this
239 purpose.
240
241 *** The SSL/TLS-related options have been redesigned and, for the
242 first time, documented in the manual.  The old, undocumented, options
243 are no longer supported.
244
245 ** Passive FTP is now the default FTP transfer mode.  Use
246 `--no-passive-ftp' or specify `passive_ftp = off' in your init file to
247 revert to the old behavior.
248
249 ** The `--header' option can now be used to override generated
250 headers.  For example, `wget --header="Host: foo.bar"
251 http://127.0.0.1' tells Wget to connect to localhost, but to specify
252 "foo.bar" in the `Host' header.  In previous versions such use of
253 `--header' lead to duplicate headers in HTTP requests.
254
255 ** The responses without headers, aka "HTTP 0.9" responses, are
256 detected and handled.  Although HTTP 0.9 has long been obsolete, it is
257 still occasionally used, sometimes by accident.
258
259 ** The progress bar is now updated regularly even when the data does
260 not arrive from the network.
261
262 ** Wget no longer preserves permissions of files retrieved by FTP by
263 default.  Anonymous FTP servers frequently use permissions like "664",
264 which might not be what the user wants.  The new option
265 `--preserve-permissions' and the corresponding `.wgetrc' variable can
266 be used to revert to the old behavior.
267
268 ** The new option `--protocol-directories' instructs Wget to also use
269 the protocol name as a directory component of local file names.
270
271 ** Options that previously unconditionally set or unset various flags
272 are now boolean options that can be invoked as either `--OPTION' or
273 `--no-OPTION'.  Options that required an argument "on" or "off" have
274 also been changed this way, but they still accept the old syntax for
275 backward compatibility.  For example, instead of `--glob=off' you can
276 write `--no-glob'.
277
278 Allowing `--no-OPTION' for every `--OPTION' and the other way around
279 is useful because it allows the user to override non-default behavior
280 specified via `.wgetrc'.
281
282 ** The new option `--keep-session-cookies' causes `--save-cookies' to
283 save session cookies (normally only kept in memory) along with the
284 permanent ones.  This is useful because many sites track important
285 information, such as whether the user has authenticated, in session
286 cookies.  With this option multiple Wget runs are treated as a single
287 browser session.
288
289 ** Wget now supports the --ftp-user and --ftp-password command
290 switches to set username and password for FTP, and the --user and
291 --password command switches to set username and password for both FTP
292 and HTTP.  The --http-passwd and --proxy-passwd command switches have
293 been renamed to --http-password and --proxy-password respectively, and
294 the related http_passwd and proxy_passwd .wgetrc commands to
295 http_password and proxy_password respectively.  The login and passwd
296 .wgetrc commands have been deprecated.
297
298 * `wget -b' now works correctly under Windows.
299 \f
300 * Wget 1.9.1 is a bugfix release with no user-visible changes.
301 \f
302 * Changes in Wget 1.9.
303
304 ** It is now possible to specify that POST method be used for HTTP
305 requests.  For example, `wget --post-data="id=foo&data=bar" URL' will
306 send a POST request with the specified contents.
307
308 ** IPv6 support is available, although it's still experimental.
309
310 ** The `--timeout' option now also affects DNS lookup and establishing
311 the TCP connection.  Previously it only affected reading and writing
312 data.  Those three timeouts can be set separately using
313 `--dns-timeout', `--connection-timeout', and `--read-timeout',
314 respectively.
315
316 ** Download speed shown by the progress bar is based on the data
317 recently read, rather than the average speed of the entire download.
318 The ETA projection is still based on the overall average.
319
320 ** It is now possible to connect to FTP servers through FWTK
321 firewalls.  Set ftp_proxy to an FTP URL, and Wget will automatically
322 log on to the proxy as "username@host".
323
324 ** The new option `--retry-connrefused' makes Wget retry downloads
325 even in the face of refused connections, which are otherwise
326 considered a fatal error.
327
328 ** The new option `--no-dns-cache' may be used to prevent Wget from
329 caching DNS lookups.
330
331 ** Wget no longer escapes characters in local file names based on
332 whether they're appropriate in URLs.  Escaping can still occur for
333 nonprintable characters or for '/', but no longer for frequent
334 characters such as space.  You can use the new option
335 --restrict-file-names to relax or strengthen these rules, which can be
336 useful if you dislike the default or if you're downloading to
337 non-native partitions.
338
339 ** Handling of HTML comments has been dumbed down to conform to what
340 users expect and other browsers do: instead of being treated as SGML
341 declaration, a comment is terminated at the first occurrence of "-->".
342 Use `--strict-comments' to revert to the old behavior.
343
344 ** Wget now correctly handles relative URIs that begin with "//", such
345 as "//img.foo.com/foo.jpg".
346
347 ** Boolean options in `.wgetrc' and on the command line now accept
348 values "yes" and "no" along with the traditional "on" and "off".
349
350 ** It is now possible to specify decimal values for timeouts, waiting
351 periods, and download rate.  For instance, `--wait=0.5' now works as
352 expected, as does `--dns-timeout=0.5' and even `--limit-rate=2.5k'.
353 \f
354 * Wget 1.8.2 is a bugfix release with no user-visible changes.
355 \f
356 * Wget 1.8.1 is a bugfix release with no user-visible changes.
357 \f
358 * Changes in Wget 1.8.
359
360 ** A new progress indicator is now available and used by default.
361 You can choose the progress bar type with `--progress=TYPE'.  Two
362 types are available, "bar" (the new default), and "dot" (the old
363 dotted indicator).  You can permanently revert to the old progress
364 indicator by putting `progress = dot' in your `.wgetrc'.
365
366 ** You can limit the download rate of the retrieval using the
367 `--limit-rate' option.  For example, `wget --limit-rate=15k URL' will
368 tell Wget not to download the body of the URL faster than 15 kilobytes
369 per second.
370
371 ** Recursive retrieval and link conversion have been revamped:
372
373 *** Wget now traverses links breadth-first.  This makes the
374 calculation of depth much more reliable than before.  Also, recursive
375 downloads are faster and consume *significantly* less memory than
376 before.
377
378 *** Links are converted only when the entire retrieval is complete.
379 This is the only safe thing to do, as only then is it known what URLs
380 have been downloaded.
381
382 *** BASE tags are handled correctly when converting links.  Since Wget
383 already resolves <base href="..."> when resolving handling URLs, link
384 conversion now makes the BASE tags point to an empty string.
385
386 *** HTML anchors are now handled correctly.  Links to an anchor in the
387 same document (<a href="#anchorname">), which used to confuse Wget,
388 are now converted correctly.
389
390 *** When in page-requisites (-p) mode, no-parent (-np) is ignored when
391 retrieving for inline images, stylesheets, and other documents needed
392 to display the page.
393
394 *** Page-requisites (-p) mode now works with frames.  In other words,
395 `wget -p URL-THAT-USES-FRAMES' will now download the frame HTML files,
396 and all the files that they need to be displayed properly.
397
398 ** `--base' now works conjunction with `--input-file', providing a
399 base for each URL and thereby allowing the URLs in the file to be
400 relative.
401
402 ** If a host has more than one IP address, Wget uses the other
403 addresses when accessing the first one fails.
404
405 ** Host directories now contain port information if the URL is at a
406 non-standard port.
407
408 ** Wget now supports the robots.txt directives specified in
409 <http://www.robotstxt.org/wc/norobots-rfc.txt>.
410
411 ** URL parser has been fixed, especially the infamous overzealous
412 quoting.  Wget no longer dequotes reserved characters, e.g. `%3F' is
413 no longer translated to `?', nor `%2B' to `+'.  Unsafe characters
414 which are not reserved are still escaped, of course.
415
416 ** No more than 20 successive redirections are allowed.
417 \f
418 * Wget 1.7.1 is a bugfix release with no user-visible changes.
419 \f
420 * Changes in Wget 1.7.
421
422 ** SSL (`https') pages now work if you compile Wget with SSL support;
423 use the `--with-ssl' configure flag.  You need to have OpenSSL
424 installed.
425
426 ** Cookies are now supported.  Wget will accept cookies sent by the
427 server and return them in later requests.  Additionally, it can load
428 and save cookies to disk, in the same format that Netscape uses.
429
430 ** "Keep-alive" (persistent) HTTP connections are now supported.
431 Using keep-alive allows Wget to share one TCP/IP connection for
432 many retrievals, making multiple-file downloads faster and less
433 stressing for the server and the network.
434
435 ** Wget now recognizes FTP directory listings generated by NT and VMS
436 servers.
437
438 ** It is now possible to recurse through FTP sites where logging in
439 puts you in some directory other than '/'.
440
441 ** You may now use `~' to mean home directory in `.wgetrc'.  For
442 example, `load_cookies = ~/.netscape/cookies.txt' works as you would
443 expect.
444
445 ** The HTML parser has been rewritten.  The new one works more
446 reliably, allows finer-grained control over which tags and attributes
447 are detected, and has better support for some features like correctly
448 skipping comments and declarations, decoding entities, etc.  It is
449 also more general.
450
451 ** <meta name="robots"> tags are now respected.
452
453 ** Wget's internal tables now use hash tables instead of linked lists
454 where appropriate.  This results in huge speedups when retrieving
455 large sites (thousands of documents).
456
457 ** Wget now has a man page, automatically generated from the Texinfo
458 documentation.  (The last version that shipped with a man page was
459 1.4.5).  To get this, you need to have pod2man from the Perl
460 distribution installed on your system.
461 \f
462 * Changes in Wget 1.6
463
464 ** Administrative changes.
465
466 *** Maintainership.  Due to Hrvoje being plagued with a "real job",
467 Dan Harkless is the most active maintainer (not that he doesn't have a
468 real job as well).  Hrvoje still participates occasionally, and both
469 are being helped by many other people.
470
471 *** Web page.  Thanks to Jan Prikryl, Wget has an "official" web page.
472 Take a look at:
473
474     http://sunsite.dk/wget/
475
476 *** Anonymous CVS.  Thanks to ever-helpful Karsten Thygesen, Wget
477 sources are now available at an anonymous CVS server.  Take a look at
478 the web page for downloading instructions.
479
480 ** New -K / --backup-converted / backup_converted = on option causes files
481 modified due to -k to be saved with a .orig prefix before being changed.  When
482 using -N as well, it is these .orig files that are compared against the server.
483
484 ** New --follow-tags / follow_tags = ... option allows you to restrict
485 Wget to following only certain HTML tags when doing a recursive
486 retrieval.  -G / --ignore-tags / ignore_tags = ... is just the
487 opposite -- all tags but the ones you specify will be followed.
488
489 ** New --waitretry / waitretry = SECONDS option allows waiting between retries
490 of failed downloads.  Wget will use "linear" backoff, waiting 1 second after the
491 first failure, 2 after the second, up to SECONDS.  waitretry is set to 10 by
492 default in the system wgetrc.
493
494 ** New -p / --page-requisites / page_requisites = on option causes
495 Wget to download all ancillary files necessary to display a given HTML
496 page properly (e.g. inlined images).
497
498 ** New -E / --html-extension / html_extension = on option causes Wget
499 to append ".html" to text/html filenames not ending in regexp
500 "\.[Hh][Tt][Mm][Ll]?".
501
502 ** New type of .wgetrc command -- "lockable Boolean".  Can be set to on, off,
503 always, or never.  This allows the .wgetrc to override the commandline.  So far,
504 passive_ftp is the only .wgetrc command which takes a lockable Boolean.
505
506 ** A number of new translation files have been added.
507
508 ** New --bind-address / bind_address = <address> option for people on hosts
509 bound to multiple IP addresses.
510
511 ** wget now accepts (illegal per HTTP spec) relative URLs in HTTP redirects.
512 \f
513 * Wget 1.5.3 is a bugfix release with no user-visible changes.
514 \f
515 * Wget 1.5.2 is a bugfix release with no user-visible changes.
516 \f
517 * Wget 1.5.1 is a bugfix release with no user-visible changes.
518 \f
519 * Changes in Wget 1.5.0
520
521 ** Wget speaks many languages!
522
523 On systems with gettext(), Wget will output messages in the language
524 set by the current locale, if available.  At this time we support
525 Czech, German, Croatian, Italian, Norwegian and Portuguese.
526
527 ** Opie (Skey) is now supported with FTP.
528
529 ** HTTP Digest Access Authentication (RFC2069) is now supported.
530
531 ** The new `-b' option makes Wget go to background automatically.
532
533 ** The `-I' and `-X' options now accept wildcard arguments.
534
535 ** The `-w' option now accepts suffixes `s' for seconds, `m' for
536 minutes, `h' for hours, `d' for days and `w' for weeks.
537
538 ** Upon getting SIGHUP, the whole previous log is now copied to
539 `wget-log'.
540
541 ** Wget now understands proxy settings with explicit usernames and
542 passwords, e.g. `http://user:password@proxy.foo.com/'.
543
544 ** You can use the new `--cut-dirs' option to make Wget create less
545 directories.
546
547 ** The `;type=a' appendix to FTP URLs is now recognized.  For
548 instance, the following command will retrieve the welcoming message in
549 ASCII type transfer:
550
551     wget "ftp://ftp.somewhere.com/welcome.msg;type=a"
552
553 ** `--help' and `--version' options have been redone to to conform to
554 standards set by other GNU utilities.
555
556 ** Wget should now be compilable under MS Windows environment.  MS
557 Visual C++ and Watcom C have been used successfully.
558
559 ** If the file length is known, percentages are displayed during
560 download.
561
562 ** The manual page, now hopelessly out of date, is no longer
563 distributed with Wget.
564 \f
565 * Wget 1.4.5 is a bugfix release with no user-visible changes.
566 \f
567 * Wget 1.4.4 is a bugfix release with no user-visible changes.
568 \f
569 * Changes in Wget 1.4.3
570
571 ** Wget is now a GNU utility.
572
573 ** Can do passive FTP.
574
575 ** Reads .netrc.
576
577 ** Info documentation expanded.
578
579 ** Compiles on pre-ANSI compilers.
580
581 ** Global wgetrc now goes to /usr/local/etc (i.e. $sysconfdir).
582
583 ** Lots of bugfixes.
584 \f
585 * Changes in Wget 1.4.2
586
587 ** New mirror site at ftp://sunsite.auc.dk/pub/infosystems/wget/,
588 thanks to Karsten Thygesen.
589
590 ** Mailing list!  Mail to wget-request@sunsite.auc.dk to subscribe.
591
592 ** New option --delete-after for proxy prefetching.
593
594 ** New option --retr-symlinks to retrieve symbolic links like plain
595 files.
596
597 ** rmold.pl -- script to remove files deleted on the remote server
598
599 ** --convert-links should work now.
600
601 ** Minor bugfixes.
602 \f
603 * Changes in Wget 1.4.1
604
605 ** Minor bugfixes.
606
607 ** Added -I (the opposite of -X).
608
609 ** Dot tracing is now customizable; try wget --dot-style=binary
610 \f
611 * Changes in Wget 1.4.0
612
613 ** Wget 1.4.0 [formerly known as Geturl] is an extensive rewrite of
614 Geturl.  Although many things look suspiciously similar, most of the
615 stuff was rewritten, like recursive retrieval, HTTP, FTP and mostly
616 everything else.  Wget should be now easier to debug, maintain and,
617 most importantly, use.
618
619 ** Recursive HTTP should now work without glitches, even with Location
620 changes, server-generated directory listings and other naughty stuff.
621
622 ** HTTP regetting is supported on servers that support Range
623 specification. WWW authorization is supported -- try
624 wget http://user:password@hostname/
625
626 ** FTP support was rewritten and widely enhanced. Globbing should now
627 work flawlessly. Symbolic links are created locally. All the
628 information the Unix-style ls listing can give is now recognized.
629
630 ** Recursive FTP is supported, e.g.
631     wget -r ftp://gnjilux.cc.fer.hr/pub/unix/util/
632
633 ** You can specify "rejected" directories, to which you do not want to
634 enter, e.g. with wget -X /pub
635
636 ** Time-stamping is supported, with both HTTP and FTP. Try wget -N URL.
637
638 ** A new texinfo reference manual is provided.  It can be read with
639 Emacs, standalone info, or converted to HTML, dvi or postscript.
640
641 ** Fixed a long-standing bug, so that Wget now works over SLIP
642 connections.
643
644 ** You can have a system-wide wgetrc (/usr/local/lib/wgetrc by
645 default). Settings in $HOME/.wgetrc override the global ones, of
646 course :-)
647
648 ** You can set up quota in .wgetrc to prevent sucking too much
649 data. Try `quota = 5M' in .wgetrc (or quota = 100K if you want your
650 sysadmin to like you).
651
652 ** Download rate is printed after retrieval.
653
654 ** Wget now sends the `Referer' header when retrieving
655 recursively.
656
657 ** With the new --no-parent option Wget can retrieve FTP recursively
658 through a proxy server.
659
660 ** HTML parser, as well as the whole of Wget was rewritten to be much
661 faster and less memory-consuming (yes, both).
662
663 ** Absolute links can be converted to relative links locally. Check
664 wget -k.
665
666 ** Wget catches hangup, filtering the output to a log file and
667 resuming work. Try kill -HUP %?wget.
668
669 ** User-defined headers can be sent.  Try
670
671     wget http://fly.cc.her.hr/ --header='Accept-Charset: iso-8859-2'
672
673 ** Acceptance/Rejection lists may contain wildcards.
674
675 ** Wget can display HTTP headers and/or FTP server response with the
676 new `-S' option.  It can save the original HTTP headers with `-s'.
677
678 ** socks library is now supported (thanks to Antonio Rosella
679 <Antonio.Rosella@agip.it>). Configure with --with-socks.
680
681 ** There is a nicer display of REST-ed output.
682
683 ** Many new options (like -x to force directory hierarchy, or -m to
684 turn on mirroring options).
685
686 ** Wget is now distributed under GNU General Public License (GPL).
687
688 ** Lots of small features I can't remember. :-)
689
690 ** A host of bugfixes.
691 \f
692 * Changes in Geturl 1.3
693
694 ** Added FTP globbing support (ftp://fly.cc.fer.hr/*)
695
696 ** Added support for no_proxy
697
698 ** Added support for ftp://user:password@host/
699
700 ** Added support for %xx in URL syntax
701
702 ** More natural command-line options
703
704 ** Added -e switch to execute .geturlrc commands from the command-line
705
706 ** Added support for robots.txt
707
708 ** Fixed some minor bugs
709 \f
710 * Geturl 1.2 is a bugfix release with no user-visible changes.
711 \f
712 * Changes in Geturl 1.1
713
714 ** REST supported in FTP
715
716 ** Proxy servers supported
717
718 ** GNU getopt used, which enables command-line arguments to be ordered
719 as you wish, e.g.  geturl http://fly.cc.fer.hr/ -vo log is the same as
720 geturl -vo log http://fly.cc.fer.hr/
721
722 ** Netscape-compatible URL syntax for HTTP supported: host[:port]/dir/file
723
724 ** NcFTP-compatible colon URL syntax for FTP supported: host:/dir/file
725
726 ** <base href="xxx"> supported
727
728 ** autoconf supported
729 \f
730 ----------------------------------------------------------------------
731 Copyright information:
732
733 Copyright (C) 1997-2005 Free Software Foundation, Inc.
734
735    Permission is granted to anyone to make or distribute verbatim
736    copies of this document as received, in any medium, provided that
737    the copyright notice and this permission notice are preserved, thus
738    giving the recipient permission to redistribute in turn.
739
740    Permission is granted to distribute modified versions of this
741    document, or of portions of it, under the above conditions,
742    provided also that they carry prominent notices stating who last
743    changed them.