]> sjero.net Git - wget/blob - NEWS
Exit with failure if -k is specified and -O is not a regular file.
[wget] / NEWS
1 GNU Wget NEWS -- history of user-visible changes.
2
3 Copyright (C) 1997, 1998, 1999, 2000, 2001, 2002, 2003, 2004, 2005,
4 2006, 2007, 2008, 2009, 2010 Free Software Foundation, Inc.
5 See the end for copying conditions.
6
7 Please send GNU Wget bug reports to <bug-wget@gnu.org>.
8 \f
9 * Changes in Wget X.Y.Z
10
11 ** Support HTTP/1.1
12
13 ** Fix some portability issues.
14
15 ** Handle properly malformed status line in a HTTP response.
16
17 ** Ignore zero length domains in $no_proxy.
18
19 ** Set new cookies after an authorization failure.
20
21 ** Exit with failure if -k is specified and -O is not a regular file.
22 \f
23 * Changes in Wget 1.12
24
25 ** Mailing list MOVED to bug-wget@gnu.org
26
27 ** SECURITY FIX: It had been possible to trick Wget into accepting
28 SSL certificates that don't match the host name, through the trick of
29 embedding NUL characters into the certs' common name. Fixed by Joao
30 Ferreira <joao@joaoff.com>.
31
32 ** Added support for CSS. This includes:
33      - Parsing links from CSS files, and from CSS content found in HTML
34        style tags and attributes.
35      - Supporting conversion of links found within CSS content, when
36        --convert-links is specified.
37      - Ensuring that CSS files end in the ".css" filename extension,
38        when --convert-links is specified.
39
40    CSS support in Wget is thanks to Ted Mielczarek
41    <ted.mielczarek@gmail.com>.
42
43 ** Added support for Internationalized Resource Identifiers (IRIs, RFC
44 3987). When support is enabled (requires libidn and libiconv), links
45 with non-ASCII bytes are translated from their source encoding to UTF-8
46 before percent-encoding.  IRI support was added by Saint Xavier
47 <wget@sxav.eu>, as his project for the Google Summer of Code.
48
49 ** Wget now provides more sensible exit status codes when downloads
50 don't proceed as expected (see the manual).
51
52 ** --default-page option (and associated wgetrc command) added to
53 support alternative default names for index.html.
54
55 ** --ask-password option (and associated wgetrc command) added to
56 support password prompts at the console.
57
58 ** The --input-file option now also handles retrieving links from
59 an external file.
60
61 ** The output generated by the --version option now includes
62 information on how it was built, and the set of configure-time options
63 that were selected.
64
65 ** --html-extension has been renamed to --adjust-extension, to reflect
66 the fact that it now also applies to CSS content. --html-extension is
67 still acceptable, but is now deprecated.
68
69 ** An "ascii" specifier is now accepted by --restrict-file-names, which
70 forces the percent-encoding of all non-ASCII bytes
71
72 ** Several previously existing, but undocumented .wgetrc options are
73 now documented: save_headers, spider, and user_agent,
74 auth_no_challenge, and keep_session_cookies. Also added documentation
75 for the "lowercase" and "uppercase" values for --restrict-file-names, which had been present since Wget 1.11.
76 \f
77 * Changes in Wget 1.11.4
78
79 ** Fixed an issue (apparently a regression) where -O would refuse to
80 download when -nc was given, even though the file didn't exist.
81
82 ** Fixed a situation where Wget could abort with --continue if the
83 remote server gives a content-length of zero when the file exists
84 locally with content.
85
86 ** Fixed a crash on some systems, due to Wget casting a pointer-to-long
87 to a pointer-to-time_t.
88
89 ** Translation updates for Catalan.
90 \f
91 * Changes in Wget 1.11.3
92
93 ** Downgraded -N with -O to a warning, rather than an error.
94
95 ** Translation updates
96 \f
97 * Changes in Wget 1.11.2
98
99 ** Fixed a problem in authenticating over HTTPS through a proxy.
100 (Regression in 1.11 over 1.10.2.)
101
102 ** The combination of -r or -p with -O, which was disallowed in 1.11,
103 has been downgraded to a warning in 1.11.2. (-O and -N, which was never
104 meaningful, is still an error.)
105
106 ** Further improvements to progress bar displays in non-English locales
107 (too many spaces could be inserted, causing the display to scroll).
108
109 ** Successive invocations of Wget on FTP URLS, with --no-remove-listing
110 and --continue, was causing Wget to append, rather than replace,
111 information in the .listing file, and thereby download the same files
112 multiple times. This has been fixed in 1.11.2.
113
114 ** Wget 1.11 no longer allowed ".." to persist at the beginning of URLs,
115 for improved conformance with RFC 3986. However, this behavior presents
116 problems for some FTP setups, and so they are now preserved again, for
117 FTP URLs only.
118 \f
119 * Changes in Wget 1.11.1.
120
121 ** Interrupted downloads no longer result in renaming the file
122 (regression in 1.11 over 1.10.2).
123
124 ** Progress bar now displays correctly in non-English locales (and a
125 related assertion failure was fixed).
126
127 ** Wget no longer issues a GET request over HTTP for files it should
128 know it's not going to download (regression in 1.11 over 1.10.2).
129
130 ** Added option --auth-no-challenge, to support broken pre-1.11
131 authentication-before-server-challenge, which turns out to still be
132 useful for some limited cases.
133
134 ** Documentation of accept/reject lists in the manual's "Types of
135 Files" section now explains various aspects of their behavior that may
136 be surprising, and notes that they may change in the future.
137
138 ** Documentation of --no-parents now explains how a trailing slash, or
139 lack thereof, in the specified URL, will affect behavior.
140 \f
141 * Changes in Wget 1.11.
142
143 ** Timestamping now uses the value from the most recent HTTP response,
144 rather than the first one it got.
145
146 ** Authentication information is no longer sent as part of the Referer
147 header in recursive fetches.
148
149 ** No authentication credentials are sent until a challenge is issued,
150 for improved security. Authentication handling is still not
151 RFC-compliant, as once a Basic challenge has been received, it will
152 assume it can send credentials to any URL at that same host, and not
153 just the ones at or below the original authenticated location.
154 Credentials for Digest authentication are still never saved or issued
155 automatically, and continue to require a challenge for each resource.
156
157 ** Added --max-redirect option, allowing the user to specify what should
158 be the maximum number of HTTP redirects to follow.
159
160 ** Wget now supports saving HTTP downloads using file names specified by
161 the `Content-Disposition' header.  This is a standard way of specifying
162 the file name used by many web dynamically generated pages. However, the
163 current implementation is inefficient, and known to have bugs. It is
164 EXPERIMENTAL only, and not enabled by default. Use --content-disposition
165 to enable it.
166
167 ** The new option `--ignore-case' makes Wget ignore case when
168 matching files, directories, and wildcards.  This affects the -X, -I,
169 -A, and -R options, as well as globbing in FTP URLs.
170
171 ** ETA projection is now displayed in "dot" progress output as well as
172 in the default progress bar.  (The dot progress is used by default when
173 logging Wget's output to file using the `-o' option.)
174
175 ** The "lockable boolean" argument type is no longer supported.  It
176 was only used by the passive_ftp .wgetrc setting.  If you're running
177 broken scripts or Perl modules that unconditionally specify
178 `--passive-ftp' and your firewall disallows it, you can override them
179 by replacing wget with a script that execs wget "$@" --no-passive-ftp.
180
181 ** The source code has been migrated to Mercurial. The repositories are
182 available at http://hg.addictivecode.org/. Prior to this, the source
183 code was hosted on Subversion (migrated from the original CVS); you can
184 still get access to older tags and branches for Wget in the Subversion
185 repository at http://addictivecode.org/svn/wget/.
186 \f
187 * Changes in Wget 1.10.
188
189 ** Downloading files larger than 2GB, sometimes referred to as "large
190 files", now works on systems that support them.  This includes the
191 majority of modern Unixes, as well as MS Windows.
192
193 ** IPv6 is now supported by Wget.  Unlike the experimental code in
194 1.9, this version supports dual-family systems.  The new flags
195 `--inet4' and `--inet6' (or `-4' and `-6' for short) force the use of
196 IPv4 and IPv6 respectively.  Note that IPv6 support has not yet been
197 tested on Windows.
198
199 ** Microsoft's proprietary "NTLM" method of HTTP authentication is now
200 supported.  This authentication method is undocumented and only used
201 by IIS.  Note that *proxy* authentication is not supported in this
202 release; you can only authenticate to the target web site.
203
204 ** Wget no longer truncates partially downloaded files when download
205 has to start over because the server doesn't support Range.  Instead,
206 with such servers Wget now simply ignores the data up to the byte
207 where the last attempt left off, and only then continues appending to
208 the file.  That way the downloaded file never shrinks, and download
209 retries from servers without support for partial downloads work even
210 when downloading to stdout.
211
212 ** SSL/TLS changes:
213
214 *** SSL/TLS downloads now attempt to verify the server's certificate
215 against the recognized certificate authorities.  This requires CA
216 certificates to have been installed in a location visible to the
217 OpenSSL library.  If this is not the case, you can get the bundle
218 yourself from a source you trust (for example, the bundle extracted
219 from Mozilla available at http://curl.haxx.se/docs/caextract.html),
220 and point Wget to the PEM file using the `--ca-certificate'
221 command-line option or the corresponding `.wgetrc' command.
222
223 *** Secure downloads now verify that the host name in the URL matches
224 the "common name" in the certificate presented by the server.
225
226 *** Although the above checks provide more secure downloads, they
227 unavoidably break interoperability with some sites that worked with
228 previous versions, particularly those using self-signed, expired, or
229 otherwise invalid certificates.  If you encounter "certificate
230 verification" errors or complaints that "common name doesn't match
231 requested host name" and are convinced of the site's authenticity, you
232 can use `--no-check-certificate' to bypass both checks.
233
234 *** Talking to SSL/TLS servers over proxies now actually works.
235 Previous versions of Wget erroneously sent GET requests for https
236 URLs.  Wget 1.10 utilizes the CONNECT method designed for this
237 purpose.
238
239 *** The SSL/TLS-related options have been redesigned and, for the
240 first time, documented in the manual.  The old, undocumented, options
241 are no longer supported.
242
243 ** Passive FTP is now the default FTP transfer mode.  Use
244 `--no-passive-ftp' or specify `passive_ftp = off' in your init file to
245 revert to the old behavior.
246
247 ** The `--header' option can now be used to override generated
248 headers.  For example, `wget --header="Host: foo.bar"
249 http://127.0.0.1' tells Wget to connect to localhost, but to specify
250 "foo.bar" in the `Host' header.  In previous versions such use of
251 `--header' lead to duplicate headers in HTTP requests.
252
253 ** The responses without headers, aka "HTTP 0.9" responses, are
254 detected and handled.  Although HTTP 0.9 has long been obsolete, it is
255 still occasionally used, sometimes by accident.
256
257 ** The progress bar is now updated regularly even when the data does
258 not arrive from the network.
259
260 ** Wget no longer preserves permissions of files retrieved by FTP by
261 default.  Anonymous FTP servers frequently use permissions like "664",
262 which might not be what the user wants.  The new option
263 `--preserve-permissions' and the corresponding `.wgetrc' variable can
264 be used to revert to the old behavior.
265
266 ** The new option `--protocol-directories' instructs Wget to also use
267 the protocol name as a directory component of local file names.
268
269 ** Options that previously unconditionally set or unset various flags
270 are now boolean options that can be invoked as either `--OPTION' or
271 `--no-OPTION'.  Options that required an argument "on" or "off" have
272 also been changed this way, but they still accept the old syntax for
273 backward compatibility.  For example, instead of `--glob=off' you can
274 write `--no-glob'.
275
276 Allowing `--no-OPTION' for every `--OPTION' and the other way around
277 is useful because it allows the user to override non-default behavior
278 specified via `.wgetrc'.
279
280 ** The new option `--keep-session-cookies' causes `--save-cookies' to
281 save session cookies (normally only kept in memory) along with the
282 permanent ones.  This is useful because many sites track important
283 information, such as whether the user has authenticated, in session
284 cookies.  With this option multiple Wget runs are treated as a single
285 browser session.
286
287 ** Wget now supports the --ftp-user and --ftp-password command
288 switches to set username and password for FTP, and the --user and
289 --password command switches to set username and password for both FTP
290 and HTTP.  The --http-passwd and --proxy-passwd command switches have
291 been renamed to --http-password and --proxy-password respectively, and
292 the related http_passwd and proxy_passwd .wgetrc commands to
293 http_password and proxy_password respectively.  The login and passwd
294 .wgetrc commands have been deprecated.
295
296 * `wget -b' now works correctly under Windows.
297 \f
298 * Wget 1.9.1 is a bugfix release with no user-visible changes.
299 \f
300 * Changes in Wget 1.9.
301
302 ** It is now possible to specify that POST method be used for HTTP
303 requests.  For example, `wget --post-data="id=foo&data=bar" URL' will
304 send a POST request with the specified contents.
305
306 ** IPv6 support is available, although it's still experimental.
307
308 ** The `--timeout' option now also affects DNS lookup and establishing
309 the TCP connection.  Previously it only affected reading and writing
310 data.  Those three timeouts can be set separately using
311 `--dns-timeout', `--connection-timeout', and `--read-timeout',
312 respectively.
313
314 ** Download speed shown by the progress bar is based on the data
315 recently read, rather than the average speed of the entire download.
316 The ETA projection is still based on the overall average.
317
318 ** It is now possible to connect to FTP servers through FWTK
319 firewalls.  Set ftp_proxy to an FTP URL, and Wget will automatically
320 log on to the proxy as "username@host".
321
322 ** The new option `--retry-connrefused' makes Wget retry downloads
323 even in the face of refused connections, which are otherwise
324 considered a fatal error.
325
326 ** The new option `--no-dns-cache' may be used to prevent Wget from
327 caching DNS lookups.
328
329 ** Wget no longer escapes characters in local file names based on
330 whether they're appropriate in URLs.  Escaping can still occur for
331 nonprintable characters or for '/', but no longer for frequent
332 characters such as space.  You can use the new option
333 --restrict-file-names to relax or strengthen these rules, which can be
334 useful if you dislike the default or if you're downloading to
335 non-native partitions.
336
337 ** Handling of HTML comments has been dumbed down to conform to what
338 users expect and other browsers do: instead of being treated as SGML
339 declaration, a comment is terminated at the first occurrence of "-->".
340 Use `--strict-comments' to revert to the old behavior.
341
342 ** Wget now correctly handles relative URIs that begin with "//", such
343 as "//img.foo.com/foo.jpg".
344
345 ** Boolean options in `.wgetrc' and on the command line now accept
346 values "yes" and "no" along with the traditional "on" and "off".
347
348 ** It is now possible to specify decimal values for timeouts, waiting
349 periods, and download rate.  For instance, `--wait=0.5' now works as
350 expected, as does `--dns-timeout=0.5' and even `--limit-rate=2.5k'.
351 \f
352 * Wget 1.8.2 is a bugfix release with no user-visible changes.
353 \f
354 * Wget 1.8.1 is a bugfix release with no user-visible changes.
355 \f
356 * Changes in Wget 1.8.
357
358 ** A new progress indicator is now available and used by default.
359 You can choose the progress bar type with `--progress=TYPE'.  Two
360 types are available, "bar" (the new default), and "dot" (the old
361 dotted indicator).  You can permanently revert to the old progress
362 indicator by putting `progress = dot' in your `.wgetrc'.
363
364 ** You can limit the download rate of the retrieval using the
365 `--limit-rate' option.  For example, `wget --limit-rate=15k URL' will
366 tell Wget not to download the body of the URL faster than 15 kilobytes
367 per second.
368
369 ** Recursive retrieval and link conversion have been revamped:
370
371 *** Wget now traverses links breadth-first.  This makes the
372 calculation of depth much more reliable than before.  Also, recursive
373 downloads are faster and consume *significantly* less memory than
374 before.
375
376 *** Links are converted only when the entire retrieval is complete.
377 This is the only safe thing to do, as only then is it known what URLs
378 have been downloaded.
379
380 *** BASE tags are handled correctly when converting links.  Since Wget
381 already resolves <base href="..."> when resolving handling URLs, link
382 conversion now makes the BASE tags point to an empty string.
383
384 *** HTML anchors are now handled correctly.  Links to an anchor in the
385 same document (<a href="#anchorname">), which used to confuse Wget,
386 are now converted correctly.
387
388 *** When in page-requisites (-p) mode, no-parent (-np) is ignored when
389 retrieving for inline images, stylesheets, and other documents needed
390 to display the page.
391
392 *** Page-requisites (-p) mode now works with frames.  In other words,
393 `wget -p URL-THAT-USES-FRAMES' will now download the frame HTML files,
394 and all the files that they need to be displayed properly.
395
396 ** `--base' now works conjunction with `--input-file', providing a
397 base for each URL and thereby allowing the URLs in the file to be
398 relative.
399
400 ** If a host has more than one IP address, Wget uses the other
401 addresses when accessing the first one fails.
402
403 ** Host directories now contain port information if the URL is at a
404 non-standard port.
405
406 ** Wget now supports the robots.txt directives specified in
407 <http://www.robotstxt.org/wc/norobots-rfc.txt>.
408
409 ** URL parser has been fixed, especially the infamous overzealous
410 quoting.  Wget no longer dequotes reserved characters, e.g. `%3F' is
411 no longer translated to `?', nor `%2B' to `+'.  Unsafe characters
412 which are not reserved are still escaped, of course.
413
414 ** No more than 20 successive redirections are allowed.
415 \f
416 * Wget 1.7.1 is a bugfix release with no user-visible changes.
417 \f
418 * Changes in Wget 1.7.
419
420 ** SSL (`https') pages now work if you compile Wget with SSL support;
421 use the `--with-ssl' configure flag.  You need to have OpenSSL
422 installed.
423
424 ** Cookies are now supported.  Wget will accept cookies sent by the
425 server and return them in later requests.  Additionally, it can load
426 and save cookies to disk, in the same format that Netscape uses.
427
428 ** "Keep-alive" (persistent) HTTP connections are now supported.
429 Using keep-alive allows Wget to share one TCP/IP connection for
430 many retrievals, making multiple-file downloads faster and less
431 stressing for the server and the network.
432
433 ** Wget now recognizes FTP directory listings generated by NT and VMS
434 servers.
435
436 ** It is now possible to recurse through FTP sites where logging in
437 puts you in some directory other than '/'.
438
439 ** You may now use `~' to mean home directory in `.wgetrc'.  For
440 example, `load_cookies = ~/.netscape/cookies.txt' works as you would
441 expect.
442
443 ** The HTML parser has been rewritten.  The new one works more
444 reliably, allows finer-grained control over which tags and attributes
445 are detected, and has better support for some features like correctly
446 skipping comments and declarations, decoding entities, etc.  It is
447 also more general.
448
449 ** <meta name="robots"> tags are now respected.
450
451 ** Wget's internal tables now use hash tables instead of linked lists
452 where appropriate.  This results in huge speedups when retrieving
453 large sites (thousands of documents).
454
455 ** Wget now has a man page, automatically generated from the Texinfo
456 documentation.  (The last version that shipped with a man page was
457 1.4.5).  To get this, you need to have pod2man from the Perl
458 distribution installed on your system.
459 \f
460 * Changes in Wget 1.6
461
462 ** Administrative changes.
463
464 *** Maintainership.  Due to Hrvoje being plagued with a "real job",
465 Dan Harkless is the most active maintainer (not that he doesn't have a
466 real job as well).  Hrvoje still participates occasionally, and both
467 are being helped by many other people.
468
469 *** Web page.  Thanks to Jan Prikryl, Wget has an "official" web page.
470 Take a look at:
471
472     http://sunsite.dk/wget/
473
474 *** Anonymous CVS.  Thanks to ever-helpful Karsten Thygesen, Wget
475 sources are now available at an anonymous CVS server.  Take a look at
476 the web page for downloading instructions.
477
478 ** New -K / --backup-converted / backup_converted = on option causes files
479 modified due to -k to be saved with a .orig prefix before being changed.  When
480 using -N as well, it is these .orig files that are compared against the server.
481
482 ** New --follow-tags / follow_tags = ... option allows you to restrict
483 Wget to following only certain HTML tags when doing a recursive
484 retrieval.  -G / --ignore-tags / ignore_tags = ... is just the
485 opposite -- all tags but the ones you specify will be followed.
486
487 ** New --waitretry / waitretry = SECONDS option allows waiting between retries
488 of failed downloads.  Wget will use "linear" backoff, waiting 1 second after the
489 first failure, 2 after the second, up to SECONDS.  waitretry is set to 10 by
490 default in the system wgetrc.
491
492 ** New -p / --page-requisites / page_requisites = on option causes
493 Wget to download all ancillary files necessary to display a given HTML
494 page properly (e.g. inlined images).
495
496 ** New -E / --html-extension / html_extension = on option causes Wget
497 to append ".html" to text/html filenames not ending in regexp
498 "\.[Hh][Tt][Mm][Ll]?".
499
500 ** New type of .wgetrc command -- "lockable Boolean".  Can be set to on, off,
501 always, or never.  This allows the .wgetrc to override the commandline.  So far,
502 passive_ftp is the only .wgetrc command which takes a lockable Boolean.
503
504 ** A number of new translation files have been added.
505
506 ** New --bind-address / bind_address = <address> option for people on hosts
507 bound to multiple IP addresses.
508
509 ** wget now accepts (illegal per HTTP spec) relative URLs in HTTP redirects.
510 \f
511 * Wget 1.5.3 is a bugfix release with no user-visible changes.
512 \f
513 * Wget 1.5.2 is a bugfix release with no user-visible changes.
514 \f
515 * Wget 1.5.1 is a bugfix release with no user-visible changes.
516 \f
517 * Changes in Wget 1.5.0
518
519 ** Wget speaks many languages!
520
521 On systems with gettext(), Wget will output messages in the language
522 set by the current locale, if available.  At this time we support
523 Czech, German, Croatian, Italian, Norwegian and Portuguese.
524
525 ** Opie (Skey) is now supported with FTP.
526
527 ** HTTP Digest Access Authentication (RFC2069) is now supported.
528
529 ** The new `-b' option makes Wget go to background automatically.
530
531 ** The `-I' and `-X' options now accept wildcard arguments.
532
533 ** The `-w' option now accepts suffixes `s' for seconds, `m' for
534 minutes, `h' for hours, `d' for days and `w' for weeks.
535
536 ** Upon getting SIGHUP, the whole previous log is now copied to
537 `wget-log'.
538
539 ** Wget now understands proxy settings with explicit usernames and
540 passwords, e.g. `http://user:password@proxy.foo.com/'.
541
542 ** You can use the new `--cut-dirs' option to make Wget create less
543 directories.
544
545 ** The `;type=a' appendix to FTP URLs is now recognized.  For
546 instance, the following command will retrieve the welcoming message in
547 ASCII type transfer:
548
549     wget "ftp://ftp.somewhere.com/welcome.msg;type=a"
550
551 ** `--help' and `--version' options have been redone to to conform to
552 standards set by other GNU utilities.
553
554 ** Wget should now be compilable under MS Windows environment.  MS
555 Visual C++ and Watcom C have been used successfully.
556
557 ** If the file length is known, percentages are displayed during
558 download.
559
560 ** The manual page, now hopelessly out of date, is no longer
561 distributed with Wget.
562 \f
563 * Wget 1.4.5 is a bugfix release with no user-visible changes.
564 \f
565 * Wget 1.4.4 is a bugfix release with no user-visible changes.
566 \f
567 * Changes in Wget 1.4.3
568
569 ** Wget is now a GNU utility.
570
571 ** Can do passive FTP.
572
573 ** Reads .netrc.
574
575 ** Info documentation expanded.
576
577 ** Compiles on pre-ANSI compilers.
578
579 ** Global wgetrc now goes to /usr/local/etc (i.e. $sysconfdir).
580
581 ** Lots of bugfixes.
582 \f
583 * Changes in Wget 1.4.2
584
585 ** New mirror site at ftp://sunsite.auc.dk/pub/infosystems/wget/,
586 thanks to Karsten Thygesen.
587
588 ** Mailing list!  Mail to wget-request@sunsite.auc.dk to subscribe.
589
590 ** New option --delete-after for proxy prefetching.
591
592 ** New option --retr-symlinks to retrieve symbolic links like plain
593 files.
594
595 ** rmold.pl -- script to remove files deleted on the remote server
596
597 ** --convert-links should work now.
598
599 ** Minor bugfixes.
600 \f
601 * Changes in Wget 1.4.1
602
603 ** Minor bugfixes.
604
605 ** Added -I (the opposite of -X).
606
607 ** Dot tracing is now customizable; try wget --dot-style=binary
608 \f
609 * Changes in Wget 1.4.0
610
611 ** Wget 1.4.0 [formerly known as Geturl] is an extensive rewrite of
612 Geturl.  Although many things look suspiciously similar, most of the
613 stuff was rewritten, like recursive retrieval, HTTP, FTP and mostly
614 everything else.  Wget should be now easier to debug, maintain and,
615 most importantly, use.
616
617 ** Recursive HTTP should now work without glitches, even with Location
618 changes, server-generated directory listings and other naughty stuff.
619
620 ** HTTP regetting is supported on servers that support Range
621 specification. WWW authorization is supported -- try
622 wget http://user:password@hostname/
623
624 ** FTP support was rewritten and widely enhanced. Globbing should now
625 work flawlessly. Symbolic links are created locally. All the
626 information the Unix-style ls listing can give is now recognized.
627
628 ** Recursive FTP is supported, e.g.
629     wget -r ftp://gnjilux.cc.fer.hr/pub/unix/util/
630
631 ** You can specify "rejected" directories, to which you do not want to
632 enter, e.g. with wget -X /pub
633
634 ** Time-stamping is supported, with both HTTP and FTP. Try wget -N URL.
635
636 ** A new texinfo reference manual is provided.  It can be read with
637 Emacs, standalone info, or converted to HTML, dvi or postscript.
638
639 ** Fixed a long-standing bug, so that Wget now works over SLIP
640 connections.
641
642 ** You can have a system-wide wgetrc (/usr/local/lib/wgetrc by
643 default). Settings in $HOME/.wgetrc override the global ones, of
644 course :-)
645
646 ** You can set up quota in .wgetrc to prevent sucking too much
647 data. Try `quota = 5M' in .wgetrc (or quota = 100K if you want your
648 sysadmin to like you).
649
650 ** Download rate is printed after retrieval.
651
652 ** Wget now sends the `Referer' header when retrieving
653 recursively.
654
655 ** With the new --no-parent option Wget can retrieve FTP recursively
656 through a proxy server.
657
658 ** HTML parser, as well as the whole of Wget was rewritten to be much
659 faster and less memory-consuming (yes, both).
660
661 ** Absolute links can be converted to relative links locally. Check
662 wget -k.
663
664 ** Wget catches hangup, filtering the output to a log file and
665 resuming work. Try kill -HUP %?wget.
666
667 ** User-defined headers can be sent.  Try
668
669     wget http://fly.cc.her.hr/ --header='Accept-Charset: iso-8859-2'
670
671 ** Acceptance/Rejection lists may contain wildcards.
672
673 ** Wget can display HTTP headers and/or FTP server response with the
674 new `-S' option.  It can save the original HTTP headers with `-s'.
675
676 ** socks library is now supported (thanks to Antonio Rosella
677 <Antonio.Rosella@agip.it>). Configure with --with-socks.
678
679 ** There is a nicer display of REST-ed output.
680
681 ** Many new options (like -x to force directory hierarchy, or -m to
682 turn on mirroring options).
683
684 ** Wget is now distributed under GNU General Public License (GPL).
685
686 ** Lots of small features I can't remember. :-)
687
688 ** A host of bugfixes.
689 \f
690 * Changes in Geturl 1.3
691
692 ** Added FTP globbing support (ftp://fly.cc.fer.hr/*)
693
694 ** Added support for no_proxy
695
696 ** Added support for ftp://user:password@host/
697
698 ** Added support for %xx in URL syntax
699
700 ** More natural command-line options
701
702 ** Added -e switch to execute .geturlrc commands from the command-line
703
704 ** Added support for robots.txt
705
706 ** Fixed some minor bugs
707 \f
708 * Geturl 1.2 is a bugfix release with no user-visible changes.
709 \f
710 * Changes in Geturl 1.1
711
712 ** REST supported in FTP
713
714 ** Proxy servers supported
715
716 ** GNU getopt used, which enables command-line arguments to be ordered
717 as you wish, e.g.  geturl http://fly.cc.fer.hr/ -vo log is the same as
718 geturl -vo log http://fly.cc.fer.hr/
719
720 ** Netscape-compatible URL syntax for HTTP supported: host[:port]/dir/file
721
722 ** NcFTP-compatible colon URL syntax for FTP supported: host:/dir/file
723
724 ** <base href="xxx"> supported
725
726 ** autoconf supported
727 \f
728 ----------------------------------------------------------------------
729 Copyright information:
730
731 Copyright (C) 1997-2005 Free Software Foundation, Inc.
732
733    Permission is granted to anyone to make or distribute verbatim
734    copies of this document as received, in any medium, provided that
735    the copyright notice and this permission notice are preserved, thus
736    giving the recipient permission to redistribute in turn.
737
738    Permission is granted to distribute modified versions of this
739    document, or of portions of it, under the above conditions,
740    provided also that they carry prominent notices stating who last
741    changed them.