Rename --html-extension to --adjust-extension.
[wget] / NEWS
1 GNU Wget NEWS -- history of user-visible changes.
2
3 Copyright (C) 1997, 1998, 1999, 2000, 2001, 2002, 2003, 2004, 2005,
4 2006, 2007, 2008, 2009 Free Software Foundation, Inc.
5 See the end for copying conditions.
6
7 Please send GNU Wget bug reports to <bug-wget@gnu.org>.
8 \f
9 * Changes in Wget 1.12
10
11 ** Mailing list MOVED to bug-wget@gnu.org
12
13 ** Added support for CSS. This includes:
14      - Parsing links from CSS files, and from CSS content found in HTML
15        style tags and attributes.
16      - Supporting conversion of links found within CSS content, when
17        --convert-links is specified.
18      - Ensuring that CSS files end in the ".css" filename extension,
19        when --convert-links is specified.
20
21    CSS support in Wget is thanks to Ted Mielczarek
22    <ted.mielczarek@gmail.com>.
23
24 ** Added support for Internationalized Resource Identifiers (IRIs, RFC
25 3987). When support is enabled (default), links with non-ASCII bytes
26 are translated from their source encoding to UTF-8 before percent-encoding.
27
28    IRI support was added by Saint Xavier <wget@sxav.eu>, as his
29    project for the Google Summer of Code.
30
31 ** --default-page option (and associated wgetrc command) added to
32 support alternative default names for index.html.
33
34 ** --ask-password option (and associated wgetrc command) added to
35 support password prompts at the console.
36  
37 ** The --input-file option now also handles retrieving links from
38 an external file.
39
40 ** The output generated by the --version option now includes
41 information on how it was built, and the set of configure-time options
42 that were selected.
43
44 ** --html-extension has been renamed to --adjust-extension, to reflect
45 the fact that it now also applies to CSS content..
46
47 ** An "ascii" specifier is now accepted by --restrict-file-names, which
48 forces the percent-encoding of all non-ASCII bytes
49
50 ** Several previously existing, but undocumented .wgetrc options are
51 now documented: save_headers, spider, and user_agent,
52 auth_no_challenge, and keep_session_cookies. Also added documentation
53 for the "lowercase" and "uppercase" values for --restrict-file-names, which had been present since Wget 1.11.
54 \f
55 * Changes in Wget 1.11.4
56
57 ** Fixed an issue (apparently a regression) where -O would refuse to
58 download when -nc was given, even though the file didn't exist.
59
60 ** Fixed a situation where Wget could abort with --continue if the
61 remote server gives a content-length of zero when the file exists
62 locally with content.
63
64 ** Fixed a crash on some systems, due to Wget casting a pointer-to-long
65 to a pointer-to-time_t.
66
67 ** Translation updates for Catalan.
68 \f
69 * Changes in Wget 1.11.3
70
71 ** Downgraded -N with -O to a warning, rather than an error.
72
73 ** Translation updates
74 \f
75 * Changes in Wget 1.11.2
76
77 ** Fixed a problem in authenticating over HTTPS through a proxy.
78 (Regression in 1.11 over 1.10.2.)
79
80 ** The combination of -r or -p with -O, which was disallowed in 1.11,
81 has been downgraded to a warning in 1.11.2. (-O and -N, which was never
82 meaningful, is still an error.)
83
84 ** Further improvements to progress bar displays in non-English locales
85 (too many spaces could be inserted, causing the display to scroll).
86
87 ** Successive invocations of Wget on FTP URLS, with --no-remove-listing
88 and --continue, was causing Wget to append, rather than replace,
89 information in the .listing file, and thereby download the same files
90 multiple times. This has been fixed in 1.11.2.
91
92 ** Wget 1.11 no longer allowed ".." to persist at the beginning of URLs,
93 for improved conformance with RFC 3986. However, this behavior presents
94 problems for some FTP setups, and so they are now preserved again, for
95 FTP URLs only.
96 \f
97 * Changes in Wget 1.11.1.
98
99 ** Interrupted downloads no longer result in renaming the file
100 (regression in 1.11 over 1.10.2).
101
102 ** Progress bar now displays correctly in non-English locales (and a
103 related assertion failure was fixed).
104
105 ** Wget no longer issues a GET request over HTTP for files it should
106 know it's not going to download (regression in 1.11 over 1.10.2).
107
108 ** Added option --auth-no-challenge, to support broken pre-1.11
109 authentication-before-server-challenge, which turns out to still be
110 useful for some limited cases.
111
112 ** Documentation of accept/reject lists in the manual's "Types of
113 Files" section now explains various aspects of their behavior that may
114 be surprising, and notes that they may change in the future.
115
116 ** Documentation of --no-parents now explains how a trailing slash, or
117 lack thereof, in the specified URL, will affect behavior.
118 \f
119 * Changes in Wget 1.11.
120
121 ** Timestamping now uses the value from the most recent HTTP response,
122 rather than the first one it got.
123
124 ** Authentication information is no longer sent as part of the Referer
125 header in recursive fetches.
126
127 ** No authentication credentials are sent until a challenge is issued,
128 for improved security. Authentication handling is still not
129 RFC-compliant, as once a Basic challenge has been received, it will
130 assume it can send credentials to any URL at that same host, and not
131 just the ones at or below the original authenticated location.
132 Credentials for Digest authentication are still never saved or issued
133 automatically, and continue to require a challenge for each resource.
134
135 ** Added --max-redirect option, allowing the user to specify what should
136 be the maximum number of HTTP redirects to follow.
137
138 ** Wget now supports saving HTTP downloads using file names specified by
139 the `Content-Disposition' header.  This is a standard way of specifying
140 the file name used by many web dynamically generated pages. However, the
141 current implementation is inefficient, and known to have bugs. It is
142 EXPERIMENTAL only, and not enabled by default. Use --content-disposition
143 to enable it.
144
145 ** The new option `--ignore-case' makes Wget ignore case when
146 matching files, directories, and wildcards.  This affects the -X, -I,
147 -A, and -R options, as well as globbing in FTP URLs.
148
149 ** ETA projection is now displayed in "dot" progress output as well as
150 in the default progress bar.  (The dot progress is used by default when
151 logging Wget's output to file using the `-o' option.)
152
153 ** The "lockable boolean" argument type is no longer supported.  It
154 was only used by the passive_ftp .wgetrc setting.  If you're running
155 broken scripts or Perl modules that unconditionally specify
156 `--passive-ftp' and your firewall disallows it, you can override them
157 by replacing wget with a script that execs wget "$@" --no-passive-ftp.
158
159 ** The source code has been migrated to Mercurial. The repositories are
160 available at http://hg.addictivecode.org/. Prior to this, the source
161 code was hosted on Subversion (migrated from the original CVS); you can
162 still get access to older tags and branches for Wget in the Subversion
163 repository at http://addictivecode.org/svn/wget/.
164 \f
165 * Changes in Wget 1.10.
166
167 ** Downloading files larger than 2GB, sometimes referred to as "large
168 files", now works on systems that support them.  This includes the
169 majority of modern Unixes, as well as MS Windows.
170
171 ** IPv6 is now supported by Wget.  Unlike the experimental code in
172 1.9, this version supports dual-family systems.  The new flags
173 `--inet4' and `--inet6' (or `-4' and `-6' for short) force the use of
174 IPv4 and IPv6 respectively.  Note that IPv6 support has not yet been
175 tested on Windows.
176
177 ** Microsoft's proprietary "NTLM" method of HTTP authentication is now
178 supported.  This authentication method is undocumented and only used
179 by IIS.  Note that *proxy* authentication is not supported in this
180 release; you can only authenticate to the target web site.
181
182 ** Wget no longer truncates partially downloaded files when download
183 has to start over because the server doesn't support Range.  Instead,
184 with such servers Wget now simply ignores the data up to the byte
185 where the last attempt left off, and only then continues appending to
186 the file.  That way the downloaded file never shrinks, and download
187 retries from servers without support for partial downloads work even
188 when downloading to stdout.
189
190 ** SSL/TLS changes:
191
192 *** SSL/TLS downloads now attempt to verify the server's certificate
193 against the recognized certificate authorities.  This requires CA
194 certificates to have been installed in a location visible to the
195 OpenSSL library.  If this is not the case, you can get the bundle
196 yourself from a source you trust (for example, the bundle extracted
197 from Mozilla available at http://curl.haxx.se/docs/caextract.html),
198 and point Wget to the PEM file using the `--ca-certificate'
199 command-line option or the corresponding `.wgetrc' command.
200
201 *** Secure downloads now verify that the host name in the URL matches
202 the "common name" in the certificate presented by the server.
203
204 *** Although the above checks provide more secure downloads, they
205 unavoidably break interoperability with some sites that worked with
206 previous versions, particularly those using self-signed, expired, or
207 otherwise invalid certificates.  If you encounter "certificate
208 verification" errors or complaints that "common name doesn't match
209 requested host name" and are convinced of the site's authenticity, you
210 can use `--no-check-certificate' to bypass both checks.
211
212 *** Talking to SSL/TLS servers over proxies now actually works.
213 Previous versions of Wget erroneously sent GET requests for https
214 URLs.  Wget 1.10 utilizes the CONNECT method designed for this
215 purpose.
216
217 *** The SSL/TLS-related options have been redesigned and, for the
218 first time, documented in the manual.  The old, undocumented, options
219 are no longer supported.
220
221 ** Passive FTP is now the default FTP transfer mode.  Use
222 `--no-passive-ftp' or specify `passive_ftp = off' in your init file to
223 revert to the old behavior.
224
225 ** The `--header' option can now be used to override generated
226 headers.  For example, `wget --header="Host: foo.bar"
227 http://127.0.0.1' tells Wget to connect to localhost, but to specify
228 "foo.bar" in the `Host' header.  In previous versions such use of
229 `--header' lead to duplicate headers in HTTP requests.
230
231 ** The responses without headers, aka "HTTP 0.9" responses, are
232 detected and handled.  Although HTTP 0.9 has long been obsolete, it is
233 still occasionally used, sometimes by accident.
234
235 ** The progress bar is now updated regularly even when the data does
236 not arrive from the network.
237
238 ** Wget no longer preserves permissions of files retrieved by FTP by
239 default.  Anonymous FTP servers frequently use permissions like "664",
240 which might not be what the user wants.  The new option
241 `--preserve-permissions' and the corresponding `.wgetrc' variable can
242 be used to revert to the old behavior.
243
244 ** The new option `--protocol-directories' instructs Wget to also use
245 the protocol name as a directory component of local file names.
246
247 ** Options that previously unconditionally set or unset various flags
248 are now boolean options that can be invoked as either `--OPTION' or
249 `--no-OPTION'.  Options that required an argument "on" or "off" have
250 also been changed this way, but they still accept the old syntax for
251 backward compatibility.  For example, instead of `--glob=off' you can
252 write `--no-glob'.
253
254 Allowing `--no-OPTION' for every `--OPTION' and the other way around
255 is useful because it allows the user to override non-default behavior
256 specified via `.wgetrc'.
257
258 ** The new option `--keep-session-cookies' causes `--save-cookies' to
259 save session cookies (normally only kept in memory) along with the
260 permanent ones.  This is useful because many sites track important
261 information, such as whether the user has authenticated, in session
262 cookies.  With this option multiple Wget runs are treated as a single
263 browser session.
264
265 ** Wget now supports the --ftp-user and --ftp-password command
266 switches to set username and password for FTP, and the --user and
267 --password command switches to set username and password for both FTP
268 and HTTP.  The --http-passwd and --proxy-passwd command switches have
269 been renamed to --http-password and --proxy-password respectively, and
270 the related http_passwd and proxy_passwd .wgetrc commands to
271 http_password and proxy_password respectively.  The login and passwd
272 .wgetrc commands have been deprecated.
273
274 * `wget -b' now works correctly under Windows.
275 \f
276 * Wget 1.9.1 is a bugfix release with no user-visible changes.
277 \f
278 * Changes in Wget 1.9.
279
280 ** It is now possible to specify that POST method be used for HTTP
281 requests.  For example, `wget --post-data="id=foo&data=bar" URL' will
282 send a POST request with the specified contents.
283
284 ** IPv6 support is available, although it's still experimental.
285
286 ** The `--timeout' option now also affects DNS lookup and establishing
287 the TCP connection.  Previously it only affected reading and writing
288 data.  Those three timeouts can be set separately using
289 `--dns-timeout', `--connection-timeout', and `--read-timeout',
290 respectively.
291
292 ** Download speed shown by the progress bar is based on the data
293 recently read, rather than the average speed of the entire download.
294 The ETA projection is still based on the overall average.
295
296 ** It is now possible to connect to FTP servers through FWTK
297 firewalls.  Set ftp_proxy to an FTP URL, and Wget will automatically
298 log on to the proxy as "username@host".
299
300 ** The new option `--retry-connrefused' makes Wget retry downloads
301 even in the face of refused connections, which are otherwise
302 considered a fatal error.
303
304 ** The new option `--no-dns-cache' may be used to prevent Wget from
305 caching DNS lookups.
306
307 ** Wget no longer escapes characters in local file names based on
308 whether they're appropriate in URLs.  Escaping can still occur for
309 nonprintable characters or for '/', but no longer for frequent
310 characters such as space.  You can use the new option
311 --restrict-file-names to relax or strengthen these rules, which can be
312 useful if you dislike the default or if you're downloading to
313 non-native partitions.
314
315 ** Handling of HTML comments has been dumbed down to conform to what
316 users expect and other browsers do: instead of being treated as SGML
317 declaration, a comment is terminated at the first occurrence of "-->".
318 Use `--strict-comments' to revert to the old behavior.
319
320 ** Wget now correctly handles relative URIs that begin with "//", such
321 as "//img.foo.com/foo.jpg".
322
323 ** Boolean options in `.wgetrc' and on the command line now accept
324 values "yes" and "no" along with the traditional "on" and "off".
325
326 ** It is now possible to specify decimal values for timeouts, waiting
327 periods, and download rate.  For instance, `--wait=0.5' now works as
328 expected, as does `--dns-timeout=0.5' and even `--limit-rate=2.5k'.
329 \f
330 * Wget 1.8.2 is a bugfix release with no user-visible changes.
331 \f
332 * Wget 1.8.1 is a bugfix release with no user-visible changes.
333 \f
334 * Changes in Wget 1.8.
335
336 ** A new progress indicator is now available and used by default.
337 You can choose the progress bar type with `--progress=TYPE'.  Two
338 types are available, "bar" (the new default), and "dot" (the old
339 dotted indicator).  You can permanently revert to the old progress
340 indicator by putting `progress = dot' in your `.wgetrc'.
341
342 ** You can limit the download rate of the retrieval using the
343 `--limit-rate' option.  For example, `wget --limit-rate=15k URL' will
344 tell Wget not to download the body of the URL faster than 15 kilobytes
345 per second.
346
347 ** Recursive retrieval and link conversion have been revamped:
348
349 *** Wget now traverses links breadth-first.  This makes the
350 calculation of depth much more reliable than before.  Also, recursive
351 downloads are faster and consume *significantly* less memory than
352 before.
353
354 *** Links are converted only when the entire retrieval is complete.
355 This is the only safe thing to do, as only then is it known what URLs
356 have been downloaded.
357
358 *** BASE tags are handled correctly when converting links.  Since Wget
359 already resolves <base href="..."> when resolving handling URLs, link
360 conversion now makes the BASE tags point to an empty string.
361
362 *** HTML anchors are now handled correctly.  Links to an anchor in the
363 same document (<a href="#anchorname">), which used to confuse Wget,
364 are now converted correctly.
365
366 *** When in page-requisites (-p) mode, no-parent (-np) is ignored when
367 retrieving for inline images, stylesheets, and other documents needed
368 to display the page.
369
370 *** Page-requisites (-p) mode now works with frames.  In other words,
371 `wget -p URL-THAT-USES-FRAMES' will now download the frame HTML files,
372 and all the files that they need to be displayed properly.
373
374 ** `--base' now works conjunction with `--input-file', providing a
375 base for each URL and thereby allowing the URLs in the file to be
376 relative.
377
378 ** If a host has more than one IP address, Wget uses the other
379 addresses when accessing the first one fails.
380
381 ** Host directories now contain port information if the URL is at a
382 non-standard port.
383
384 ** Wget now supports the robots.txt directives specified in
385 <http://www.robotstxt.org/wc/norobots-rfc.txt>.
386
387 ** URL parser has been fixed, especially the infamous overzealous
388 quoting.  Wget no longer dequotes reserved characters, e.g. `%3F' is
389 no longer translated to `?', nor `%2B' to `+'.  Unsafe characters
390 which are not reserved are still escaped, of course.
391
392 ** No more than 20 successive redirections are allowed.
393 \f
394 * Wget 1.7.1 is a bugfix release with no user-visible changes.
395 \f
396 * Changes in Wget 1.7.
397
398 ** SSL (`https') pages now work if you compile Wget with SSL support;
399 use the `--with-ssl' configure flag.  You need to have OpenSSL
400 installed.
401
402 ** Cookies are now supported.  Wget will accept cookies sent by the
403 server and return them in later requests.  Additionally, it can load
404 and save cookies to disk, in the same format that Netscape uses.
405
406 ** "Keep-alive" (persistent) HTTP connections are now supported.
407 Using keep-alive allows Wget to share one TCP/IP connection for
408 many retrievals, making multiple-file downloads faster and less
409 stressing for the server and the network.
410
411 ** Wget now recognizes FTP directory listings generated by NT and VMS
412 servers.
413
414 ** It is now possible to recurse through FTP sites where logging in
415 puts you in some directory other than '/'.
416
417 ** You may now use `~' to mean home directory in `.wgetrc'.  For
418 example, `load_cookies = ~/.netscape/cookies.txt' works as you would
419 expect.
420
421 ** The HTML parser has been rewritten.  The new one works more
422 reliably, allows finer-grained control over which tags and attributes
423 are detected, and has better support for some features like correctly
424 skipping comments and declarations, decoding entities, etc.  It is
425 also more general.
426
427 ** <meta name="robots"> tags are now respected.
428
429 ** Wget's internal tables now use hash tables instead of linked lists
430 where appropriate.  This results in huge speedups when retrieving
431 large sites (thousands of documents).
432
433 ** Wget now has a man page, automatically generated from the Texinfo
434 documentation.  (The last version that shipped with a man page was
435 1.4.5).  To get this, you need to have pod2man from the Perl
436 distribution installed on your system.
437 \f
438 * Changes in Wget 1.6
439
440 ** Administrative changes.
441
442 *** Maintainership.  Due to Hrvoje being plagued with a "real job",
443 Dan Harkless is the most active maintainer (not that he doesn't have a
444 real job as well).  Hrvoje still participates occasionally, and both
445 are being helped by many other people.
446
447 *** Web page.  Thanks to Jan Prikryl, Wget has an "official" web page.
448 Take a look at:
449
450     http://sunsite.dk/wget/
451
452 *** Anonymous CVS.  Thanks to ever-helpful Karsten Thygesen, Wget
453 sources are now available at an anonymous CVS server.  Take a look at
454 the web page for downloading instructions.
455
456 ** New -K / --backup-converted / backup_converted = on option causes files
457 modified due to -k to be saved with a .orig prefix before being changed.  When
458 using -N as well, it is these .orig files that are compared against the server.
459
460 ** New --follow-tags / follow_tags = ... option allows you to restrict
461 Wget to following only certain HTML tags when doing a recursive
462 retrieval.  -G / --ignore-tags / ignore_tags = ... is just the
463 opposite -- all tags but the ones you specify will be followed.
464
465 ** New --waitretry / waitretry = SECONDS option allows waiting between retries
466 of failed downloads.  Wget will use "linear" backoff, waiting 1 second after the
467 first failure, 2 after the second, up to SECONDS.  waitretry is set to 10 by
468 default in the system wgetrc.
469
470 ** New -p / --page-requisites / page_requisites = on option causes
471 Wget to download all ancillary files necessary to display a given HTML
472 page properly (e.g. inlined images).
473
474 ** New -E / --html-extension / html_extension = on option causes Wget
475 to append ".html" to text/html filenames not ending in regexp
476 "\.[Hh][Tt][Mm][Ll]?".
477
478 ** New type of .wgetrc command -- "lockable Boolean".  Can be set to on, off,
479 always, or never.  This allows the .wgetrc to override the commandline.  So far,
480 passive_ftp is the only .wgetrc command which takes a lockable Boolean.
481
482 ** A number of new translation files have been added.
483
484 ** New --bind-address / bind_address = <address> option for people on hosts 
485 bound to multiple IP addresses.
486
487 ** wget now accepts (illegal per HTTP spec) relative URLs in HTTP redirects.
488 \f
489 * Wget 1.5.3 is a bugfix release with no user-visible changes.
490 \f
491 * Wget 1.5.2 is a bugfix release with no user-visible changes.
492 \f
493 * Wget 1.5.1 is a bugfix release with no user-visible changes.
494 \f
495 * Changes in Wget 1.5.0
496
497 ** Wget speaks many languages!
498
499 On systems with gettext(), Wget will output messages in the language
500 set by the current locale, if available.  At this time we support
501 Czech, German, Croatian, Italian, Norwegian and Portuguese.
502
503 ** Opie (Skey) is now supported with FTP.
504
505 ** HTTP Digest Access Authentication (RFC2069) is now supported.
506
507 ** The new `-b' option makes Wget go to background automatically.
508
509 ** The `-I' and `-X' options now accept wildcard arguments.
510
511 ** The `-w' option now accepts suffixes `s' for seconds, `m' for
512 minutes, `h' for hours, `d' for days and `w' for weeks.
513
514 ** Upon getting SIGHUP, the whole previous log is now copied to
515 `wget-log'.
516
517 ** Wget now understands proxy settings with explicit usernames and
518 passwords, e.g. `http://user:password@proxy.foo.com/'.
519
520 ** You can use the new `--cut-dirs' option to make Wget create less
521 directories.
522
523 ** The `;type=a' appendix to FTP URLs is now recognized.  For
524 instance, the following command will retrieve the welcoming message in
525 ASCII type transfer:
526
527     wget "ftp://ftp.somewhere.com/welcome.msg;type=a"
528
529 ** `--help' and `--version' options have been redone to to conform to
530 standards set by other GNU utilities.
531
532 ** Wget should now be compilable under MS Windows environment.  MS
533 Visual C++ and Watcom C have been used successfully.
534
535 ** If the file length is known, percentages are displayed during
536 download.
537
538 ** The manual page, now hopelessly out of date, is no longer
539 distributed with Wget.
540 \f
541 * Wget 1.4.5 is a bugfix release with no user-visible changes.
542 \f
543 * Wget 1.4.4 is a bugfix release with no user-visible changes.
544 \f
545 * Changes in Wget 1.4.3
546
547 ** Wget is now a GNU utility.
548
549 ** Can do passive FTP.
550
551 ** Reads .netrc.
552
553 ** Info documentation expanded.
554
555 ** Compiles on pre-ANSI compilers.
556
557 ** Global wgetrc now goes to /usr/local/etc (i.e. $sysconfdir).
558
559 ** Lots of bugfixes.
560 \f
561 * Changes in Wget 1.4.2
562
563 ** New mirror site at ftp://sunsite.auc.dk/pub/infosystems/wget/,
564 thanks to Karsten Thygesen.
565
566 ** Mailing list!  Mail to wget-request@sunsite.auc.dk to subscribe.
567
568 ** New option --delete-after for proxy prefetching.
569
570 ** New option --retr-symlinks to retrieve symbolic links like plain
571 files.
572
573 ** rmold.pl -- script to remove files deleted on the remote server
574
575 ** --convert-links should work now.
576
577 ** Minor bugfixes.
578 \f
579 * Changes in Wget 1.4.1
580
581 ** Minor bugfixes.
582
583 ** Added -I (the opposite of -X).
584
585 ** Dot tracing is now customizable; try wget --dot-style=binary
586 \f
587 * Changes in Wget 1.4.0
588
589 ** Wget 1.4.0 [formerly known as Geturl] is an extensive rewrite of
590 Geturl.  Although many things look suspiciously similar, most of the
591 stuff was rewritten, like recursive retrieval, HTTP, FTP and mostly
592 everything else.  Wget should be now easier to debug, maintain and,
593 most importantly, use.
594
595 ** Recursive HTTP should now work without glitches, even with Location
596 changes, server-generated directory listings and other naughty stuff.
597
598 ** HTTP regetting is supported on servers that support Range
599 specification. WWW authorization is supported -- try
600 wget http://user:password@hostname/
601
602 ** FTP support was rewritten and widely enhanced. Globbing should now
603 work flawlessly. Symbolic links are created locally. All the
604 information the Unix-style ls listing can give is now recognized.
605
606 ** Recursive FTP is supported, e.g.
607     wget -r ftp://gnjilux.cc.fer.hr/pub/unix/util/
608
609 ** You can specify "rejected" directories, to which you do not want to
610 enter, e.g. with wget -X /pub
611
612 ** Time-stamping is supported, with both HTTP and FTP. Try wget -N URL.
613
614 ** A new texinfo reference manual is provided.  It can be read with
615 Emacs, standalone info, or converted to HTML, dvi or postscript.
616
617 ** Fixed a long-standing bug, so that Wget now works over SLIP
618 connections.
619
620 ** You can have a system-wide wgetrc (/usr/local/lib/wgetrc by
621 default). Settings in $HOME/.wgetrc override the global ones, of
622 course :-)
623
624 ** You can set up quota in .wgetrc to prevent sucking too much
625 data. Try `quota = 5M' in .wgetrc (or quota = 100K if you want your
626 sysadmin to like you).
627
628 ** Download rate is printed after retrieval.
629
630 ** Wget now sends the `Referer' header when retrieving
631 recursively.
632
633 ** With the new --no-parent option Wget can retrieve FTP recursively
634 through a proxy server.
635
636 ** HTML parser, as well as the whole of Wget was rewritten to be much
637 faster and less memory-consuming (yes, both).
638
639 ** Absolute links can be converted to relative links locally. Check
640 wget -k.
641
642 ** Wget catches hangup, filtering the output to a log file and
643 resuming work. Try kill -HUP %?wget.
644
645 ** User-defined headers can be sent.  Try
646
647     wget http://fly.cc.her.hr/ --header='Accept-Charset: iso-8859-2'
648
649 ** Acceptance/Rejection lists may contain wildcards.
650
651 ** Wget can display HTTP headers and/or FTP server response with the
652 new `-S' option.  It can save the original HTTP headers with `-s'.
653
654 ** socks library is now supported (thanks to Antonio Rosella
655 <Antonio.Rosella@agip.it>). Configure with --with-socks.
656
657 ** There is a nicer display of REST-ed output.
658
659 ** Many new options (like -x to force directory hierarchy, or -m to
660 turn on mirroring options).
661
662 ** Wget is now distributed under GNU General Public License (GPL).
663
664 ** Lots of small features I can't remember. :-)
665
666 ** A host of bugfixes.
667 \f
668 * Changes in Geturl 1.3
669
670 ** Added FTP globbing support (ftp://fly.cc.fer.hr/*)
671
672 ** Added support for no_proxy
673
674 ** Added support for ftp://user:password@host/
675
676 ** Added support for %xx in URL syntax
677
678 ** More natural command-line options
679
680 ** Added -e switch to execute .geturlrc commands from the command-line
681
682 ** Added support for robots.txt
683
684 ** Fixed some minor bugs
685 \f
686 * Geturl 1.2 is a bugfix release with no user-visible changes.
687 \f
688 * Changes in Geturl 1.1
689
690 ** REST supported in FTP
691
692 ** Proxy servers supported
693
694 ** GNU getopt used, which enables command-line arguments to be ordered
695 as you wish, e.g.  geturl http://fly.cc.fer.hr/ -vo log is the same as
696 geturl -vo log http://fly.cc.fer.hr/
697
698 ** Netscape-compatible URL syntax for HTTP supported: host[:port]/dir/file
699
700 ** NcFTP-compatible colon URL syntax for FTP supported: host:/dir/file
701
702 ** <base href="xxx"> supported
703
704 ** autoconf supported
705 \f
706 ----------------------------------------------------------------------
707 Copyright information:
708
709 Copyright (C) 1997-2005 Free Software Foundation, Inc.
710
711    Permission is granted to anyone to make or distribute verbatim
712    copies of this document as received, in any medium, provided that
713    the copyright notice and this permission notice are preserved, thus
714    giving the recipient permission to redistribute in turn.
715
716    Permission is granted to distribute modified versions of this
717    document, or of portions of it, under the above conditions,
718    provided also that they carry prominent notices stating who last
719    changed them.