]> sjero.net Git - wget/blob - src/main.c
[svn] Add --random-file option. Bail out in case of error during
[wget] / src / main.c
1 /* Command line parsing.
2    Copyright (C) 2003, 2004, 2005 Free Software Foundation, Inc.
3
4 This file is part of GNU Wget.
5
6 GNU Wget is free software; you can redistribute it and/or modify
7 it under the terms of the GNU General Public License as published by
8 the Free Software Foundation; either version 2 of the License, or
9 (at your option) any later version.
10
11 GNU Wget is distributed in the hope that it will be useful,
12 but WITHOUT ANY WARRANTY; without even the implied warranty of
13 MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
14 GNU General Public License for more details.
15
16 You should have received a copy of the GNU General Public License
17 along with Wget; if not, write to the Free Software
18 Foundation, Inc., 675 Mass Ave, Cambridge, MA 02139, USA.
19
20 In addition, as a special exception, the Free Software Foundation
21 gives permission to link the code of its release of Wget with the
22 OpenSSL project's "OpenSSL" library (or with modified versions of it
23 that use the same license as the "OpenSSL" library), and distribute
24 the linked executables.  You must obey the GNU General Public License
25 in all respects for all of the code used other than "OpenSSL".  If you
26 modify this file, you may extend this exception to your version of the
27 file, but you are not obligated to do so.  If you do not wish to do
28 so, delete this exception statement from your version.  */
29
30 #include <config.h>
31
32 #include <stdio.h>
33 #include <stdlib.h>
34 #ifdef HAVE_UNISTD_H
35 # include <unistd.h>
36 #endif /* HAVE_UNISTD_H */
37 #include <sys/types.h>
38 #ifdef HAVE_STRING_H
39 # include <string.h>
40 #else
41 # include <strings.h>
42 #endif /* HAVE_STRING_H */
43 #ifdef HAVE_SIGNAL_H
44 # include <signal.h>
45 #endif
46 #ifdef HAVE_NLS
47 #ifdef HAVE_LOCALE_H
48 # include <locale.h>
49 #endif /* HAVE_LOCALE_H */
50 #endif /* HAVE_NLS */
51 #include <assert.h>
52
53 #include <errno.h>
54 #ifndef errno
55 extern int errno;
56 #endif
57
58 #include "wget.h"
59 #include "utils.h"
60 #include "init.h"
61 #include "retr.h"
62 #include "recur.h"
63 #include "host.h"
64 #include "url.h"
65 #include "progress.h"           /* for progress_handle_sigwinch */
66 #include "convert.h"
67
68 /* On GNU system this will include system-wide getopt.h. */
69 #include "getopt.h"
70
71 #ifndef PATH_SEPARATOR
72 # define PATH_SEPARATOR '/'
73 #endif
74
75 struct options opt;
76
77 extern LARGE_INT total_downloaded_bytes;
78 extern char *version_string;
79
80 extern struct cookie_jar *wget_cookie_jar;
81
82 static RETSIGTYPE redirect_output_signal PARAMS ((int));
83
84 const char *exec_name;
85 \f
86 /* Initialize I18N.  The initialization amounts to invoking
87    setlocale(), bindtextdomain() and textdomain().
88    Does nothing if NLS is disabled or missing.  */
89 static void
90 i18n_initialize (void)
91 {
92   /* If HAVE_NLS is defined, assume the existence of the three
93      functions invoked here.  */
94 #ifdef HAVE_NLS
95   /* Set the current locale.  */
96   /* Here we use LC_MESSAGES instead of LC_ALL, for two reasons.
97      First, message catalogs are all of I18N Wget uses anyway.
98      Second, setting LC_ALL has a dangerous potential of messing
99      things up.  For example, when in a foreign locale, Solaris
100      strptime() fails to handle international dates correctly, which
101      makes http_atotm() malfunction.  */
102 #ifdef LC_MESSAGES
103   setlocale (LC_MESSAGES, "");
104   setlocale (LC_CTYPE, "");
105 #else
106   setlocale (LC_ALL, "");
107 #endif
108   /* Set the text message domain.  */
109   bindtextdomain ("wget", LOCALEDIR);
110   textdomain ("wget");
111 #endif /* HAVE_NLS */
112 }
113 \f
114 /* Definition of command-line options. */
115
116 static void print_help PARAMS ((void));
117 static void print_version PARAMS ((void));
118
119 #ifdef HAVE_SSL
120 # define IF_SSL(x) x
121 #else
122 # define IF_SSL(x) NULL
123 #endif
124
125 #ifdef ENABLE_DEBUG
126 # define IF_DEBUG(x) x
127 #else
128 # define IF_DEBUG(x) NULL
129 #endif
130
131 struct cmdline_option {
132   const char *long_name;
133   char short_name;
134   enum {
135     OPT_VALUE,
136     OPT_BOOLEAN,
137     OPT_FUNCALL,
138     /* Non-standard options that have to be handled specially in
139        main().  */
140     OPT__APPEND_OUTPUT,
141     OPT__CLOBBER,
142     OPT__DONT_REMOVE_LISTING,
143     OPT__EXECUTE,
144     OPT__NO,
145     OPT__PARENT,
146   } type;
147   const void *data;             /* for standard options */
148   int argtype;                  /* for non-standard options */
149 };
150
151 struct cmdline_option option_data[] =
152   {
153     { "accept", 'A', OPT_VALUE, "accept", -1 },
154     { "append-output", 'a', OPT__APPEND_OUTPUT, NULL, required_argument },
155     { "background", 'b', OPT_BOOLEAN, "background", -1 },
156     { "backup-converted", 'K', OPT_BOOLEAN, "backupconverted", -1 },
157     { "backups", 0, OPT_BOOLEAN, "backups", -1 },
158     { "base", 'B', OPT_VALUE, "base", -1 },
159     { "bind-address", 0, OPT_VALUE, "bindaddress", -1 },
160     { IF_SSL ("ca-certificate"), 0, OPT_VALUE, "cacertificate", -1 },
161     { IF_SSL ("ca-directory"), 0, OPT_VALUE, "cadirectory", -1 },
162     { "cache", 0, OPT_BOOLEAN, "cache", -1 },
163     { IF_SSL ("certificate"), 0, OPT_VALUE, "certificate", -1 },
164     { IF_SSL ("certificate-type"), 0, OPT_VALUE, "certificatetype", -1 },
165     { IF_SSL ("check-certificate"), 0, OPT_BOOLEAN, "checkcertificate", -1 },
166     { "clobber", 0, OPT__CLOBBER, NULL, optional_argument },
167     { "connect-timeout", 0, OPT_VALUE, "connecttimeout", -1 },
168     { "continue", 'c', OPT_BOOLEAN, "continue", -1 },
169     { "convert-links", 'k', OPT_BOOLEAN, "convertlinks", -1 },
170     { "cookies", 0, OPT_BOOLEAN, "cookies", -1 },
171     { "cut-dirs", 0, OPT_VALUE, "cutdirs", -1 },
172     { IF_DEBUG ("debug"), 'd', OPT_BOOLEAN, "debug", -1 },
173     { "delete-after", 0, OPT_BOOLEAN, "deleteafter", -1 },
174     { "directories", 0, OPT_BOOLEAN, "dirstruct", -1 },
175     { "directory-prefix", 'P', OPT_VALUE, "dirprefix", -1 },
176     { "dns-cache", 0, OPT_BOOLEAN, "dnscache", -1 },
177     { "dns-timeout", 0, OPT_VALUE, "dnstimeout", -1 },
178     { "domains", 'D', OPT_VALUE, "domains", -1 },
179     { "dont-remove-listing", 0, OPT__DONT_REMOVE_LISTING, NULL, no_argument },
180     { "dot-style", 0, OPT_VALUE, "dotstyle", -1 },
181     { "egd-file", 0, OPT_VALUE, "egdfile", -1 },
182     { "exclude-directories", 'X', OPT_VALUE, "excludedirectories", -1 },
183     { "exclude-domains", 0, OPT_VALUE, "excludedomains", -1 },
184     { "execute", 'e', OPT__EXECUTE, NULL, required_argument },
185     { "follow-ftp", 0, OPT_BOOLEAN, "followftp", -1 },
186     { "follow-tags", 0, OPT_VALUE, "followtags", -1 },
187     { "force-directories", 'x', OPT_BOOLEAN, "dirstruct", -1 },
188     { "force-html", 'F', OPT_BOOLEAN, "forcehtml", -1 },
189     { "ftp-passwd", 0, OPT_VALUE, "ftppasswd", -1 },
190     { "glob", 0, OPT_BOOLEAN, "glob", -1 },
191     { "header", 0, OPT_VALUE, "header", -1 },
192     { "help", 'h', OPT_FUNCALL, (void *)print_help, no_argument },
193     { "host-directories", 0, OPT_BOOLEAN, "addhostdir", -1 },
194     { "html-extension", 'E', OPT_BOOLEAN, "htmlextension", -1 },
195     { "htmlify", 0, OPT_BOOLEAN, "htmlify", -1 },
196     { "http-keep-alive", 0, OPT_BOOLEAN, "httpkeepalive", -1 },
197     { "http-passwd", 0, OPT_VALUE, "httppasswd", -1 },
198     { "http-user", 0, OPT_VALUE, "httpuser", -1 },
199     { "ignore-length", 0, OPT_BOOLEAN, "ignorelength", -1 },
200     { "ignore-tags", 0, OPT_VALUE, "ignoretags", -1 },
201     { "include-directories", 'I', OPT_VALUE, "includedirectories", -1 },
202 #ifdef ENABLE_IPV6
203     { "inet4-only", '4', OPT_BOOLEAN, "inet4only", -1 },
204     { "inet6-only", '6', OPT_BOOLEAN, "inet6only", -1 },
205 #endif
206     { "input-file", 'i', OPT_VALUE, "input", -1 },
207     { "keep-session-cookies", 0, OPT_BOOLEAN, "keepsessioncookies", -1 },
208     { "level", 'l', OPT_VALUE, "reclevel", -1 },
209     { "limit-rate", 0, OPT_VALUE, "limitrate", -1 },
210     { "load-cookies", 0, OPT_VALUE, "loadcookies", -1 },
211     { "mirror", 'm', OPT_BOOLEAN, "mirror", -1 },
212     { "no", 'n', OPT__NO, NULL, required_argument },
213     { "no-clobber", 0, OPT_BOOLEAN, "noclobber", -1 },
214     { "no-parent", 0, OPT_BOOLEAN, "noparent", -1 },
215     { "output-document", 'O', OPT_VALUE, "outputdocument", -1 },
216     { "output-file", 'o', OPT_VALUE, "logfile", -1 },
217     { "page-requisites", 'p', OPT_BOOLEAN, "pagerequisites", -1 },
218     { "parent", 0, OPT__PARENT, NULL, optional_argument },
219     { "passive-ftp", 0, OPT_BOOLEAN, "passiveftp", -1 },
220     { "post-data", 0, OPT_VALUE, "postdata", -1 },
221     { "post-file", 0, OPT_VALUE, "postfile", -1 },
222     { "prefer-family", 0, OPT_VALUE, "preferfamily", -1 },
223     { "preserve-permissions", 0, OPT_BOOLEAN, "preservepermissions", -1 },
224     { IF_SSL ("private-key"), 0, OPT_VALUE, "privatekey", -1 },
225     { IF_SSL ("private-key-type"), 0, OPT_VALUE, "privatekeytype", -1 },
226     { "progress", 0, OPT_VALUE, "progress", -1 },
227     { "protocol-directories", 0, OPT_BOOLEAN, "protocoldirectories", -1 },
228     { "proxy", 0, OPT_BOOLEAN, "useproxy", -1 },
229     { "proxy__compat", 'Y', OPT_VALUE, "useproxy", -1 }, /* back-compatible */
230     { "proxy-passwd", 0, OPT_VALUE, "proxypasswd", -1 },
231     { "proxy-user", 0, OPT_VALUE, "proxyuser", -1 },
232     { "quiet", 'q', OPT_BOOLEAN, "quiet", -1 },
233     { "quota", 'Q', OPT_VALUE, "quota", -1 },
234     { "random-file", 0, OPT_VALUE, "randomfile", -1 },
235     { "random-wait", 0, OPT_BOOLEAN, "randomwait", -1 },
236     { "read-timeout", 0, OPT_VALUE, "readtimeout", -1 },
237     { "recursive", 'r', OPT_BOOLEAN, "recursive", -1 },
238     { "referer", 0, OPT_VALUE, "referer", -1 },
239     { "reject", 'R', OPT_VALUE, "reject", -1 },
240     { "relative", 'L', OPT_BOOLEAN, "relativeonly", -1 },
241     { "remove-listing", 0, OPT_BOOLEAN, "removelisting", -1 },
242     { "restrict-file-names", 0, OPT_BOOLEAN, "restrictfilenames", -1 },
243     { "retr-symlinks", 0, OPT_BOOLEAN, "retrsymlinks", -1 },
244     { "retry-connrefused", 0, OPT_BOOLEAN, "retryconnrefused", -1 },
245     { "save-cookies", 0, OPT_VALUE, "savecookies", -1 },
246     { "save-headers", 0, OPT_BOOLEAN, "saveheaders", -1 },
247     { IF_SSL ("secure-protocol"), 0, OPT_VALUE, "secureprotocol", -1 },
248     { "server-response", 'S', OPT_BOOLEAN, "serverresponse", -1 },
249     { "span-hosts", 'H', OPT_BOOLEAN, "spanhosts", -1 },
250     { "spider", 0, OPT_BOOLEAN, "spider", -1 },
251     { "strict-comments", 0, OPT_BOOLEAN, "strictcomments", -1 },
252     { "timeout", 'T', OPT_VALUE, "timeout", -1 },
253     { "timestamping", 'N', OPT_BOOLEAN, "timestamping", -1 },
254     { "tries", 't', OPT_VALUE, "tries", -1 },
255     { "user-agent", 'U', OPT_VALUE, "useragent", -1 },
256     { "verbose", 'v', OPT_BOOLEAN, "verbose", -1 },
257     { "verbose", 0, OPT_BOOLEAN, "verbose", -1 },
258     { "version", 'V', OPT_FUNCALL, (void *) print_version, no_argument },
259     { "wait", 'w', OPT_VALUE, "wait", -1 },
260     { "waitretry", 0, OPT_VALUE, "waitretry", -1 },
261   };
262
263 #undef IF_DEBUG
264 #undef IF_SSL
265
266 /* Return a string that contains S with "no-" prepended.  The string
267    is NUL-terminated and allocated off static storage at Wget
268    startup.  */
269
270 static char *
271 no_prefix (const char *s)
272 {
273   static char buffer[1024];
274   static char *p = buffer;
275
276   char *cp = p;
277   int size = 3 + strlen (s) + 1;  /* "no-STRING\0" */
278   if (p + size >= buffer + sizeof (buffer))
279     abort ();
280
281   cp[0] = 'n', cp[1] = 'o', cp[2] = '-';
282   strcpy (cp + 3, s);
283   p += size;
284   return cp;
285 }
286
287 /* The arguments that that main passes to getopt_long. */
288 static struct option long_options[2 * countof (option_data) + 1];
289 static char short_options[128];
290
291 /* Mapping between short option chars and option_data indices. */
292 static unsigned char optmap[96];
293
294 /* Marker for `--no-FOO' values in long_options.  */
295 #define BOOLEAN_NEG_MARKER 1024
296
297 /* Initialize the long_options array used by getopt_long from the data
298    in option_data.  */
299
300 static void
301 init_switches (void)
302 {
303   char *p = short_options;
304   int i, o = 0;
305   for (i = 0; i < countof (option_data); i++)
306     {
307       struct cmdline_option *opt = &option_data[i];
308       struct option *longopt;
309
310       if (!opt->long_name)
311         /* The option is disabled. */
312         continue;
313
314       longopt = &long_options[o++];
315       longopt->name = opt->long_name;
316       longopt->val = i;
317       if (opt->short_name)
318         {
319           *p++ = opt->short_name;
320           optmap[opt->short_name - 32] = longopt - long_options;
321         }
322       switch (opt->type)
323         {
324         case OPT_VALUE:
325           longopt->has_arg = required_argument;
326           if (opt->short_name)
327             *p++ = ':';
328           break;
329         case OPT_BOOLEAN:
330           /* Specify an optional argument for long options, so that
331              --option=off works the same as --no-option, for
332              compatibility with pre-1.10 Wget.  However, don't specify
333              optional arguments short-option booleans because they
334              prevent combining of short options.  */
335           longopt->has_arg = optional_argument;
336           /* For Boolean options, add the "--no-FOO" variant, which is
337              identical to "--foo", except it has opposite meaning and
338              it doesn't allow an argument.  */
339           longopt = &long_options[o++];
340           longopt->name = no_prefix (opt->long_name);
341           longopt->has_arg = no_argument;
342           /* Mask the value so we'll be able to recognize that we're
343              dealing with the false value.  */
344           longopt->val = i | BOOLEAN_NEG_MARKER;
345           break;
346         default:
347           assert (opt->argtype != -1);
348           longopt->has_arg = opt->argtype;
349           if (opt->short_name)
350             {
351               if (longopt->has_arg == required_argument)
352                 *p++ = ':';
353               /* Don't handle optional_argument */
354             }
355         }
356     }
357   /* Terminate short_options. */
358   *p = '\0';
359   /* No need for xzero(long_options[o]) because its storage is static
360      and it will be zeroed by default.  */
361   assert (o <= countof (long_options));
362 }
363
364 /* Print the usage message.  */
365 static void
366 print_usage (void)
367 {
368   printf (_("Usage: %s [OPTION]... [URL]...\n"), exec_name);
369 }
370
371 /* Print the help message, describing all the available options.  If
372    you add an option, be sure to update this list.  */
373 static void
374 print_help (void)
375 {
376   /* We split the help text this way to ease translation of individual
377      entries.  */
378   static const char *help[] = {
379     "\n",
380     N_("\
381 Mandatory arguments to long options are mandatory for short options too.\n\n"),
382     N_("\
383 Startup:\n"),
384     N_("\
385   -V,  --version           display the version of Wget and exit.\n"),
386     N_("\
387   -h,  --help              print this help.\n"),
388     N_("\
389   -b,  --background        go to background after startup.\n"),
390     N_("\
391   -e,  --execute=COMMAND   execute a `.wgetrc'-style command.\n"),
392     "\n",
393
394     N_("\
395 Logging and input file:\n"),
396     N_("\
397   -o,  --output-file=FILE    log messages to FILE.\n"),
398     N_("\
399   -a,  --append-output=FILE  append messages to FILE.\n"),
400 #ifdef ENABLE_DEBUG
401     N_("\
402   -d,  --debug               print lots of debugging information.\n"),
403 #endif
404     N_("\
405   -q,  --quiet               quiet (no output).\n"),
406     N_("\
407   -v,  --verbose             be verbose (this is the default).\n"),
408     N_("\
409   -nv, --no-verbose          turn off verboseness, without being quiet.\n"),
410     N_("\
411   -i,  --input-file=FILE     download URLs found in FILE.\n"),
412     N_("\
413   -F,  --force-html          treat input file as HTML.\n"),
414     N_("\
415   -B,  --base=URL            prepends URL to relative links in -F -i file.\n"),
416     "\n",
417
418     N_("\
419 Download:\n"),
420     N_("\
421   -t,  --tries=NUMBER            set number of retries to NUMBER (0 unlimits).\n"),
422     N_("\
423        --retry-connrefused       retry even if connection is refused.\n"),
424     N_("\
425   -O,  --output-document=FILE    write documents to FILE.\n"),
426     N_("\
427   -nc, --no-clobber              skip downloads that would download to\n\
428                                  existing files.\n"),
429     N_("\
430   -c,  --continue                resume getting a partially-downloaded file.\n"),
431     N_("\
432        --progress=TYPE           select progress gauge type.\n"),
433     N_("\
434   -N,  --timestamping            don't re-retrieve files unless newer than\n\
435                                  local.\n"),
436     N_("\
437   -S,  --server-response         print server response.\n"),
438     N_("\
439        --spider                  don't download anything.\n"),
440     N_("\
441   -T,  --timeout=SECONDS         set all timeout values to SECONDS.\n"),
442     N_("\
443        --dns-timeout=SECS        set the DNS lookup timeout to SECS.\n"),
444     N_("\
445        --connect-timeout=SECS    set the connect timeout to SECS.\n"),
446     N_("\
447        --read-timeout=SECS       set the read timeout to SECS.\n"),
448     N_("\
449   -w,  --wait=SECONDS            wait SECONDS between retrievals.\n"),
450     N_("\
451        --waitretry=SECONDS       wait 1..SECONDS between retries of a retrieval.\n"),
452     N_("\
453        --random-wait             wait from 0...2*WAIT secs between retrievals.\n"),
454     N_("\
455   -Y,  --proxy                   explicitly turn on proxy.\n"),
456     N_("\
457        --no-proxy                explicitly turn off proxy.\n"),
458     N_("\
459   -Q,  --quota=NUMBER            set retrieval quota to NUMBER.\n"),
460     N_("\
461        --bind-address=ADDRESS    bind to ADDRESS (hostname or IP) on local host.\n"),
462     N_("\
463        --limit-rate=RATE         limit download rate to RATE.\n"),
464     N_("\
465        --no-dns-cache            disable caching DNS lookups.\n"),
466     N_("\
467        --restrict-file-names=OS  restrict chars in file names to ones OS allows.\n"),
468 #ifdef ENABLE_IPV6
469     N_("\
470   -4,  --inet4-only              connect only to IPv4 addresses.\n"),
471     N_("\
472   -6,  --inet6-only              connect only to IPv6 addresses.\n"),
473     N_("\
474        --prefer-family=FAMILY    connect first to addresses of specified family,\n\
475                                  one of IPv6, IPv4, or none.\n"),
476 #endif
477     "\n",
478
479     N_("\
480 Directories:\n"),
481     N_("\
482   -nd, --no-directories           don't create directories.\n"),
483     N_("\
484   -x,  --force-directories        force creation of directories.\n"),
485     N_("\
486   -nH, --no-host-directories      don't create host directories.\n"),
487     N_("\
488        --protocol-directories     use protocol name in directories.\n"),
489     N_("\
490   -P,  --directory-prefix=PREFIX  save files to PREFIX/...\n"),
491     N_("\
492        --cut-dirs=NUMBER          ignore NUMBER remote directory components.\n"),
493     "\n",
494
495     N_("\
496 HTTP options:\n"),
497     N_("\
498        --http-user=USER        set http user to USER.\n"),
499     N_("\
500        --http-passwd=PASS      set http password to PASS.\n"),
501     N_("\
502        --no-cache              disallow server-cached data.\n"),
503     N_("\
504   -E,  --html-extension        save HTML documents with `.html' extension.\n"),
505     N_("\
506        --ignore-length         ignore `Content-Length' header field.\n"),
507     N_("\
508        --header=STRING         insert STRING among the headers.\n"),
509     N_("\
510        --proxy-user=USER       set USER as proxy username.\n"),
511     N_("\
512        --proxy-passwd=PASS     set PASS as proxy password.\n"),
513     N_("\
514        --referer=URL           include `Referer: URL' header in HTTP request.\n"),
515     N_("\
516        --save-headers          save the HTTP headers to file.\n"),
517     N_("\
518   -U,  --user-agent=AGENT      identify as AGENT instead of Wget/VERSION.\n"),
519     N_("\
520        --no-http-keep-alive    disable HTTP keep-alive (persistent connections).\n"),
521     N_("\
522        --no-cookies            don't use cookies.\n"),
523     N_("\
524        --load-cookies=FILE     load cookies from FILE before session.\n"),
525     N_("\
526        --save-cookies=FILE     save cookies to FILE after session.\n"),
527     N_("\
528        --keep-session-cookies  load and save session (non-permanent) cookies.\n"),
529     N_("\
530        --post-data=STRING      use the POST method; send STRING as the data.\n"),
531     N_("\
532        --post-file=FILE        use the POST method; send contents of FILE.\n"),
533     "\n",
534
535 #ifdef HAVE_SSL
536     N_("\
537 HTTPS (SSL/TLS) options:\n"),
538     N_("\
539        --secure-protocol=PR     choose SSL protocol, one of auto, SSLv2, SSLv3,\n\
540                                 and TLSv1.\n"),
541     N_("\
542        --no-check-certificate   don't validate the server's certificate.\n"),
543     N_("\
544        --certificate=FILE       client certificate file.\n"),
545     N_("\
546        --certificate-type=TYPE  client certificate type, PEM or ASN1.\n"),
547     N_("\
548        --private-key=FILE       private key file.\n"),
549     N_("\
550        --private-key-type=TYPE  private key type, PEM or ASN1.\n"),
551     N_("\
552        --ca-certificate=FILE    file with the bundle of CA's.\n"),
553     N_("\
554        --ca-directory=DIR       directory where hash list of CA's is stored.\n"),
555     N_("\
556        --random-file=FILE       file with random data for seeding the SSL PRNG.\n"),
557     N_("\
558        --egd-file=FILE          file naming the EGD socket with random data.\n"),
559     "\n",
560 #endif /* HAVE_SSL */
561
562     N_("\
563 FTP options:\n"),
564     N_("\
565        --no-remove-listing     don't remove `.listing' files.\n"),
566     N_("\
567        --no-glob               turn off FTP file name globbing.\n"),
568     N_("\
569        --no-passive-ftp        disable the \"passive\" transfer mode.\n"),
570     N_("\
571        --retr-symlinks         when recursing, get linked-to files (not dir).\n"),
572     N_("\
573        --preserve-permissions  preserve remote file permissions.\n"),
574     "\n",
575
576     N_("\
577 Recursive download:\n"),
578     N_("\
579   -r,  --recursive          specify recursive download.\n"),
580     N_("\
581   -l,  --level=NUMBER       maximum recursion depth (inf or 0 for infinite).\n"),
582     N_("\
583        --delete-after       delete files locally after downloading them.\n"),
584     N_("\
585   -k,  --convert-links      make links in downloaded HTML point to local files.\n"),
586     N_("\
587   -K,  --backup-converted   before converting file X, back up as X.orig.\n"),
588     N_("\
589   -m,  --mirror             shortcut option equivalent to -r -N -l inf -nr.\n"),
590     N_("\
591   -p,  --page-requisites    get all images, etc. needed to display HTML page.\n"),
592     N_("\
593        --strict-comments    turn on strict (SGML) handling of HTML comments.\n"),
594     "\n",
595
596     N_("\
597 Recursive accept/reject:\n"),
598     N_("\
599   -A,  --accept=LIST               comma-separated list of accepted extensions.\n"),
600     N_("\
601   -R,  --reject=LIST               comma-separated list of rejected extensions.\n"),
602     N_("\
603   -D,  --domains=LIST              comma-separated list of accepted domains.\n"),
604     N_("\
605        --exclude-domains=LIST      comma-separated list of rejected domains.\n"),
606     N_("\
607        --follow-ftp                follow FTP links from HTML documents.\n"),
608     N_("\
609        --follow-tags=LIST          comma-separated list of followed HTML tags.\n"),
610     N_("\
611        --ignore-tags=LIST          comma-separated list of ignored HTML tags.\n"),
612     N_("\
613   -H,  --span-hosts                go to foreign hosts when recursive.\n"),
614     N_("\
615   -L,  --relative                  follow relative links only.\n"),
616     N_("\
617   -I,  --include-directories=LIST  list of allowed directories.\n"),
618     N_("\
619   -X,  --exclude-directories=LIST  list of excluded directories.\n"),
620     N_("\
621   -np, --no-parent                 don't ascend to the parent directory.\n"),
622     "\n",
623
624     N_("Mail bug reports and suggestions to <bug-wget@gnu.org>.\n")
625   };
626
627   int i;
628
629   printf (_("GNU Wget %s, a non-interactive network retriever.\n"),
630           version_string);
631   print_usage ();
632
633   for (i = 0; i < countof (help); i++)
634     fputs (_(help[i]), stdout);
635
636   exit (0);
637 }
638
639 static void
640 print_version (void)
641 {
642   printf ("GNU Wget %s\n\n", version_string);
643   fputs (_("\
644 Copyright (C) 2005 Free Software Foundation, Inc.\n"), stdout);
645   fputs (_("\
646 This program is distributed in the hope that it will be useful,\n\
647 but WITHOUT ANY WARRANTY; without even the implied warranty of\n\
648 MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the\n\
649 GNU General Public License for more details.\n"), stdout);
650   fputs (_("\nOriginally written by Hrvoje Niksic <hniksic@xemacs.org>.\n"),
651          stdout);
652   exit (0);
653 }
654 \f
655 int
656 main (int argc, char *const *argv)
657 {
658   char **url, **t;
659   int i, ret, longindex;
660   int nurl, status;
661   int append_to_log = 0;
662
663   i18n_initialize ();
664
665   /* Construct the name of the executable, without the directory part.  */
666   exec_name = strrchr (argv[0], PATH_SEPARATOR);
667   if (!exec_name)
668     exec_name = argv[0];
669   else
670     ++exec_name;
671
672 #ifdef WINDOWS
673   /* Drop extension (typically .EXE) from executable filename. */
674   windows_main (&argc, (char **) argv, (char **) &exec_name);
675 #endif
676
677   /* Set option defaults; read the system wgetrc and ~/.wgetrc.  */
678   initialize ();
679
680   init_switches ();
681   longindex = -1;
682   while ((ret = getopt_long (argc, argv,
683                              short_options, long_options, &longindex)) != -1)
684     {
685       int val;
686       struct cmdline_option *opt;
687
688       /* If LONGINDEX is unchanged, it means RET is referring a short
689          option.  */
690       if (longindex == -1)
691         {
692           if (ret == '?')
693             {
694               print_usage ();
695               printf ("\n");
696               printf (_("Try `%s --help' for more options.\n"), exec_name);
697               exit (2);
698             }
699           /* Find the short option character in the mapping.  */
700           longindex = optmap[ret - 32];
701         }
702       val = long_options[longindex].val;
703
704       /* Use the retrieved value to locate the option in the
705          option_data array, and to see if we're dealing with the
706          negated "--no-FOO" variant of the boolean option "--foo".  */
707       opt = &option_data[val & ~BOOLEAN_NEG_MARKER];
708       switch (opt->type)
709         {
710         case OPT_VALUE:
711           setoptval (opt->data, optarg);
712           break;
713         case OPT_BOOLEAN:
714           if (optarg)
715             /* The user has specified a value -- use it. */
716             setoptval (opt->data, optarg);
717           else
718             {
719               /* NEG is true for `--no-FOO' style boolean options. */
720               int neg = val & BOOLEAN_NEG_MARKER;
721               setoptval (opt->data, neg ? "0" : "1");
722             }
723           break;
724         case OPT_FUNCALL:
725           {
726             void (*func) PARAMS ((void)) = (void (*) PARAMS ((void))) opt->data;
727             func ();
728           }
729           break;
730         case OPT__APPEND_OUTPUT:
731           setoptval ("logfile", optarg);
732           append_to_log = 1;
733           break;
734         case OPT__EXECUTE:
735           run_command (optarg);
736           break;
737         case OPT__NO:
738           {
739             /* We support real --no-FOO flags now, but keep these
740                short options for convenience and backward
741                compatibility.  */
742             char *p;
743             for (p = optarg; *p; p++)
744               switch (*p)
745                 {
746                 case 'v':
747                   setoptval ("verbose", "0");
748                   break;
749                 case 'H':
750                   setoptval ("addhostdir", "0");
751                   break;
752                 case 'd':
753                   setoptval ("dirstruct", "0");
754                   break;
755                 case 'c':
756                   setoptval ("noclobber", "1");
757                   break;
758                 case 'p':
759                   setoptval ("noparent", "1");
760                   break;
761                 default:
762                   printf (_("%s: illegal option -- `-n%c'\n"), exec_name, *p);
763                   print_usage ();
764                   printf ("\n");
765                   printf (_("Try `%s --help' for more options.\n"), exec_name);
766                   exit (1);
767                 }
768             break;
769           }
770         case OPT__PARENT:
771         case OPT__CLOBBER:
772           {
773             /* The wgetrc commands are named noparent and noclobber,
774                so we must revert the meaning of the cmdline options
775                before passing the value to setoptval.  */
776             int flag = 1;
777             if (optarg)
778               flag = (*optarg == '1' || TOLOWER (*optarg) == 'y'
779                       || (TOLOWER (optarg[0]) == 'o'
780                           && TOLOWER (optarg[1]) == 'n'));
781             setoptval (opt->type == OPT__PARENT ? "noparent" : "noclobber",
782                        flag ? "0" : "1");
783             break;
784           }
785         case OPT__DONT_REMOVE_LISTING:
786           setoptval ("removelisting", "0");
787           break;
788         }
789
790       longindex = -1;
791     }
792
793   /* All user options have now been processed, so it's now safe to do
794      interoption dependency checks. */
795
796   if (opt.reclevel == 0)
797     opt.reclevel = INFINITE_RECURSION; /* see recur.h for commentary on this */
798
799   if (opt.page_requisites && !opt.recursive)
800     {
801       /* Don't set opt.recursive here because it would confuse the FTP
802          code.  Instead, call retrieve_tree below when either
803          page_requisites or recursive is requested.  */
804       opt.reclevel = 0;
805       if (!opt.no_dirstruct)
806         opt.dirstruct = 1;      /* normally handled by cmd_spec_recursive() */
807     }
808
809   if (opt.verbose == -1)
810     opt.verbose = !opt.quiet;
811
812   /* Sanity checks.  */
813   if (opt.verbose && opt.quiet)
814     {
815       printf (_("Can't be verbose and quiet at the same time.\n"));
816       print_usage ();
817       exit (1);
818     }
819   if (opt.timestamping && opt.noclobber)
820     {
821       printf (_("\
822 Can't timestamp and not clobber old files at the same time.\n"));
823       print_usage ();
824       exit (1);
825     }
826 #ifdef ENABLE_IPV6
827   if (opt.ipv4_only && opt.ipv6_only)
828     {
829       printf (_("Cannot specify both --inet4-only and --inet6-only.\n"));
830       print_usage ();
831       exit (1);
832     }
833 #endif
834
835   nurl = argc - optind;
836   if (!nurl && !opt.input_filename)
837     {
838       /* No URL specified.  */
839       printf (_("%s: missing URL\n"), exec_name);
840       print_usage ();
841       printf ("\n");
842       /* #### Something nicer should be printed here -- similar to the
843          pre-1.5 `--help' page.  */
844       printf (_("Try `%s --help' for more options.\n"), exec_name);
845       exit (1);
846     }
847
848   if (opt.background)
849     fork_to_background ();
850
851   /* Initialize progress.  Have to do this after the options are
852      processed so we know where the log file is.  */
853   if (opt.verbose)
854     set_progress_implementation (opt.progress_type);
855
856   /* Fill in the arguments.  */
857   url = alloca_array (char *, nurl + 1);
858   for (i = 0; i < nurl; i++, optind++)
859     {
860       char *rewritten = rewrite_shorthand_url (argv[optind]);
861       if (rewritten)
862         url[i] = rewritten;
863       else
864         url[i] = xstrdup (argv[optind]);
865     }
866   url[i] = NULL;
867
868   /* Initialize logging.  */
869   log_init (opt.lfilename, append_to_log);
870
871   DEBUGP (("DEBUG output created by Wget %s on %s.\n\n", version_string,
872            OS_TYPE));
873
874   /* Open the output filename if necessary.  */
875   if (opt.output_document)
876     {
877       extern FILE *output_stream;
878       extern int output_stream_regular;
879
880       if (HYPHENP (opt.output_document))
881         output_stream = stdout;
882       else
883         {
884           struct_stat st;
885           output_stream = fopen (opt.output_document,
886                                  opt.always_rest ? "ab" : "wb");
887           if (output_stream == NULL)
888             {
889               perror (opt.output_document);
890               exit (1);
891             }
892           if (fstat (fileno (output_stream), &st) == 0 && S_ISREG (st.st_mode))
893             output_stream_regular = 1;
894         }
895     }
896
897 #ifdef WINDOWS
898   ws_startup ();
899 #endif
900
901   /* Setup the signal handler to redirect output when hangup is
902      received.  */
903 #ifdef HAVE_SIGNAL
904   if (signal(SIGHUP, SIG_IGN) != SIG_IGN)
905     signal(SIGHUP, redirect_output_signal);
906   /* ...and do the same for SIGUSR1.  */
907   signal (SIGUSR1, redirect_output_signal);
908   /* Writing to a closed socket normally signals SIGPIPE, and the
909      process exits.  What we want is to ignore SIGPIPE and just check
910      for the return value of write().  */
911   signal (SIGPIPE, SIG_IGN);
912 #ifdef SIGWINCH
913   signal (SIGWINCH, progress_handle_sigwinch);
914 #endif
915 #endif /* HAVE_SIGNAL */
916
917   status = RETROK;              /* initialize it, just-in-case */
918   /* Retrieve the URLs from argument list.  */
919   for (t = url; *t; t++)
920     {
921       char *filename = NULL, *redirected_URL = NULL;
922       int dt;
923
924       if ((opt.recursive || opt.page_requisites)
925           && url_scheme (*t) != SCHEME_FTP)
926         status = retrieve_tree (*t);
927       else
928         status = retrieve_url (*t, &filename, &redirected_URL, NULL, &dt);
929
930       if (opt.delete_after && file_exists_p(filename))
931         {
932           DEBUGP (("Removing file due to --delete-after in main():\n"));
933           logprintf (LOG_VERBOSE, _("Removing %s.\n"), filename);
934           if (unlink (filename))
935             logprintf (LOG_NOTQUIET, "unlink: %s\n", strerror (errno));
936         }
937
938       xfree_null (redirected_URL);
939       xfree_null (filename);
940     }
941
942   /* And then from the input file, if any.  */
943   if (opt.input_filename)
944     {
945       int count;
946       status = retrieve_from_file (opt.input_filename, opt.force_html, &count);
947       if (!count)
948         logprintf (LOG_NOTQUIET, _("No URLs found in %s.\n"),
949                    opt.input_filename);
950     }
951   /* Print the downloaded sum.  */
952   if (opt.recursive || opt.page_requisites
953       || nurl > 1
954       || (opt.input_filename && total_downloaded_bytes != 0))
955     {
956       logprintf (LOG_NOTQUIET,
957                  _("\nFINISHED --%s--\nDownloaded: %s bytes in %d files\n"),
958                  time_str (NULL), with_thousand_seps_large (total_downloaded_bytes),
959                  opt.numurls);
960       /* Print quota warning, if exceeded.  */
961       if (opt.quota && total_downloaded_bytes > opt.quota)
962         logprintf (LOG_NOTQUIET,
963                    _("Download quota (%s bytes) EXCEEDED!\n"),
964                    with_thousand_seps_large (opt.quota));
965     }
966
967   if (opt.cookies_output)
968     save_cookies ();
969
970   if (opt.convert_links && !opt.delete_after)
971     convert_all_links ();
972
973   log_close ();
974   for (i = 0; i < nurl; i++)
975     xfree (url[i]);
976   cleanup ();
977
978 #ifdef DEBUG_MALLOC
979   print_malloc_debug_stats ();
980 #endif
981   if (status == RETROK)
982     return 0;
983   else
984     return 1;
985 }
986 \f
987 #ifdef HAVE_SIGNAL
988 /* Hangup signal handler.  When wget receives SIGHUP or SIGUSR1, it
989    will proceed operation as usual, trying to write into a log file.
990    If that is impossible, the output will be turned off.
991
992    #### It is unsafe to do call libc functions from a signal handler.
993    What we should do is, set a global variable, and have the code in
994    log.c pick it up.  */
995
996 static RETSIGTYPE
997 redirect_output_signal (int sig)
998 {
999   const char *signal_name = (sig == SIGHUP ? "SIGHUP" :
1000                              (sig == SIGUSR1 ? "SIGUSR1" :
1001                               "WTF?!"));
1002   log_request_redirect_output (signal_name);
1003   progress_schedule_redirect ();
1004   signal (sig, redirect_output_signal);
1005 }
1006 #endif /* HAVE_SIGNAL */