]> sjero.net Git - wget/blob - src/main.c
[svn] Merge of fix for bugs 20341 and 20410.
[wget] / src / main.c
1 /* Command line parsing.
2    Copyright (C) 1996-2006 Free Software Foundation, Inc.
3
4 This file is part of GNU Wget.
5
6 GNU Wget is free software; you can redistribute it and/or modify
7 it under the terms of the GNU General Public License as published by
8 the Free Software Foundation; either version 3 of the License, or
9 (at your option) any later version.
10
11 GNU Wget is distributed in the hope that it will be useful,
12 but WITHOUT ANY WARRANTY; without even the implied warranty of
13 MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
14 GNU General Public License for more details.
15
16 You should have received a copy of the GNU General Public License
17 along with Wget.  If not, see <http://www.gnu.org/licenses/>.
18
19 In addition, as a special exception, the Free Software Foundation
20 gives permission to link the code of its release of Wget with the
21 OpenSSL project's "OpenSSL" library (or with modified versions of it
22 that use the same license as the "OpenSSL" library), and distribute
23 the linked executables.  You must obey the GNU General Public License
24 in all respects for all of the code used other than "OpenSSL".  If you
25 modify this file, you may extend this exception to your version of the
26 file, but you are not obligated to do so.  If you do not wish to do
27 so, delete this exception statement from your version.  */
28
29 #include <config.h>
30
31 #include <stdio.h>
32 #include <stdlib.h>
33 #ifdef HAVE_UNISTD_H
34 # include <unistd.h>
35 #endif /* HAVE_UNISTD_H */
36 #include <string.h>
37 #include <signal.h>
38 #ifdef HAVE_NLS
39 # include <locale.h>
40 #endif
41 #include <assert.h>
42 #include <errno.h>
43 #include <time.h>
44
45 #include "wget.h"
46 #include "utils.h"
47 #include "init.h"
48 #include "retr.h"
49 #include "recur.h"
50 #include "host.h"
51 #include "url.h"
52 #include "progress.h"           /* for progress_handle_sigwinch */
53 #include "convert.h"
54 #include "spider.h"
55 #include "http.h"               /* for save_cookies */
56
57 /* On GNU system this will include system-wide getopt.h. */
58 #include "getopt.h"
59
60 #ifndef PATH_SEPARATOR
61 # define PATH_SEPARATOR '/'
62 #endif
63
64 struct options opt;
65
66 extern char *version_string;
67
68 #if defined(SIGHUP) || defined(SIGUSR1)
69 static void redirect_output_signal (int);
70 #endif
71
72 const char *exec_name;
73 \f
74 /* Initialize I18N/L10N.  That amounts to invoking setlocale, and
75    setting up gettext's message catalog using bindtextdomain and
76    textdomain.  Does nothing if NLS is disabled or missing.  */
77
78 static void
79 i18n_initialize (void)
80 {
81   /* HAVE_NLS implies existence of functions invoked here.  */
82 #ifdef HAVE_NLS
83   /* Set the current locale.  */
84   setlocale (LC_ALL, "");
85   /* Set the text message domain.  */
86   bindtextdomain ("wget", LOCALEDIR);
87   textdomain ("wget");
88 #endif /* HAVE_NLS */
89 }
90 \f
91 /* Definition of command-line options. */
92
93 static void print_help (void);
94 static void print_version (void);
95
96 #ifdef HAVE_SSL
97 # define IF_SSL(x) x
98 #else
99 # define IF_SSL(x) NULL
100 #endif
101
102 #ifdef ENABLE_DEBUG
103 # define WHEN_DEBUG(x) x
104 #else
105 # define WHEN_DEBUG(x) NULL
106 #endif
107
108 struct cmdline_option {
109   const char *long_name;
110   char short_name;
111   enum {
112     OPT_VALUE,
113     OPT_BOOLEAN,
114     OPT_FUNCALL,
115     /* Non-standard options that have to be handled specially in
116        main().  */
117     OPT__APPEND_OUTPUT,
118     OPT__CLOBBER,
119     OPT__DONT_REMOVE_LISTING,
120     OPT__EXECUTE,
121     OPT__NO,
122     OPT__PARENT
123   } type;
124   const void *data;             /* for standard options */
125   int argtype;                  /* for non-standard options */
126 };
127
128 static struct cmdline_option option_data[] =
129   {
130     { "accept", 'A', OPT_VALUE, "accept", -1 },
131     { "append-output", 'a', OPT__APPEND_OUTPUT, NULL, required_argument },
132     { "background", 'b', OPT_BOOLEAN, "background", -1 },
133     { "backup-converted", 'K', OPT_BOOLEAN, "backupconverted", -1 },
134     { "backups", 0, OPT_BOOLEAN, "backups", -1 },
135     { "base", 'B', OPT_VALUE, "base", -1 },
136     { "bind-address", 0, OPT_VALUE, "bindaddress", -1 },
137     { IF_SSL ("ca-certificate"), 0, OPT_VALUE, "cacertificate", -1 },
138     { IF_SSL ("ca-directory"), 0, OPT_VALUE, "cadirectory", -1 },
139     { "cache", 0, OPT_BOOLEAN, "cache", -1 },
140     { IF_SSL ("certificate"), 0, OPT_VALUE, "certificate", -1 },
141     { IF_SSL ("certificate-type"), 0, OPT_VALUE, "certificatetype", -1 },
142     { IF_SSL ("check-certificate"), 0, OPT_BOOLEAN, "checkcertificate", -1 },
143     { "clobber", 0, OPT__CLOBBER, NULL, optional_argument },
144     { "connect-timeout", 0, OPT_VALUE, "connecttimeout", -1 },
145     { "continue", 'c', OPT_BOOLEAN, "continue", -1 },
146     { "convert-links", 'k', OPT_BOOLEAN, "convertlinks", -1 },
147     { "content-disposition", 0, OPT_BOOLEAN, "contentdisposition", -1 },
148     { "cookies", 0, OPT_BOOLEAN, "cookies", -1 },
149     { "cut-dirs", 0, OPT_VALUE, "cutdirs", -1 },
150     { WHEN_DEBUG ("debug"), 'd', OPT_BOOLEAN, "debug", -1 },
151     { "delete-after", 0, OPT_BOOLEAN, "deleteafter", -1 },
152     { "directories", 0, OPT_BOOLEAN, "dirstruct", -1 },
153     { "directory-prefix", 'P', OPT_VALUE, "dirprefix", -1 },
154     { "dns-cache", 0, OPT_BOOLEAN, "dnscache", -1 },
155     { "dns-timeout", 0, OPT_VALUE, "dnstimeout", -1 },
156     { "domains", 'D', OPT_VALUE, "domains", -1 },
157     { "dont-remove-listing", 0, OPT__DONT_REMOVE_LISTING, NULL, no_argument },
158     { "dot-style", 0, OPT_VALUE, "dotstyle", -1 },
159     { "egd-file", 0, OPT_VALUE, "egdfile", -1 },
160     { "exclude-directories", 'X', OPT_VALUE, "excludedirectories", -1 },
161     { "exclude-domains", 0, OPT_VALUE, "excludedomains", -1 },
162     { "execute", 'e', OPT__EXECUTE, NULL, required_argument },
163     { "follow-ftp", 0, OPT_BOOLEAN, "followftp", -1 },
164     { "follow-tags", 0, OPT_VALUE, "followtags", -1 },
165     { "force-directories", 'x', OPT_BOOLEAN, "dirstruct", -1 },
166     { "force-html", 'F', OPT_BOOLEAN, "forcehtml", -1 },
167     { "ftp-password", 0, OPT_VALUE, "ftppassword", -1 },
168     { "ftp-user", 0, OPT_VALUE, "ftpuser", -1 },
169     { "glob", 0, OPT_BOOLEAN, "glob", -1 },
170     { "header", 0, OPT_VALUE, "header", -1 },
171     { "help", 'h', OPT_FUNCALL, (void *)print_help, no_argument },
172     { "host-directories", 0, OPT_BOOLEAN, "addhostdir", -1 },
173     { "html-extension", 'E', OPT_BOOLEAN, "htmlextension", -1 },
174     { "htmlify", 0, OPT_BOOLEAN, "htmlify", -1 },
175     { "http-keep-alive", 0, OPT_BOOLEAN, "httpkeepalive", -1 },
176     { "http-passwd", 0, OPT_VALUE, "httppassword", -1 }, /* deprecated */
177     { "http-password", 0, OPT_VALUE, "httppassword", -1 },
178     { "http-user", 0, OPT_VALUE, "httpuser", -1 },
179     { "ignore-case", 0, OPT_BOOLEAN, "ignorecase", -1 },
180     { "ignore-length", 0, OPT_BOOLEAN, "ignorelength", -1 },
181     { "ignore-tags", 0, OPT_VALUE, "ignoretags", -1 },
182     { "include-directories", 'I', OPT_VALUE, "includedirectories", -1 },
183 #ifdef ENABLE_IPV6
184     { "inet4-only", '4', OPT_BOOLEAN, "inet4only", -1 },
185     { "inet6-only", '6', OPT_BOOLEAN, "inet6only", -1 },
186 #endif
187     { "input-file", 'i', OPT_VALUE, "input", -1 },
188     { "keep-session-cookies", 0, OPT_BOOLEAN, "keepsessioncookies", -1 },
189     { "level", 'l', OPT_VALUE, "reclevel", -1 },
190     { "limit-rate", 0, OPT_VALUE, "limitrate", -1 },
191     { "load-cookies", 0, OPT_VALUE, "loadcookies", -1 },
192     { "mirror", 'm', OPT_BOOLEAN, "mirror", -1 },
193     { "no", 'n', OPT__NO, NULL, required_argument },
194     { "no-clobber", 0, OPT_BOOLEAN, "noclobber", -1 },
195     { "no-parent", 0, OPT_BOOLEAN, "noparent", -1 },
196     { "output-document", 'O', OPT_VALUE, "outputdocument", -1 },
197     { "output-file", 'o', OPT_VALUE, "logfile", -1 },
198     { "page-requisites", 'p', OPT_BOOLEAN, "pagerequisites", -1 },
199     { "parent", 0, OPT__PARENT, NULL, optional_argument },
200     { "passive-ftp", 0, OPT_BOOLEAN, "passiveftp", -1 },
201     { "password", 0, OPT_VALUE, "password", -1 },
202     { "post-data", 0, OPT_VALUE, "postdata", -1 },
203     { "post-file", 0, OPT_VALUE, "postfile", -1 },
204     { "prefer-family", 0, OPT_VALUE, "preferfamily", -1 },
205     { "preserve-permissions", 0, OPT_BOOLEAN, "preservepermissions", -1 },
206     { IF_SSL ("private-key"), 0, OPT_VALUE, "privatekey", -1 },
207     { IF_SSL ("private-key-type"), 0, OPT_VALUE, "privatekeytype", -1 },
208     { "progress", 0, OPT_VALUE, "progress", -1 },
209     { "protocol-directories", 0, OPT_BOOLEAN, "protocoldirectories", -1 },
210     { "proxy", 0, OPT_BOOLEAN, "useproxy", -1 },
211     { "proxy__compat", 'Y', OPT_VALUE, "useproxy", -1 }, /* back-compatible */
212     { "proxy-passwd", 0, OPT_VALUE, "proxypassword", -1 }, /* deprecated */
213     { "proxy-password", 0, OPT_VALUE, "proxypassword", -1 },
214     { "proxy-user", 0, OPT_VALUE, "proxyuser", -1 },
215     { "quiet", 'q', OPT_BOOLEAN, "quiet", -1 },
216     { "quota", 'Q', OPT_VALUE, "quota", -1 },
217     { "random-file", 0, OPT_VALUE, "randomfile", -1 },
218     { "random-wait", 0, OPT_BOOLEAN, "randomwait", -1 },
219     { "read-timeout", 0, OPT_VALUE, "readtimeout", -1 },
220     { "recursive", 'r', OPT_BOOLEAN, "recursive", -1 },
221     { "referer", 0, OPT_VALUE, "referer", -1 },
222     { "reject", 'R', OPT_VALUE, "reject", -1 },
223     { "relative", 'L', OPT_BOOLEAN, "relativeonly", -1 },
224     { "remove-listing", 0, OPT_BOOLEAN, "removelisting", -1 },
225     { "restrict-file-names", 0, OPT_BOOLEAN, "restrictfilenames", -1 },
226     { "retr-symlinks", 0, OPT_BOOLEAN, "retrsymlinks", -1 },
227     { "retry-connrefused", 0, OPT_BOOLEAN, "retryconnrefused", -1 },
228     { "save-cookies", 0, OPT_VALUE, "savecookies", -1 },
229     { "save-headers", 0, OPT_BOOLEAN, "saveheaders", -1 },
230     { IF_SSL ("secure-protocol"), 0, OPT_VALUE, "secureprotocol", -1 },
231     { "server-response", 'S', OPT_BOOLEAN, "serverresponse", -1 },
232     { "span-hosts", 'H', OPT_BOOLEAN, "spanhosts", -1 },
233     { "spider", 0, OPT_BOOLEAN, "spider", -1 },
234     { "strict-comments", 0, OPT_BOOLEAN, "strictcomments", -1 },
235     { "timeout", 'T', OPT_VALUE, "timeout", -1 },
236     { "timestamping", 'N', OPT_BOOLEAN, "timestamping", -1 },
237     { "tries", 't', OPT_VALUE, "tries", -1 },
238     { "user", 0, OPT_VALUE, "user", -1 },
239     { "user-agent", 'U', OPT_VALUE, "useragent", -1 },
240     { "verbose", 'v', OPT_BOOLEAN, "verbose", -1 },
241     { "verbose", 0, OPT_BOOLEAN, "verbose", -1 },
242     { "version", 'V', OPT_FUNCALL, (void *) print_version, no_argument },
243     { "wait", 'w', OPT_VALUE, "wait", -1 },
244     { "waitretry", 0, OPT_VALUE, "waitretry", -1 },
245   };
246
247 #undef WHEN_DEBUG
248 #undef IF_SSL
249
250 /* Return a string that contains S with "no-" prepended.  The string
251    is NUL-terminated and allocated off static storage at Wget
252    startup.  */
253
254 static char *
255 no_prefix (const char *s)
256 {
257   static char buffer[1024];
258   static char *p = buffer;
259
260   char *cp = p;
261   int size = 3 + strlen (s) + 1;  /* "no-STRING\0" */
262   if (p + size >= buffer + sizeof (buffer))
263     abort ();
264
265   cp[0] = 'n', cp[1] = 'o', cp[2] = '-';
266   strcpy (cp + 3, s);
267   p += size;
268   return cp;
269 }
270
271 /* The arguments that that main passes to getopt_long. */
272 static struct option long_options[2 * countof (option_data) + 1];
273 static char short_options[128];
274
275 /* Mapping between short option chars and option_data indices. */
276 static unsigned char optmap[96];
277
278 /* Marker for `--no-FOO' values in long_options.  */
279 #define BOOLEAN_NEG_MARKER 1024
280
281 /* Initialize the long_options array used by getopt_long from the data
282    in option_data.  */
283
284 static void
285 init_switches (void)
286 {
287   char *p = short_options;
288   int i, o = 0;
289   for (i = 0; i < countof (option_data); i++)
290     {
291       struct cmdline_option *opt = &option_data[i];
292       struct option *longopt;
293
294       if (!opt->long_name)
295         /* The option is disabled. */
296         continue;
297
298       longopt = &long_options[o++];
299       longopt->name = opt->long_name;
300       longopt->val = i;
301       if (opt->short_name)
302         {
303           *p++ = opt->short_name;
304           optmap[opt->short_name - 32] = longopt - long_options;
305         }
306       switch (opt->type)
307         {
308         case OPT_VALUE:
309           longopt->has_arg = required_argument;
310           if (opt->short_name)
311             *p++ = ':';
312           break;
313         case OPT_BOOLEAN:
314           /* Specify an optional argument for long options, so that
315              --option=off works the same as --no-option, for
316              compatibility with pre-1.10 Wget.  However, don't specify
317              optional arguments short-option booleans because they
318              prevent combining of short options.  */
319           longopt->has_arg = optional_argument;
320           /* For Boolean options, add the "--no-FOO" variant, which is
321              identical to "--foo", except it has opposite meaning and
322              it doesn't allow an argument.  */
323           longopt = &long_options[o++];
324           longopt->name = no_prefix (opt->long_name);
325           longopt->has_arg = no_argument;
326           /* Mask the value so we'll be able to recognize that we're
327              dealing with the false value.  */
328           longopt->val = i | BOOLEAN_NEG_MARKER;
329           break;
330         default:
331           assert (opt->argtype != -1);
332           longopt->has_arg = opt->argtype;
333           if (opt->short_name)
334             {
335               if (longopt->has_arg == required_argument)
336                 *p++ = ':';
337               /* Don't handle optional_argument */
338             }
339         }
340     }
341   /* Terminate short_options. */
342   *p = '\0';
343   /* No need for xzero(long_options[o]) because its storage is static
344      and it will be zeroed by default.  */
345   assert (o <= countof (long_options));
346 }
347
348 /* Print the usage message.  */
349 static void
350 print_usage (void)
351 {
352   printf (_("Usage: %s [OPTION]... [URL]...\n"), exec_name);
353 }
354
355 /* Print the help message, describing all the available options.  If
356    you add an option, be sure to update this list.  */
357 static void
358 print_help (void)
359 {
360   /* We split the help text this way to ease translation of individual
361      entries.  */
362   static const char *help[] = {
363     "\n",
364     N_("\
365 Mandatory arguments to long options are mandatory for short options too.\n\n"),
366     N_("\
367 Startup:\n"),
368     N_("\
369   -V,  --version           display the version of Wget and exit.\n"),
370     N_("\
371   -h,  --help              print this help.\n"),
372     N_("\
373   -b,  --background        go to background after startup.\n"),
374     N_("\
375   -e,  --execute=COMMAND   execute a `.wgetrc'-style command.\n"),
376     "\n",
377
378     N_("\
379 Logging and input file:\n"),
380     N_("\
381   -o,  --output-file=FILE    log messages to FILE.\n"),
382     N_("\
383   -a,  --append-output=FILE  append messages to FILE.\n"),
384 #ifdef ENABLE_DEBUG
385     N_("\
386   -d,  --debug               print lots of debugging information.\n"),
387 #endif
388     N_("\
389   -q,  --quiet               quiet (no output).\n"),
390     N_("\
391   -v,  --verbose             be verbose (this is the default).\n"),
392     N_("\
393   -nv, --no-verbose          turn off verboseness, without being quiet.\n"),
394     N_("\
395   -i,  --input-file=FILE     download URLs found in FILE.\n"),
396     N_("\
397   -F,  --force-html          treat input file as HTML.\n"),
398     N_("\
399   -B,  --base=URL            prepends URL to relative links in -F -i file.\n"),
400     "\n",
401
402     N_("\
403 Download:\n"),
404     N_("\
405   -t,  --tries=NUMBER            set number of retries to NUMBER (0 unlimits).\n"),
406     N_("\
407        --retry-connrefused       retry even if connection is refused.\n"),
408     N_("\
409   -O,  --output-document=FILE    write documents to FILE.\n"),
410     N_("\
411   -nc, --no-clobber              skip downloads that would download to\n\
412                                  existing files.\n"),
413     N_("\
414   -c,  --continue                resume getting a partially-downloaded file.\n"),
415     N_("\
416        --progress=TYPE           select progress gauge type.\n"),
417     N_("\
418   -N,  --timestamping            don't re-retrieve files unless newer than\n\
419                                  local.\n"),
420     N_("\
421   -S,  --server-response         print server response.\n"),
422     N_("\
423        --spider                  don't download anything.\n"),
424     N_("\
425   -T,  --timeout=SECONDS         set all timeout values to SECONDS.\n"),
426     N_("\
427        --dns-timeout=SECS        set the DNS lookup timeout to SECS.\n"),
428     N_("\
429        --connect-timeout=SECS    set the connect timeout to SECS.\n"),
430     N_("\
431        --read-timeout=SECS       set the read timeout to SECS.\n"),
432     N_("\
433   -w,  --wait=SECONDS            wait SECONDS between retrievals.\n"),
434     N_("\
435        --waitretry=SECONDS       wait 1..SECONDS between retries of a retrieval.\n"),
436     N_("\
437        --random-wait             wait from 0...2*WAIT secs between retrievals.\n"),
438     N_("\
439   -Y,  --proxy                   explicitly turn on proxy.\n"),
440     N_("\
441        --no-proxy                explicitly turn off proxy.\n"),
442     N_("\
443   -Q,  --quota=NUMBER            set retrieval quota to NUMBER.\n"),
444     N_("\
445        --bind-address=ADDRESS    bind to ADDRESS (hostname or IP) on local host.\n"),
446     N_("\
447        --limit-rate=RATE         limit download rate to RATE.\n"),
448     N_("\
449        --no-dns-cache            disable caching DNS lookups.\n"),
450     N_("\
451        --restrict-file-names=OS  restrict chars in file names to ones OS allows.\n"),
452     N_("\
453        --ignore-case             ignore case when matching files/directories.\n"),
454 #ifdef ENABLE_IPV6
455     N_("\
456   -4,  --inet4-only              connect only to IPv4 addresses.\n"),
457     N_("\
458   -6,  --inet6-only              connect only to IPv6 addresses.\n"),
459     N_("\
460        --prefer-family=FAMILY    connect first to addresses of specified family,\n\
461                                  one of IPv6, IPv4, or none.\n"),
462 #endif
463     N_("\
464        --user=USER               set both ftp and http user to USER.\n"),
465     N_("\
466        --password=PASS           set both ftp and http password to PASS.\n"),
467     "\n",
468
469     N_("\
470 Directories:\n"),
471     N_("\
472   -nd, --no-directories           don't create directories.\n"),
473     N_("\
474   -x,  --force-directories        force creation of directories.\n"),
475     N_("\
476   -nH, --no-host-directories      don't create host directories.\n"),
477     N_("\
478        --protocol-directories     use protocol name in directories.\n"),
479     N_("\
480   -P,  --directory-prefix=PREFIX  save files to PREFIX/...\n"),
481     N_("\
482        --cut-dirs=NUMBER          ignore NUMBER remote directory components.\n"),
483     "\n",
484
485     N_("\
486 HTTP options:\n"),
487     N_("\
488        --http-user=USER        set http user to USER.\n"),
489     N_("\
490        --http-password=PASS    set http password to PASS.\n"),
491     N_("\
492        --no-cache              disallow server-cached data.\n"),
493     N_("\
494   -E,  --html-extension        save HTML documents with `.html' extension.\n"),
495     N_("\
496        --ignore-length         ignore `Content-Length' header field.\n"),
497     N_("\
498        --header=STRING         insert STRING among the headers.\n"),
499     N_("\
500        --proxy-user=USER       set USER as proxy username.\n"),
501     N_("\
502        --proxy-password=PASS   set PASS as proxy password.\n"),
503     N_("\
504        --referer=URL           include `Referer: URL' header in HTTP request.\n"),
505     N_("\
506        --save-headers          save the HTTP headers to file.\n"),
507     N_("\
508   -U,  --user-agent=AGENT      identify as AGENT instead of Wget/VERSION.\n"),
509     N_("\
510        --no-http-keep-alive    disable HTTP keep-alive (persistent connections).\n"),
511     N_("\
512        --no-cookies            don't use cookies.\n"),
513     N_("\
514        --load-cookies=FILE     load cookies from FILE before session.\n"),
515     N_("\
516        --save-cookies=FILE     save cookies to FILE after session.\n"),
517     N_("\
518        --keep-session-cookies  load and save session (non-permanent) cookies.\n"),
519     N_("\
520        --post-data=STRING      use the POST method; send STRING as the data.\n"),
521     N_("\
522        --post-file=FILE        use the POST method; send contents of FILE.\n"),
523     N_("\
524        --no-content-disposition  don't honor Content-Disposition header.\n"),
525     "\n",
526
527 #ifdef HAVE_SSL
528     N_("\
529 HTTPS (SSL/TLS) options:\n"),
530     N_("\
531        --secure-protocol=PR     choose secure protocol, one of auto, SSLv2,\n\
532                                 SSLv3, and TLSv1.\n"),
533     N_("\
534        --no-check-certificate   don't validate the server's certificate.\n"),
535     N_("\
536        --certificate=FILE       client certificate file.\n"),
537     N_("\
538        --certificate-type=TYPE  client certificate type, PEM or DER.\n"),
539     N_("\
540        --private-key=FILE       private key file.\n"),
541     N_("\
542        --private-key-type=TYPE  private key type, PEM or DER.\n"),
543     N_("\
544        --ca-certificate=FILE    file with the bundle of CA's.\n"),
545     N_("\
546        --ca-directory=DIR       directory where hash list of CA's is stored.\n"),
547     N_("\
548        --random-file=FILE       file with random data for seeding the SSL PRNG.\n"),
549     N_("\
550        --egd-file=FILE          file naming the EGD socket with random data.\n"),
551     "\n",
552 #endif /* HAVE_SSL */
553
554     N_("\
555 FTP options:\n"),
556     N_("\
557        --ftp-user=USER         set ftp user to USER.\n"),
558     N_("\
559        --ftp-password=PASS     set ftp password to PASS.\n"),
560     N_("\
561        --no-remove-listing     don't remove `.listing' files.\n"),
562     N_("\
563        --no-glob               turn off FTP file name globbing.\n"),
564     N_("\
565        --no-passive-ftp        disable the \"passive\" transfer mode.\n"),
566     N_("\
567        --retr-symlinks         when recursing, get linked-to files (not dir).\n"),
568     N_("\
569        --preserve-permissions  preserve remote file permissions.\n"),
570     "\n",
571
572     N_("\
573 Recursive download:\n"),
574     N_("\
575   -r,  --recursive          specify recursive download.\n"),
576     N_("\
577   -l,  --level=NUMBER       maximum recursion depth (inf or 0 for infinite).\n"),
578     N_("\
579        --delete-after       delete files locally after downloading them.\n"),
580     N_("\
581   -k,  --convert-links      make links in downloaded HTML point to local files.\n"),
582     N_("\
583   -K,  --backup-converted   before converting file X, back up as X.orig.\n"),
584     N_("\
585   -m,  --mirror             shortcut for -N -r -l inf --no-remove-listing.\n"),
586     N_("\
587   -p,  --page-requisites    get all images, etc. needed to display HTML page.\n"),
588     N_("\
589        --strict-comments    turn on strict (SGML) handling of HTML comments.\n"),
590     "\n",
591
592     N_("\
593 Recursive accept/reject:\n"),
594     N_("\
595   -A,  --accept=LIST               comma-separated list of accepted extensions.\n"),
596     N_("\
597   -R,  --reject=LIST               comma-separated list of rejected extensions.\n"),
598     N_("\
599   -D,  --domains=LIST              comma-separated list of accepted domains.\n"),
600     N_("\
601        --exclude-domains=LIST      comma-separated list of rejected domains.\n"),
602     N_("\
603        --follow-ftp                follow FTP links from HTML documents.\n"),
604     N_("\
605        --follow-tags=LIST          comma-separated list of followed HTML tags.\n"),
606     N_("\
607        --ignore-tags=LIST          comma-separated list of ignored HTML tags.\n"),
608     N_("\
609   -H,  --span-hosts                go to foreign hosts when recursive.\n"),
610     N_("\
611   -L,  --relative                  follow relative links only.\n"),
612     N_("\
613   -I,  --include-directories=LIST  list of allowed directories.\n"),
614     N_("\
615   -X,  --exclude-directories=LIST  list of excluded directories.\n"),
616     N_("\
617   -np, --no-parent                 don't ascend to the parent directory.\n"),
618     "\n",
619
620     N_("Mail bug reports and suggestions to <bug-wget@gnu.org>.\n")
621   };
622
623   int i;
624
625   printf (_("GNU Wget %s, a non-interactive network retriever.\n"),
626           version_string);
627   print_usage ();
628
629   for (i = 0; i < countof (help); i++)
630     fputs (_(help[i]), stdout);
631
632   exit (0);
633 }
634
635 /* Return a human-readable printed representation of INTERVAL,
636    measured in seconds.  */
637
638 static char *
639 secs_to_human_time (double interval)
640 {
641   static char buf[32];
642   int secs = (int) (interval + 0.5);
643   int hours, mins, days;
644
645   days = secs / 86400, secs %= 86400;
646   hours = secs / 3600, secs %= 3600;
647   mins = secs / 60, secs %= 60;
648
649   if (days)
650     sprintf (buf, "%dd %dh %dm %ds", days, hours, mins, secs);
651   else if (hours)
652     sprintf (buf, "%dh %dm %ds", hours, mins, secs);
653   else if (mins)
654     sprintf (buf, "%dm %ds", mins, secs);
655   else
656     sprintf (buf, "%ss", print_decimal (interval));
657
658   return buf;
659 }
660
661 static void
662 print_version (void)
663 {
664   printf ("GNU Wget %s\n\n", version_string);
665   fputs (_("\
666 Copyright (C) 2007 Free Software Foundation, Inc.\n"), stdout);
667   fputs (_("\
668 License GPLv3+: GNU GPL version 3 or later <http://gnu.org/licenses/gpl.html>\n\
669 This is free software: you are free to change and redistribute it.\n\
670 There is NO WARRANTY, to the extent permitted by law.\n", stdout);
671   fputs (_("\nOriginally written by Hrvoje Niksic <hniksic@xemacs.org>.\n"),
672          stdout);
673   fputs (_("Currently maintained by Micah Cowan <micah@cowan.name>.\n"),
674          stdout);
675   exit (0);
676 }
677 \f
678 #ifndef TESTING
679 int
680 main (int argc, char *const *argv)
681 {
682   char **url, **t;
683   int i, ret, longindex;
684   int nurl, status;
685   bool append_to_log = false;
686
687   i18n_initialize ();
688
689   /* Construct the name of the executable, without the directory part.  */
690   exec_name = strrchr (argv[0], PATH_SEPARATOR);
691   if (!exec_name)
692     exec_name = argv[0];
693   else
694     ++exec_name;
695
696 #ifdef WINDOWS
697   /* Drop extension (typically .EXE) from executable filename. */
698   windows_main (&argc, (char **) argv, (char **) &exec_name);
699 #endif
700
701   /* Set option defaults; read the system wgetrc and ~/.wgetrc.  */
702   initialize ();
703
704   init_switches ();
705   longindex = -1;
706   while ((ret = getopt_long (argc, argv,
707                              short_options, long_options, &longindex)) != -1)
708     {
709       int val;
710       struct cmdline_option *opt;
711
712       /* If LONGINDEX is unchanged, it means RET is referring a short
713          option.  */
714       if (longindex == -1)
715         {
716           if (ret == '?')
717             {
718               print_usage ();
719               printf ("\n");
720               printf (_("Try `%s --help' for more options.\n"), exec_name);
721               exit (2);
722             }
723           /* Find the short option character in the mapping.  */
724           longindex = optmap[ret - 32];
725         }
726       val = long_options[longindex].val;
727
728       /* Use the retrieved value to locate the option in the
729          option_data array, and to see if we're dealing with the
730          negated "--no-FOO" variant of the boolean option "--foo".  */
731       opt = &option_data[val & ~BOOLEAN_NEG_MARKER];
732       switch (opt->type)
733         {
734         case OPT_VALUE:
735           setoptval (opt->data, optarg, opt->long_name);
736           break;
737         case OPT_BOOLEAN:
738           if (optarg)
739             /* The user has specified a value -- use it. */
740             setoptval (opt->data, optarg, opt->long_name);
741           else
742             {
743               /* NEG is true for `--no-FOO' style boolean options. */
744               bool neg = !!(val & BOOLEAN_NEG_MARKER);
745               setoptval (opt->data, neg ? "0" : "1", opt->long_name);
746             }
747           break;
748         case OPT_FUNCALL:
749           {
750             void (*func) (void) = (void (*) (void)) opt->data;
751             func ();
752           }
753           break;
754         case OPT__APPEND_OUTPUT:
755           setoptval ("logfile", optarg, opt->long_name);
756           append_to_log = true;
757           break;
758         case OPT__EXECUTE:
759           run_command (optarg);
760           break;
761         case OPT__NO:
762           {
763             /* We support real --no-FOO flags now, but keep these
764                short options for convenience and backward
765                compatibility.  */
766             char *p;
767             for (p = optarg; *p; p++)
768               switch (*p)
769                 {
770                 case 'v':
771                   setoptval ("verbose", "0", opt->long_name);
772                   break;
773                 case 'H':
774                   setoptval ("addhostdir", "0", opt->long_name);
775                   break;
776                 case 'd':
777                   setoptval ("dirstruct", "0", opt->long_name);
778                   break;
779                 case 'c':
780                   setoptval ("noclobber", "1", opt->long_name);
781                   break;
782                 case 'p':
783                   setoptval ("noparent", "1", opt->long_name);
784                   break;
785                 default:
786                   printf (_("%s: illegal option -- `-n%c'\n"), exec_name, *p);
787                   print_usage ();
788                   printf ("\n");
789                   printf (_("Try `%s --help' for more options.\n"), exec_name);
790                   exit (1);
791                 }
792             break;
793           }
794         case OPT__PARENT:
795         case OPT__CLOBBER:
796           {
797             /* The wgetrc commands are named noparent and noclobber,
798                so we must revert the meaning of the cmdline options
799                before passing the value to setoptval.  */
800             bool flag = true;
801             if (optarg)
802               flag = (*optarg == '1' || TOLOWER (*optarg) == 'y'
803                       || (TOLOWER (optarg[0]) == 'o'
804                           && TOLOWER (optarg[1]) == 'n'));
805             setoptval (opt->type == OPT__PARENT ? "noparent" : "noclobber",
806                        flag ? "0" : "1", opt->long_name);
807             break;
808           }
809         case OPT__DONT_REMOVE_LISTING:
810           setoptval ("removelisting", "0", opt->long_name);
811           break;
812         }
813
814       longindex = -1;
815     }
816
817   nurl = argc - optind;
818
819   /* All user options have now been processed, so it's now safe to do
820      interoption dependency checks. */
821
822   if (opt.reclevel == 0)
823     opt.reclevel = INFINITE_RECURSION; /* see recur.h for commentary on this */
824
825   if (opt.page_requisites && !opt.recursive)
826     {
827       /* Don't set opt.recursive here because it would confuse the FTP
828          code.  Instead, call retrieve_tree below when either
829          page_requisites or recursive is requested.  */
830       opt.reclevel = 0;
831       if (!opt.no_dirstruct)
832         opt.dirstruct = 1;      /* normally handled by cmd_spec_recursive() */
833     }
834
835   if (opt.verbose == -1)
836     opt.verbose = !opt.quiet;
837
838   /* Sanity checks.  */
839   if (opt.verbose && opt.quiet)
840     {
841       printf (_("Can't be verbose and quiet at the same time.\n"));
842       print_usage ();
843       exit (1);
844     }
845   if (opt.timestamping && opt.noclobber)
846     {
847       printf (_("\
848 Can't timestamp and not clobber old files at the same time.\n"));
849       print_usage ();
850       exit (1);
851     }
852 #ifdef ENABLE_IPV6
853   if (opt.ipv4_only && opt.ipv6_only)
854     {
855       printf (_("Cannot specify both --inet4-only and --inet6-only.\n"));
856       print_usage ();
857       exit (1);
858     }
859 #endif
860   if (opt.output_document
861       && (opt.page_requisites
862           || opt.recursive
863           || opt.timestamping))
864     {
865           printf (_("Cannot specify -r, -p or -N if -O is given.\n"));
866           print_usage ();
867           exit (1);
868     }
869   if (opt.output_document
870       && opt.convert_links 
871       && nurl > 1)
872     {
873           printf (_("Cannot specify both -k and -O if multiple URLs are given.\n"));
874           print_usage ();
875           exit (1);
876     }
877
878   if (!nurl && !opt.input_filename)
879     {
880       /* No URL specified.  */
881       printf (_("%s: missing URL\n"), exec_name);
882       print_usage ();
883       printf ("\n");
884       /* #### Something nicer should be printed here -- similar to the
885          pre-1.5 `--help' page.  */
886       printf (_("Try `%s --help' for more options.\n"), exec_name);
887       exit (1);
888     }
889
890   if (opt.background)
891     fork_to_background ();
892
893   /* Initialize progress.  Have to do this after the options are
894      processed so we know where the log file is.  */
895   if (opt.verbose)
896     set_progress_implementation (opt.progress_type);
897
898   /* Fill in the arguments.  */
899   url = alloca_array (char *, nurl + 1);
900   for (i = 0; i < nurl; i++, optind++)
901     {
902       char *rewritten = rewrite_shorthand_url (argv[optind]);
903       if (rewritten)
904         url[i] = rewritten;
905       else
906         url[i] = xstrdup (argv[optind]);
907     }
908   url[i] = NULL;
909
910   /* Initialize logging.  */
911   log_init (opt.lfilename, append_to_log);
912
913   DEBUGP (("DEBUG output created by Wget %s on %s.\n\n", version_string,
914            OS_TYPE));
915
916   /* Open the output filename if necessary.  */
917   if (opt.output_document)
918     {
919       if (HYPHENP (opt.output_document))
920         output_stream = stdout;
921       else
922         {
923           struct_fstat st;
924           output_stream = fopen (opt.output_document,
925                                  opt.always_rest ? "ab" : "wb");
926           if (output_stream == NULL)
927             {
928               perror (opt.output_document);
929               exit (1);
930             }
931           if (fstat (fileno (output_stream), &st) == 0 && S_ISREG (st.st_mode))
932             output_stream_regular = true;
933         }
934     }
935
936 #ifdef WINDOWS
937   ws_startup ();
938 #endif
939
940 #ifdef SIGHUP
941   /* Setup the signal handler to redirect output when hangup is
942      received.  */
943   if (signal(SIGHUP, SIG_IGN) != SIG_IGN)
944     signal(SIGHUP, redirect_output_signal);
945 #endif
946   /* ...and do the same for SIGUSR1.  */
947 #ifdef SIGUSR1
948   signal (SIGUSR1, redirect_output_signal);
949 #endif
950 #ifdef SIGPIPE
951   /* Writing to a closed socket normally signals SIGPIPE, and the
952      process exits.  What we want is to ignore SIGPIPE and just check
953      for the return value of write().  */
954   signal (SIGPIPE, SIG_IGN);
955 #endif
956 #ifdef SIGWINCH
957   signal (SIGWINCH, progress_handle_sigwinch);
958 #endif
959
960   status = RETROK;              /* initialize it, just-in-case */
961   /* Retrieve the URLs from argument list.  */
962   for (t = url; *t; t++)
963     {
964       char *filename = NULL, *redirected_URL = NULL;
965       int dt;
966
967       if ((opt.recursive || opt.page_requisites)
968           && (url_scheme (*t) != SCHEME_FTP || url_uses_proxy (*t)))
969         {
970           int old_follow_ftp = opt.follow_ftp;
971
972           /* Turn opt.follow_ftp on in case of recursive FTP retrieval */
973           if (url_scheme (*t) == SCHEME_FTP) 
974             opt.follow_ftp = 1;
975           
976           status = retrieve_tree (*t);
977
978           opt.follow_ftp = old_follow_ftp;
979         }
980       else
981         status = retrieve_url (*t, &filename, &redirected_URL, NULL, &dt, opt.recursive);
982
983       if (opt.delete_after && file_exists_p(filename))
984         {
985           DEBUGP (("Removing file due to --delete-after in main():\n"));
986           logprintf (LOG_VERBOSE, _("Removing %s.\n"), filename);
987           if (unlink (filename))
988             logprintf (LOG_NOTQUIET, "unlink: %s\n", strerror (errno));
989         }
990
991       xfree_null (redirected_URL);
992       xfree_null (filename);
993     }
994
995   /* And then from the input file, if any.  */
996   if (opt.input_filename)
997     {
998       int count;
999       status = retrieve_from_file (opt.input_filename, opt.force_html, &count);
1000       if (!count)
1001         logprintf (LOG_NOTQUIET, _("No URLs found in %s.\n"),
1002                    opt.input_filename);
1003     }
1004
1005   /* Print broken links. */
1006   if (opt.recursive && opt.spider)
1007     {
1008       print_broken_links();
1009     }
1010   
1011   /* Print the downloaded sum.  */
1012   if ((opt.recursive || opt.page_requisites
1013        || nurl > 1
1014        || (opt.input_filename && total_downloaded_bytes != 0))
1015       &&
1016       total_downloaded_bytes != 0)
1017     {
1018       logprintf (LOG_NOTQUIET,
1019                  _("FINISHED --%s--\nDownloaded: %d files, %s in %s (%s)\n"),
1020                  time_str (time (NULL)),
1021                  opt.numurls,
1022                  human_readable (total_downloaded_bytes),
1023                  secs_to_human_time (total_download_time),
1024                  retr_rate (total_downloaded_bytes, total_download_time));
1025       /* Print quota warning, if exceeded.  */
1026       if (opt.quota && total_downloaded_bytes > opt.quota)
1027         logprintf (LOG_NOTQUIET,
1028                    _("Download quota of %s EXCEEDED!\n"),
1029                    human_readable (opt.quota));
1030     }
1031
1032   if (opt.cookies_output)
1033     save_cookies ();
1034
1035   if (opt.convert_links && !opt.delete_after)
1036     convert_all_links ();
1037
1038   log_close ();
1039   for (i = 0; i < nurl; i++)
1040     xfree (url[i]);
1041   cleanup ();
1042
1043 #ifdef DEBUG_MALLOC
1044   print_malloc_debug_stats ();
1045 #endif
1046   if (status == RETROK)
1047     return 0;
1048   else
1049     return 1;
1050 }
1051 #endif /* TESTING */
1052 \f
1053 #if defined(SIGHUP) || defined(SIGUSR1)
1054
1055 /* So the signal_name check doesn't blow when only one is available. */
1056 #ifndef SIGHUP
1057 # define SIGHUP -1
1058 #endif
1059 #ifndef SIGUSR1
1060 # define SIGUSR1 -1
1061 #endif
1062
1063 /* Hangup signal handler.  When wget receives SIGHUP or SIGUSR1, it
1064    will proceed operation as usual, trying to write into a log file.
1065    If that is impossible, the output will be turned off.  */
1066
1067 static void
1068 redirect_output_signal (int sig)
1069 {
1070   const char *signal_name = (sig == SIGHUP ? "SIGHUP" :
1071                              (sig == SIGUSR1 ? "SIGUSR1" :
1072                               "WTF?!"));
1073   log_request_redirect_output (signal_name);
1074   progress_schedule_redirect ();
1075   signal (sig, redirect_output_signal);
1076 }
1077 #endif
1078
1079 /*
1080  * vim: et ts=2 sw=2
1081  */