]> sjero.net Git - wget/blob - src/main.c
Use Gnulib's alloc functions throughout the source.
[wget] / src / main.c
1 /* Command line parsing.
2    Copyright (C) 1996, 1997, 1998, 1999, 2000, 2001, 2002, 2003,
3    2004, 2005, 2006, 2007, 2008 Free Software Foundation, Inc.
4
5 This file is part of GNU Wget.
6
7 GNU Wget is free software; you can redistribute it and/or modify
8 it under the terms of the GNU General Public License as published by
9 the Free Software Foundation; either version 3 of the License, or
10 (at your option) any later version.
11
12 GNU Wget is distributed in the hope that it will be useful,
13 but WITHOUT ANY WARRANTY; without even the implied warranty of
14 MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15 GNU General Public License for more details.
16
17 You should have received a copy of the GNU General Public License
18 along with Wget.  If not, see <http://www.gnu.org/licenses/>.
19
20 Additional permission under GNU GPL version 3 section 7
21
22 If you modify this program, or any covered work, by linking or
23 combining it with the OpenSSL project's OpenSSL library (or a
24 modified version of that library), containing parts covered by the
25 terms of the OpenSSL or SSLeay licenses, the Free Software Foundation
26 grants you additional permission to convey the resulting work.
27 Corresponding Source for a non-source form of such a combination
28 shall include the source code for the parts of OpenSSL used as well
29 as that of the covered work.  */
30
31 #define USE_GNULIB_ALLOC
32
33 #include "wget.h"
34
35 #include <stdio.h>
36 #include <stdlib.h>
37 #ifdef HAVE_UNISTD_H
38 # include <unistd.h>
39 #endif /* HAVE_UNISTD_H */
40 #include <string.h>
41 #include <signal.h>
42 #ifdef ENABLE_NLS
43 # include <locale.h>
44 #endif
45 #include <assert.h>
46 #include <errno.h>
47 #include <time.h>
48
49 #include "utils.h"
50 #include "init.h"
51 #include "retr.h"
52 #include "recur.h"
53 #include "host.h"
54 #include "url.h"
55 #include "progress.h"           /* for progress_handle_sigwinch */
56 #include "convert.h"
57 #include "spider.h"
58 #include "http.h"               /* for save_cookies */
59
60 #include <getopt.h>
61
62 #ifndef PATH_SEPARATOR
63 # define PATH_SEPARATOR '/'
64 #endif
65
66 struct options opt;
67
68 extern char *version_string;
69
70 #if defined(SIGHUP) || defined(SIGUSR1)
71 static void redirect_output_signal (int);
72 #endif
73
74 const char *exec_name;
75 \f
76 #ifndef TESTING
77 /* Initialize I18N/L10N.  That amounts to invoking setlocale, and
78    setting up gettext's message catalog using bindtextdomain and
79    textdomain.  Does nothing if NLS is disabled or missing.  */
80
81 static void
82 i18n_initialize (void)
83 {
84   /* ENABLE_NLS implies existence of functions invoked here.  */
85 #ifdef ENABLE_NLS
86   /* Set the current locale.  */
87   setlocale (LC_ALL, "");
88   /* Set the text message domain.  */
89   bindtextdomain ("wget", LOCALEDIR);
90   textdomain ("wget");
91 #endif /* ENABLE_NLS */
92 }
93 \f
94 /* Definition of command-line options. */
95
96 static void print_help (void);
97 static void print_version (void);
98
99 #ifdef HAVE_SSL
100 # define IF_SSL(x) x
101 #else
102 # define IF_SSL(x) NULL
103 #endif
104
105 #ifdef ENABLE_DEBUG
106 # define WHEN_DEBUG(x) x
107 #else
108 # define WHEN_DEBUG(x) NULL
109 #endif
110
111 struct cmdline_option {
112   const char *long_name;
113   char short_name;
114   enum {
115     OPT_VALUE,
116     OPT_BOOLEAN,
117     OPT_FUNCALL,
118     /* Non-standard options that have to be handled specially in
119        main().  */
120     OPT__APPEND_OUTPUT,
121     OPT__CLOBBER,
122     OPT__DONT_REMOVE_LISTING,
123     OPT__EXECUTE,
124     OPT__NO,
125     OPT__PARENT
126   } type;
127   const void *data;             /* for standard options */
128   int argtype;                  /* for non-standard options */
129 };
130
131 static struct cmdline_option option_data[] =
132   {
133     { "accept", 'A', OPT_VALUE, "accept", -1 },
134     { "append-output", 'a', OPT__APPEND_OUTPUT, NULL, required_argument },
135     { "auth-no-challenge", 0, OPT_BOOLEAN, "authnochallenge", -1 },
136     { "background", 'b', OPT_BOOLEAN, "background", -1 },
137     { "backup-converted", 'K', OPT_BOOLEAN, "backupconverted", -1 },
138     { "backups", 0, OPT_BOOLEAN, "backups", -1 },
139     { "base", 'B', OPT_VALUE, "base", -1 },
140     { "bind-address", 0, OPT_VALUE, "bindaddress", -1 },
141     { IF_SSL ("ca-certificate"), 0, OPT_VALUE, "cacertificate", -1 },
142     { IF_SSL ("ca-directory"), 0, OPT_VALUE, "cadirectory", -1 },
143     { "cache", 0, OPT_BOOLEAN, "cache", -1 },
144     { IF_SSL ("certificate"), 0, OPT_VALUE, "certificate", -1 },
145     { IF_SSL ("certificate-type"), 0, OPT_VALUE, "certificatetype", -1 },
146     { IF_SSL ("check-certificate"), 0, OPT_BOOLEAN, "checkcertificate", -1 },
147     { "clobber", 0, OPT__CLOBBER, NULL, optional_argument },
148     { "connect-timeout", 0, OPT_VALUE, "connecttimeout", -1 },
149     { "continue", 'c', OPT_BOOLEAN, "continue", -1 },
150     { "convert-links", 'k', OPT_BOOLEAN, "convertlinks", -1 },
151     { "content-disposition", 0, OPT_BOOLEAN, "contentdisposition", -1 },
152     { "cookies", 0, OPT_BOOLEAN, "cookies", -1 },
153     { "cut-dirs", 0, OPT_VALUE, "cutdirs", -1 },
154     { WHEN_DEBUG ("debug"), 'd', OPT_BOOLEAN, "debug", -1 },
155     { "delete-after", 0, OPT_BOOLEAN, "deleteafter", -1 },
156     { "directories", 0, OPT_BOOLEAN, "dirstruct", -1 },
157     { "directory-prefix", 'P', OPT_VALUE, "dirprefix", -1 },
158     { "dns-cache", 0, OPT_BOOLEAN, "dnscache", -1 },
159     { "dns-timeout", 0, OPT_VALUE, "dnstimeout", -1 },
160     { "domains", 'D', OPT_VALUE, "domains", -1 },
161     { "dont-remove-listing", 0, OPT__DONT_REMOVE_LISTING, NULL, no_argument },
162     { "dot-style", 0, OPT_VALUE, "dotstyle", -1 },
163     { "egd-file", 0, OPT_VALUE, "egdfile", -1 },
164     { "exclude-directories", 'X', OPT_VALUE, "excludedirectories", -1 },
165     { "exclude-domains", 0, OPT_VALUE, "excludedomains", -1 },
166     { "execute", 'e', OPT__EXECUTE, NULL, required_argument },
167     { "follow-ftp", 0, OPT_BOOLEAN, "followftp", -1 },
168     { "follow-tags", 0, OPT_VALUE, "followtags", -1 },
169     { "force-directories", 'x', OPT_BOOLEAN, "dirstruct", -1 },
170     { "force-html", 'F', OPT_BOOLEAN, "forcehtml", -1 },
171     { "ftp-password", 0, OPT_VALUE, "ftppassword", -1 },
172     { "ftp-user", 0, OPT_VALUE, "ftpuser", -1 },
173     { "glob", 0, OPT_BOOLEAN, "glob", -1 },
174     { "header", 0, OPT_VALUE, "header", -1 },
175     { "help", 'h', OPT_FUNCALL, (void *)print_help, no_argument },
176     { "host-directories", 0, OPT_BOOLEAN, "addhostdir", -1 },
177     { "html-extension", 'E', OPT_BOOLEAN, "htmlextension", -1 },
178     { "htmlify", 0, OPT_BOOLEAN, "htmlify", -1 },
179     { "http-keep-alive", 0, OPT_BOOLEAN, "httpkeepalive", -1 },
180     { "http-passwd", 0, OPT_VALUE, "httppassword", -1 }, /* deprecated */
181     { "http-password", 0, OPT_VALUE, "httppassword", -1 },
182     { "http-user", 0, OPT_VALUE, "httpuser", -1 },
183     { "ignore-case", 0, OPT_BOOLEAN, "ignorecase", -1 },
184     { "ignore-length", 0, OPT_BOOLEAN, "ignorelength", -1 },
185     { "ignore-tags", 0, OPT_VALUE, "ignoretags", -1 },
186     { "include-directories", 'I', OPT_VALUE, "includedirectories", -1 },
187 #ifdef ENABLE_IPV6
188     { "inet4-only", '4', OPT_BOOLEAN, "inet4only", -1 },
189     { "inet6-only", '6', OPT_BOOLEAN, "inet6only", -1 },
190 #endif
191     { "input-file", 'i', OPT_VALUE, "input", -1 },
192     { "keep-session-cookies", 0, OPT_BOOLEAN, "keepsessioncookies", -1 },
193     { "level", 'l', OPT_VALUE, "reclevel", -1 },
194     { "limit-rate", 0, OPT_VALUE, "limitrate", -1 },
195     { "load-cookies", 0, OPT_VALUE, "loadcookies", -1 },
196     { "max-redirect", 0, OPT_VALUE, "maxredirect", -1 },
197     { "mirror", 'm', OPT_BOOLEAN, "mirror", -1 },
198     { "no", 'n', OPT__NO, NULL, required_argument },
199     { "no-clobber", 0, OPT_BOOLEAN, "noclobber", -1 },
200     { "no-parent", 0, OPT_BOOLEAN, "noparent", -1 },
201     { "output-document", 'O', OPT_VALUE, "outputdocument", -1 },
202     { "output-file", 'o', OPT_VALUE, "logfile", -1 },
203     { "page-requisites", 'p', OPT_BOOLEAN, "pagerequisites", -1 },
204     { "parent", 0, OPT__PARENT, NULL, optional_argument },
205     { "passive-ftp", 0, OPT_BOOLEAN, "passiveftp", -1 },
206     { "password", 0, OPT_VALUE, "password", -1 },
207     { "post-data", 0, OPT_VALUE, "postdata", -1 },
208     { "post-file", 0, OPT_VALUE, "postfile", -1 },
209     { "prefer-family", 0, OPT_VALUE, "preferfamily", -1 },
210     { "preserve-permissions", 0, OPT_BOOLEAN, "preservepermissions", -1 },
211     { IF_SSL ("private-key"), 0, OPT_VALUE, "privatekey", -1 },
212     { IF_SSL ("private-key-type"), 0, OPT_VALUE, "privatekeytype", -1 },
213     { "progress", 0, OPT_VALUE, "progress", -1 },
214     { "protocol-directories", 0, OPT_BOOLEAN, "protocoldirectories", -1 },
215     { "proxy", 0, OPT_BOOLEAN, "useproxy", -1 },
216     { "proxy__compat", 'Y', OPT_VALUE, "useproxy", -1 }, /* back-compatible */
217     { "proxy-passwd", 0, OPT_VALUE, "proxypassword", -1 }, /* deprecated */
218     { "proxy-password", 0, OPT_VALUE, "proxypassword", -1 },
219     { "proxy-user", 0, OPT_VALUE, "proxyuser", -1 },
220     { "quiet", 'q', OPT_BOOLEAN, "quiet", -1 },
221     { "quota", 'Q', OPT_VALUE, "quota", -1 },
222     { "random-file", 0, OPT_VALUE, "randomfile", -1 },
223     { "random-wait", 0, OPT_BOOLEAN, "randomwait", -1 },
224     { "read-timeout", 0, OPT_VALUE, "readtimeout", -1 },
225     { "recursive", 'r', OPT_BOOLEAN, "recursive", -1 },
226     { "referer", 0, OPT_VALUE, "referer", -1 },
227     { "reject", 'R', OPT_VALUE, "reject", -1 },
228     { "relative", 'L', OPT_BOOLEAN, "relativeonly", -1 },
229     { "remove-listing", 0, OPT_BOOLEAN, "removelisting", -1 },
230     { "restrict-file-names", 0, OPT_BOOLEAN, "restrictfilenames", -1 },
231     { "retr-symlinks", 0, OPT_BOOLEAN, "retrsymlinks", -1 },
232     { "retry-connrefused", 0, OPT_BOOLEAN, "retryconnrefused", -1 },
233     { "save-cookies", 0, OPT_VALUE, "savecookies", -1 },
234     { "save-headers", 0, OPT_BOOLEAN, "saveheaders", -1 },
235     { IF_SSL ("secure-protocol"), 0, OPT_VALUE, "secureprotocol", -1 },
236     { "server-response", 'S', OPT_BOOLEAN, "serverresponse", -1 },
237     { "span-hosts", 'H', OPT_BOOLEAN, "spanhosts", -1 },
238     { "spider", 0, OPT_BOOLEAN, "spider", -1 },
239     { "strict-comments", 0, OPT_BOOLEAN, "strictcomments", -1 },
240     { "timeout", 'T', OPT_VALUE, "timeout", -1 },
241     { "timestamping", 'N', OPT_BOOLEAN, "timestamping", -1 },
242     { "tries", 't', OPT_VALUE, "tries", -1 },
243     { "user", 0, OPT_VALUE, "user", -1 },
244     { "user-agent", 'U', OPT_VALUE, "useragent", -1 },
245     { "verbose", 'v', OPT_BOOLEAN, "verbose", -1 },
246     { "verbose", 0, OPT_BOOLEAN, "verbose", -1 },
247     { "version", 'V', OPT_FUNCALL, (void *) print_version, no_argument },
248     { "wait", 'w', OPT_VALUE, "wait", -1 },
249     { "waitretry", 0, OPT_VALUE, "waitretry", -1 },
250 #ifdef MSDOS
251     { "wdebug", 0, OPT_BOOLEAN, "wdebug", -1 },
252 #endif
253   };
254
255 #undef WHEN_DEBUG
256 #undef IF_SSL
257
258 /* Return a string that contains S with "no-" prepended.  The string
259    is NUL-terminated and allocated off static storage at Wget
260    startup.  */
261
262 static char *
263 no_prefix (const char *s)
264 {
265   static char buffer[1024];
266   static char *p = buffer;
267
268   char *cp = p;
269   int size = 3 + strlen (s) + 1;  /* "no-STRING\0" */
270   if (p + size >= buffer + sizeof (buffer))
271     abort ();
272
273   cp[0] = 'n', cp[1] = 'o', cp[2] = '-';
274   strcpy (cp + 3, s);
275   p += size;
276   return cp;
277 }
278
279 /* The arguments that that main passes to getopt_long. */
280 static struct option long_options[2 * countof (option_data) + 1];
281 static char short_options[128];
282
283 /* Mapping between short option chars and option_data indices. */
284 static unsigned char optmap[96];
285
286 /* Marker for `--no-FOO' values in long_options.  */
287 #define BOOLEAN_NEG_MARKER 1024
288
289 /* Initialize the long_options array used by getopt_long from the data
290    in option_data.  */
291
292 static void
293 init_switches (void)
294 {
295   char *p = short_options;
296   int i, o = 0;
297   for (i = 0; i < countof (option_data); i++)
298     {
299       struct cmdline_option *opt = &option_data[i];
300       struct option *longopt;
301
302       if (!opt->long_name)
303         /* The option is disabled. */
304         continue;
305
306       longopt = &long_options[o++];
307       longopt->name = opt->long_name;
308       longopt->val = i;
309       if (opt->short_name)
310         {
311           *p++ = opt->short_name;
312           optmap[opt->short_name - 32] = longopt - long_options;
313         }
314       switch (opt->type)
315         {
316         case OPT_VALUE:
317           longopt->has_arg = required_argument;
318           if (opt->short_name)
319             *p++ = ':';
320           break;
321         case OPT_BOOLEAN:
322           /* Specify an optional argument for long options, so that
323              --option=off works the same as --no-option, for
324              compatibility with pre-1.10 Wget.  However, don't specify
325              optional arguments short-option booleans because they
326              prevent combining of short options.  */
327           longopt->has_arg = optional_argument;
328           /* For Boolean options, add the "--no-FOO" variant, which is
329              identical to "--foo", except it has opposite meaning and
330              it doesn't allow an argument.  */
331           longopt = &long_options[o++];
332           longopt->name = no_prefix (opt->long_name);
333           longopt->has_arg = no_argument;
334           /* Mask the value so we'll be able to recognize that we're
335              dealing with the false value.  */
336           longopt->val = i | BOOLEAN_NEG_MARKER;
337           break;
338         default:
339           assert (opt->argtype != -1);
340           longopt->has_arg = opt->argtype;
341           if (opt->short_name)
342             {
343               if (longopt->has_arg == required_argument)
344                 *p++ = ':';
345               /* Don't handle optional_argument */
346             }
347         }
348     }
349   /* Terminate short_options. */
350   *p = '\0';
351   /* No need for xzero(long_options[o]) because its storage is static
352      and it will be zeroed by default.  */
353   assert (o <= countof (long_options));
354 }
355
356 /* Print the usage message.  */
357 static void
358 print_usage (void)
359 {
360   printf (_("Usage: %s [OPTION]... [URL]...\n"), exec_name);
361 }
362
363 /* Print the help message, describing all the available options.  If
364    you add an option, be sure to update this list.  */
365 static void
366 print_help (void)
367 {
368   /* We split the help text this way to ease translation of individual
369      entries.  */
370   static const char *help[] = {
371     "\n",
372     N_("\
373 Mandatory arguments to long options are mandatory for short options too.\n\n"),
374     N_("\
375 Startup:\n"),
376     N_("\
377   -V,  --version           display the version of Wget and exit.\n"),
378     N_("\
379   -h,  --help              print this help.\n"),
380     N_("\
381   -b,  --background        go to background after startup.\n"),
382     N_("\
383   -e,  --execute=COMMAND   execute a `.wgetrc'-style command.\n"),
384     "\n",
385
386     N_("\
387 Logging and input file:\n"),
388     N_("\
389   -o,  --output-file=FILE    log messages to FILE.\n"),
390     N_("\
391   -a,  --append-output=FILE  append messages to FILE.\n"),
392 #ifdef ENABLE_DEBUG
393     N_("\
394   -d,  --debug               print lots of debugging information.\n"),
395 #endif
396 #ifdef MSDOS
397     N_("\
398        --wdebug              print Watt-32 debug output.\n"),
399 #endif
400     N_("\
401   -q,  --quiet               quiet (no output).\n"),
402     N_("\
403   -v,  --verbose             be verbose (this is the default).\n"),
404     N_("\
405   -nv, --no-verbose          turn off verboseness, without being quiet.\n"),
406     N_("\
407   -i,  --input-file=FILE     download URLs found in FILE.\n"),
408     N_("\
409   -F,  --force-html          treat input file as HTML.\n"),
410     N_("\
411   -B,  --base=URL            prepends URL to relative links in -F -i file.\n"),
412     "\n",
413
414     N_("\
415 Download:\n"),
416     N_("\
417   -t,  --tries=NUMBER            set number of retries to NUMBER (0 unlimits).\n"),
418     N_("\
419        --retry-connrefused       retry even if connection is refused.\n"),
420     N_("\
421   -O,  --output-document=FILE    write documents to FILE.\n"),
422     N_("\
423   -nc, --no-clobber              skip downloads that would download to\n\
424                                  existing files.\n"),
425     N_("\
426   -c,  --continue                resume getting a partially-downloaded file.\n"),
427     N_("\
428        --progress=TYPE           select progress gauge type.\n"),
429     N_("\
430   -N,  --timestamping            don't re-retrieve files unless newer than\n\
431                                  local.\n"),
432     N_("\
433   -S,  --server-response         print server response.\n"),
434     N_("\
435        --spider                  don't download anything.\n"),
436     N_("\
437   -T,  --timeout=SECONDS         set all timeout values to SECONDS.\n"),
438     N_("\
439        --dns-timeout=SECS        set the DNS lookup timeout to SECS.\n"),
440     N_("\
441        --connect-timeout=SECS    set the connect timeout to SECS.\n"),
442     N_("\
443        --read-timeout=SECS       set the read timeout to SECS.\n"),
444     N_("\
445   -w,  --wait=SECONDS            wait SECONDS between retrievals.\n"),
446     N_("\
447        --waitretry=SECONDS       wait 1..SECONDS between retries of a retrieval.\n"),
448     N_("\
449        --random-wait             wait from 0...2*WAIT secs between retrievals.\n"),
450     N_("\
451        --no-proxy                explicitly turn off proxy.\n"),
452     N_("\
453   -Q,  --quota=NUMBER            set retrieval quota to NUMBER.\n"),
454     N_("\
455        --bind-address=ADDRESS    bind to ADDRESS (hostname or IP) on local host.\n"),
456     N_("\
457        --limit-rate=RATE         limit download rate to RATE.\n"),
458     N_("\
459        --no-dns-cache            disable caching DNS lookups.\n"),
460     N_("\
461        --restrict-file-names=OS  restrict chars in file names to ones OS allows.\n"),
462     N_("\
463        --ignore-case             ignore case when matching files/directories.\n"),
464 #ifdef ENABLE_IPV6
465     N_("\
466   -4,  --inet4-only              connect only to IPv4 addresses.\n"),
467     N_("\
468   -6,  --inet6-only              connect only to IPv6 addresses.\n"),
469     N_("\
470        --prefer-family=FAMILY    connect first to addresses of specified family,\n\
471                                  one of IPv6, IPv4, or none.\n"),
472 #endif
473     N_("\
474        --user=USER               set both ftp and http user to USER.\n"),
475     N_("\
476        --password=PASS           set both ftp and http password to PASS.\n"),
477     "\n",
478
479     N_("\
480 Directories:\n"),
481     N_("\
482   -nd, --no-directories           don't create directories.\n"),
483     N_("\
484   -x,  --force-directories        force creation of directories.\n"),
485     N_("\
486   -nH, --no-host-directories      don't create host directories.\n"),
487     N_("\
488        --protocol-directories     use protocol name in directories.\n"),
489     N_("\
490   -P,  --directory-prefix=PREFIX  save files to PREFIX/...\n"),
491     N_("\
492        --cut-dirs=NUMBER          ignore NUMBER remote directory components.\n"),
493     "\n",
494
495     N_("\
496 HTTP options:\n"),
497     N_("\
498        --http-user=USER        set http user to USER.\n"),
499     N_("\
500        --http-password=PASS    set http password to PASS.\n"),
501     N_("\
502        --no-cache              disallow server-cached data.\n"),
503     N_("\
504   -E,  --html-extension        save HTML documents with `.html' extension.\n"),
505     N_("\
506        --ignore-length         ignore `Content-Length' header field.\n"),
507     N_("\
508        --header=STRING         insert STRING among the headers.\n"),
509     N_("\
510        --max-redirect          maximum redirections allowed per page.\n"),
511     N_("\
512        --proxy-user=USER       set USER as proxy username.\n"),
513     N_("\
514        --proxy-password=PASS   set PASS as proxy password.\n"),
515     N_("\
516        --referer=URL           include `Referer: URL' header in HTTP request.\n"),
517     N_("\
518        --save-headers          save the HTTP headers to file.\n"),
519     N_("\
520   -U,  --user-agent=AGENT      identify as AGENT instead of Wget/VERSION.\n"),
521     N_("\
522        --no-http-keep-alive    disable HTTP keep-alive (persistent connections).\n"),
523     N_("\
524        --no-cookies            don't use cookies.\n"),
525     N_("\
526        --load-cookies=FILE     load cookies from FILE before session.\n"),
527     N_("\
528        --save-cookies=FILE     save cookies to FILE after session.\n"),
529     N_("\
530        --keep-session-cookies  load and save session (non-permanent) cookies.\n"),
531     N_("\
532        --post-data=STRING      use the POST method; send STRING as the data.\n"),
533     N_("\
534        --post-file=FILE        use the POST method; send contents of FILE.\n"),
535     N_("\
536        --content-disposition   honor the Content-Disposition header when\n\
537                                choosing local file names (EXPERIMENTAL).\n"),
538     N_("\
539        --auth-no-challenge     Send Basic HTTP authentication information\n\
540                                without first waiting for the server's\n\
541                                challenge.\n"),
542     "\n",
543
544 #ifdef HAVE_SSL
545     N_("\
546 HTTPS (SSL/TLS) options:\n"),
547     N_("\
548        --secure-protocol=PR     choose secure protocol, one of auto, SSLv2,\n\
549                                 SSLv3, and TLSv1.\n"),
550     N_("\
551        --no-check-certificate   don't validate the server's certificate.\n"),
552     N_("\
553        --certificate=FILE       client certificate file.\n"),
554     N_("\
555        --certificate-type=TYPE  client certificate type, PEM or DER.\n"),
556     N_("\
557        --private-key=FILE       private key file.\n"),
558     N_("\
559        --private-key-type=TYPE  private key type, PEM or DER.\n"),
560     N_("\
561        --ca-certificate=FILE    file with the bundle of CA's.\n"),
562     N_("\
563        --ca-directory=DIR       directory where hash list of CA's is stored.\n"),
564     N_("\
565        --random-file=FILE       file with random data for seeding the SSL PRNG.\n"),
566     N_("\
567        --egd-file=FILE          file naming the EGD socket with random data.\n"),
568     "\n",
569 #endif /* HAVE_SSL */
570
571     N_("\
572 FTP options:\n"),
573     N_("\
574        --ftp-user=USER         set ftp user to USER.\n"),
575     N_("\
576        --ftp-password=PASS     set ftp password to PASS.\n"),
577     N_("\
578        --no-remove-listing     don't remove `.listing' files.\n"),
579     N_("\
580        --no-glob               turn off FTP file name globbing.\n"),
581     N_("\
582        --no-passive-ftp        disable the \"passive\" transfer mode.\n"),
583     N_("\
584        --retr-symlinks         when recursing, get linked-to files (not dir).\n"),
585     N_("\
586        --preserve-permissions  preserve remote file permissions.\n"),
587     "\n",
588
589     N_("\
590 Recursive download:\n"),
591     N_("\
592   -r,  --recursive          specify recursive download.\n"),
593     N_("\
594   -l,  --level=NUMBER       maximum recursion depth (inf or 0 for infinite).\n"),
595     N_("\
596        --delete-after       delete files locally after downloading them.\n"),
597     N_("\
598   -k,  --convert-links      make links in downloaded HTML point to local files.\n"),
599     N_("\
600   -K,  --backup-converted   before converting file X, back up as X.orig.\n"),
601     N_("\
602   -m,  --mirror             shortcut for -N -r -l inf --no-remove-listing.\n"),
603     N_("\
604   -p,  --page-requisites    get all images, etc. needed to display HTML page.\n"),
605     N_("\
606        --strict-comments    turn on strict (SGML) handling of HTML comments.\n"),
607     "\n",
608
609     N_("\
610 Recursive accept/reject:\n"),
611     N_("\
612   -A,  --accept=LIST               comma-separated list of accepted extensions.\n"),
613     N_("\
614   -R,  --reject=LIST               comma-separated list of rejected extensions.\n"),
615     N_("\
616   -D,  --domains=LIST              comma-separated list of accepted domains.\n"),
617     N_("\
618        --exclude-domains=LIST      comma-separated list of rejected domains.\n"),
619     N_("\
620        --follow-ftp                follow FTP links from HTML documents.\n"),
621     N_("\
622        --follow-tags=LIST          comma-separated list of followed HTML tags.\n"),
623     N_("\
624        --ignore-tags=LIST          comma-separated list of ignored HTML tags.\n"),
625     N_("\
626   -H,  --span-hosts                go to foreign hosts when recursive.\n"),
627     N_("\
628   -L,  --relative                  follow relative links only.\n"),
629     N_("\
630   -I,  --include-directories=LIST  list of allowed directories.\n"),
631     N_("\
632   -X,  --exclude-directories=LIST  list of excluded directories.\n"),
633     N_("\
634   -np, --no-parent                 don't ascend to the parent directory.\n"),
635     "\n",
636
637     N_("Mail bug reports and suggestions to <bug-wget@gnu.org>.\n")
638   };
639
640   int i;
641
642   printf (_("GNU Wget %s, a non-interactive network retriever.\n"),
643           version_string);
644   print_usage ();
645
646   for (i = 0; i < countof (help); i++)
647     fputs (_(help[i]), stdout);
648
649   exit (0);
650 }
651
652 /* Return a human-readable printed representation of INTERVAL,
653    measured in seconds.  */
654
655 static char *
656 secs_to_human_time (double interval)
657 {
658   static char buf[32];
659   int secs = (int) (interval + 0.5);
660   int hours, mins, days;
661
662   days = secs / 86400, secs %= 86400;
663   hours = secs / 3600, secs %= 3600;
664   mins = secs / 60, secs %= 60;
665
666   if (days)
667     sprintf (buf, "%dd %dh %dm %ds", days, hours, mins, secs);
668   else if (hours)
669     sprintf (buf, "%dh %dm %ds", hours, mins, secs);
670   else if (mins)
671     sprintf (buf, "%dm %ds", mins, secs);
672   else
673     sprintf (buf, "%ss", print_decimal (interval));
674
675   return buf;
676 }
677
678 static void
679 print_version (void)
680 {
681   printf ("GNU Wget %s\n\n", version_string);
682   /* TRANSLATORS: When available, an actual copyright character
683      (cirle-c) should be used in preference to "(C)". */
684   fputs (_("\
685 Copyright (C) 2008 Free Software Foundation, Inc.\n"), stdout);
686   fputs (_("\
687 License GPLv3+: GNU GPL version 3 or later\n\
688 <http://www.gnu.org/licenses/gpl.html>.\n\
689 This is free software: you are free to change and redistribute it.\n\
690 There is NO WARRANTY, to the extent permitted by law.\n"), stdout);
691   /* TRANSLATORS: When available, please use the proper diacritics for
692      names such as this one. See en_US.po for reference. */
693   fputs (_("\nOriginally written by Hrvoje Niksic <hniksic@xemacs.org>.\n"),
694          stdout);
695   fputs (_("Currently maintained by Micah Cowan <micah@cowan.name>.\n"),
696          stdout);
697   exit (0);
698 }
699 \f
700
701 int
702 main (int argc, char **argv)
703 {
704   char **url, **t;
705   int i, ret, longindex;
706   int nurl, status;
707   bool append_to_log = false;
708
709   i18n_initialize ();
710
711   /* Construct the name of the executable, without the directory part.  */
712   exec_name = strrchr (argv[0], PATH_SEPARATOR);
713   if (!exec_name)
714     exec_name = argv[0];
715   else
716     ++exec_name;
717
718 #ifdef WINDOWS
719   /* Drop extension (typically .EXE) from executable filename. */
720   windows_main ((char **) &exec_name);
721 #endif
722
723   /* Set option defaults; read the system wgetrc and ~/.wgetrc.  */
724   initialize ();
725
726   init_switches ();
727   longindex = -1;
728   while ((ret = getopt_long (argc, argv,
729                              short_options, long_options, &longindex)) != -1)
730     {
731       int val;
732       struct cmdline_option *opt;
733
734       /* If LONGINDEX is unchanged, it means RET is referring a short
735          option.  */
736       if (longindex == -1)
737         {
738           if (ret == '?')
739             {
740               print_usage ();
741               printf ("\n");
742               printf (_("Try `%s --help' for more options.\n"), exec_name);
743               exit (2);
744             }
745           /* Find the short option character in the mapping.  */
746           longindex = optmap[ret - 32];
747         }
748       val = long_options[longindex].val;
749
750       /* Use the retrieved value to locate the option in the
751          option_data array, and to see if we're dealing with the
752          negated "--no-FOO" variant of the boolean option "--foo".  */
753       opt = &option_data[val & ~BOOLEAN_NEG_MARKER];
754       switch (opt->type)
755         {
756         case OPT_VALUE:
757           setoptval (opt->data, optarg, opt->long_name);
758           break;
759         case OPT_BOOLEAN:
760           if (optarg)
761             /* The user has specified a value -- use it. */
762             setoptval (opt->data, optarg, opt->long_name);
763           else
764             {
765               /* NEG is true for `--no-FOO' style boolean options. */
766               bool neg = !!(val & BOOLEAN_NEG_MARKER);
767               setoptval (opt->data, neg ? "0" : "1", opt->long_name);
768             }
769           break;
770         case OPT_FUNCALL:
771           {
772             void (*func) (void) = (void (*) (void)) opt->data;
773             func ();
774           }
775           break;
776         case OPT__APPEND_OUTPUT:
777           setoptval ("logfile", optarg, opt->long_name);
778           append_to_log = true;
779           break;
780         case OPT__EXECUTE:
781           run_command (optarg);
782           break;
783         case OPT__NO:
784           {
785             /* We support real --no-FOO flags now, but keep these
786                short options for convenience and backward
787                compatibility.  */
788             char *p;
789             for (p = optarg; *p; p++)
790               switch (*p)
791                 {
792                 case 'v':
793                   setoptval ("verbose", "0", opt->long_name);
794                   break;
795                 case 'H':
796                   setoptval ("addhostdir", "0", opt->long_name);
797                   break;
798                 case 'd':
799                   setoptval ("dirstruct", "0", opt->long_name);
800                   break;
801                 case 'c':
802                   setoptval ("noclobber", "1", opt->long_name);
803                   break;
804                 case 'p':
805                   setoptval ("noparent", "1", opt->long_name);
806                   break;
807                 default:
808                   printf (_("%s: illegal option -- `-n%c'\n"), exec_name, *p);
809                   print_usage ();
810                   printf ("\n");
811                   printf (_("Try `%s --help' for more options.\n"), exec_name);
812                   exit (1);
813                 }
814             break;
815           }
816         case OPT__PARENT:
817         case OPT__CLOBBER:
818           {
819             /* The wgetrc commands are named noparent and noclobber,
820                so we must revert the meaning of the cmdline options
821                before passing the value to setoptval.  */
822             bool flag = true;
823             if (optarg)
824               flag = (*optarg == '1' || c_tolower (*optarg) == 'y'
825                       || (c_tolower (optarg[0]) == 'o'
826                           && c_tolower (optarg[1]) == 'n'));
827             setoptval (opt->type == OPT__PARENT ? "noparent" : "noclobber",
828                        flag ? "0" : "1", opt->long_name);
829             break;
830           }
831         case OPT__DONT_REMOVE_LISTING:
832           setoptval ("removelisting", "0", opt->long_name);
833           break;
834         }
835
836       longindex = -1;
837     }
838
839   nurl = argc - optind;
840
841   /* All user options have now been processed, so it's now safe to do
842      interoption dependency checks. */
843
844   if (opt.reclevel == 0)
845       opt.reclevel = INFINITE_RECURSION; /* see recur.h for commentary */
846
847   if (opt.spider || opt.delete_after)
848       opt.no_dirstruct = true;
849
850   if (opt.page_requisites && !opt.recursive)
851     {
852       /* Don't set opt.recursive here because it would confuse the FTP
853          code.  Instead, call retrieve_tree below when either
854          page_requisites or recursive is requested.  */
855       opt.reclevel = 0;
856       if (!opt.no_dirstruct)
857         opt.dirstruct = 1;      /* normally handled by cmd_spec_recursive() */
858     }
859
860   if (opt.verbose == -1)
861     opt.verbose = !opt.quiet;
862
863   /* Sanity checks.  */
864   if (opt.verbose && opt.quiet)
865     {
866       printf (_("Can't be verbose and quiet at the same time.\n"));
867       print_usage ();
868       exit (1);
869     }
870   if (opt.timestamping && opt.noclobber)
871     {
872       printf (_("\
873 Can't timestamp and not clobber old files at the same time.\n"));
874       print_usage ();
875       exit (1);
876     }
877 #ifdef ENABLE_IPV6
878   if (opt.ipv4_only && opt.ipv6_only)
879     {
880       printf (_("Cannot specify both --inet4-only and --inet6-only.\n"));
881       print_usage ();
882       exit (1);
883     }
884 #endif
885   if (opt.output_document
886       && (opt.page_requisites
887           || opt.recursive
888           || opt.timestamping))
889     {
890           printf (_("Cannot specify -r, -p or -N if -O is given.\n"));
891           print_usage ();
892           exit (1);
893     }
894   if (opt.output_document
895       && opt.convert_links 
896       && nurl > 1)
897     {
898           printf (_("Cannot specify both -k and -O if multiple URLs are given.\n"));
899           print_usage ();
900           exit (1);
901     }
902
903   if (!nurl && !opt.input_filename)
904     {
905       /* No URL specified.  */
906       printf (_("%s: missing URL\n"), exec_name);
907       print_usage ();
908       printf ("\n");
909       /* #### Something nicer should be printed here -- similar to the
910          pre-1.5 `--help' page.  */
911       printf (_("Try `%s --help' for more options.\n"), exec_name);
912       exit (1);
913     }
914
915 #ifdef MSDOS
916   if (opt.wdebug)
917      dbug_init();
918   sock_init();
919 #else
920   if (opt.background)
921     fork_to_background ();
922 #endif
923
924   /* Initialize progress.  Have to do this after the options are
925      processed so we know where the log file is.  */
926   if (opt.verbose)
927     set_progress_implementation (opt.progress_type);
928
929   /* Fill in the arguments.  */
930   url = alloca_array (char *, nurl + 1);
931   for (i = 0; i < nurl; i++, optind++)
932     {
933       char *rewritten = rewrite_shorthand_url (argv[optind]);
934       if (rewritten)
935         url[i] = rewritten;
936       else
937         url[i] = xstrdup (argv[optind]);
938     }
939   url[i] = NULL;
940
941   /* Initialize logging.  */
942   log_init (opt.lfilename, append_to_log);
943
944   DEBUGP (("DEBUG output created by Wget %s on %s.\n\n", version_string,
945            OS_TYPE));
946
947   /* Open the output filename if necessary.  */
948   if (opt.output_document)
949     {
950       if (HYPHENP (opt.output_document))
951         output_stream = stdout;
952       else
953         {
954           struct_fstat st;
955           output_stream = fopen (opt.output_document,
956                                  opt.always_rest ? "ab" : "wb");
957           if (output_stream == NULL)
958             {
959               perror (opt.output_document);
960               exit (1);
961             }
962           if (fstat (fileno (output_stream), &st) == 0 && S_ISREG (st.st_mode))
963             output_stream_regular = true;
964         }
965     }
966
967 #ifdef WINDOWS
968   ws_startup ();
969 #endif
970
971 #ifdef SIGHUP
972   /* Setup the signal handler to redirect output when hangup is
973      received.  */
974   if (signal(SIGHUP, SIG_IGN) != SIG_IGN)
975     signal(SIGHUP, redirect_output_signal);
976 #endif
977   /* ...and do the same for SIGUSR1.  */
978 #ifdef SIGUSR1
979   signal (SIGUSR1, redirect_output_signal);
980 #endif
981 #ifdef SIGPIPE
982   /* Writing to a closed socket normally signals SIGPIPE, and the
983      process exits.  What we want is to ignore SIGPIPE and just check
984      for the return value of write().  */
985   signal (SIGPIPE, SIG_IGN);
986 #endif
987 #ifdef SIGWINCH
988   signal (SIGWINCH, progress_handle_sigwinch);
989 #endif
990
991   status = RETROK;              /* initialize it, just-in-case */
992   /* Retrieve the URLs from argument list.  */
993   for (t = url; *t; t++)
994     {
995       char *filename = NULL, *redirected_URL = NULL;
996       int dt;
997
998       if ((opt.recursive || opt.page_requisites)
999           && (url_scheme (*t) != SCHEME_FTP || url_uses_proxy (*t)))
1000         {
1001           int old_follow_ftp = opt.follow_ftp;
1002
1003           /* Turn opt.follow_ftp on in case of recursive FTP retrieval */
1004           if (url_scheme (*t) == SCHEME_FTP) 
1005             opt.follow_ftp = 1;
1006           
1007           status = retrieve_tree (*t);
1008
1009           opt.follow_ftp = old_follow_ftp;
1010         }
1011       else
1012         status = retrieve_url (*t, &filename, &redirected_URL, NULL, &dt, opt.recursive);
1013
1014       if (opt.delete_after && file_exists_p(filename))
1015         {
1016           DEBUGP (("Removing file due to --delete-after in main():\n"));
1017           logprintf (LOG_VERBOSE, _("Removing %s.\n"), filename);
1018           if (unlink (filename))
1019             logprintf (LOG_NOTQUIET, "unlink: %s\n", strerror (errno));
1020         }
1021
1022       xfree_null (redirected_URL);
1023       xfree_null (filename);
1024     }
1025
1026   /* And then from the input file, if any.  */
1027   if (opt.input_filename)
1028     {
1029       int count;
1030       status = retrieve_from_file (opt.input_filename, opt.force_html, &count);
1031       if (!count)
1032         logprintf (LOG_NOTQUIET, _("No URLs found in %s.\n"),
1033                    opt.input_filename);
1034     }
1035
1036   /* Print broken links. */
1037   if (opt.recursive && opt.spider)
1038     {
1039       print_broken_links();
1040     }
1041   
1042   /* Print the downloaded sum.  */
1043   if ((opt.recursive || opt.page_requisites
1044        || nurl > 1
1045        || (opt.input_filename && total_downloaded_bytes != 0))
1046       &&
1047       total_downloaded_bytes != 0)
1048     {
1049       logprintf (LOG_NOTQUIET,
1050                  _("FINISHED --%s--\nDownloaded: %d files, %s in %s (%s)\n"),
1051                  datetime_str (time (NULL)),
1052                  opt.numurls,
1053                  human_readable (total_downloaded_bytes),
1054                  secs_to_human_time (total_download_time),
1055                  retr_rate (total_downloaded_bytes, total_download_time));
1056       /* Print quota warning, if exceeded.  */
1057       if (opt.quota && total_downloaded_bytes > opt.quota)
1058         logprintf (LOG_NOTQUIET,
1059                    _("Download quota of %s EXCEEDED!\n"),
1060                    human_readable (opt.quota));
1061     }
1062
1063   if (opt.cookies_output)
1064     save_cookies ();
1065
1066   if (opt.convert_links && !opt.delete_after)
1067     convert_all_links ();
1068
1069   log_close ();
1070   for (i = 0; i < nurl; i++)
1071     xfree (url[i]);
1072   cleanup ();
1073
1074 #ifdef DEBUG_MALLOC
1075   print_malloc_debug_stats ();
1076 #endif
1077   if (status == RETROK)
1078     return 0;
1079   else
1080     return 1;
1081 }
1082 #endif /* TESTING */
1083 \f
1084 #if defined(SIGHUP) || defined(SIGUSR1)
1085
1086 /* So the signal_name check doesn't blow when only one is available. */
1087 #ifndef SIGHUP
1088 # define SIGHUP -1
1089 #endif
1090 #ifndef SIGUSR1
1091 # define SIGUSR1 -1
1092 #endif
1093
1094 /* Hangup signal handler.  When wget receives SIGHUP or SIGUSR1, it
1095    will proceed operation as usual, trying to write into a log file.
1096    If that is impossible, the output will be turned off.  */
1097
1098 static void
1099 redirect_output_signal (int sig)
1100 {
1101   const char *signal_name = (sig == SIGHUP ? "SIGHUP" :
1102                              (sig == SIGUSR1 ? "SIGUSR1" :
1103                               "WTF?!"));
1104   log_request_redirect_output (signal_name);
1105   progress_schedule_redirect ();
1106   signal (sig, redirect_output_signal);
1107 }
1108 #endif
1109
1110 /*
1111  * vim: et ts=2 sw=2
1112  */