]> sjero.net Git - wget/blob - src/main.c
Automaetd merge.
[wget] / src / main.c
1 /* Command line parsing.
2    Copyright (C) 1996, 1997, 1998, 1999, 2000, 2001, 2002, 2003,
3    2004, 2005, 2006, 2007, 2008 Free Software Foundation, Inc.
4
5 This file is part of GNU Wget.
6
7 GNU Wget is free software; you can redistribute it and/or modify
8 it under the terms of the GNU General Public License as published by
9 the Free Software Foundation; either version 3 of the License, or
10 (at your option) any later version.
11
12 GNU Wget is distributed in the hope that it will be useful,
13 but WITHOUT ANY WARRANTY; without even the implied warranty of
14 MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15 GNU General Public License for more details.
16
17 You should have received a copy of the GNU General Public License
18 along with Wget.  If not, see <http://www.gnu.org/licenses/>.
19
20 Additional permission under GNU GPL version 3 section 7
21
22 If you modify this program, or any covered work, by linking or
23 combining it with the OpenSSL project's OpenSSL library (or a
24 modified version of that library), containing parts covered by the
25 terms of the OpenSSL or SSLeay licenses, the Free Software Foundation
26 grants you additional permission to convey the resulting work.
27 Corresponding Source for a non-source form of such a combination
28 shall include the source code for the parts of OpenSSL used as well
29 as that of the covered work.  */
30
31 #include "wget.h"
32
33 #include <stdio.h>
34 #include <stdlib.h>
35 #ifdef HAVE_UNISTD_H
36 # include <unistd.h>
37 #endif /* HAVE_UNISTD_H */
38 #include <string.h>
39 #include <signal.h>
40 #ifdef ENABLE_NLS
41 # include <locale.h>
42 #endif
43 #include <assert.h>
44 #include <errno.h>
45 #include <time.h>
46 #ifdef ENABLE_IRI
47 #include <langinfo.h>
48 #endif
49
50 #include "utils.h"
51 #include "init.h"
52 #include "retr.h"
53 #include "recur.h"
54 #include "host.h"
55 #include "url.h"
56 #include "progress.h"           /* for progress_handle_sigwinch */
57 #include "convert.h"
58 #include "spider.h"
59 #include "http.h"               /* for save_cookies */
60
61 #include <getopt.h>
62 #include <getpass.h>
63 #include <quote.h>
64
65 #ifndef PATH_SEPARATOR
66 # define PATH_SEPARATOR '/'
67 #endif
68
69 struct options opt;
70
71 extern char *version_string;
72
73 #if defined(SIGHUP) || defined(SIGUSR1)
74 static void redirect_output_signal (int);
75 #endif
76
77 const char *exec_name;
78 \f
79 #ifndef TESTING
80 /* Initialize I18N/L10N.  That amounts to invoking setlocale, and
81    setting up gettext's message catalog using bindtextdomain and
82    textdomain.  Does nothing if NLS is disabled or missing.  */
83
84 static void
85 i18n_initialize (void)
86 {
87   /* ENABLE_NLS implies existence of functions invoked here.  */
88 #ifdef ENABLE_NLS
89   /* Set the current locale.  */
90   setlocale (LC_ALL, "");
91   /* Set the text message domain.  */
92   bindtextdomain ("wget", LOCALEDIR);
93   textdomain ("wget");
94 #endif /* ENABLE_NLS */
95 }
96 \f
97 /* Definition of command-line options. */
98
99 static void print_help (void);
100 static void print_version (void);
101
102 #ifdef HAVE_SSL
103 # define IF_SSL(x) x
104 #else
105 # define IF_SSL(x) NULL
106 #endif
107
108 #ifdef ENABLE_DEBUG
109 # define WHEN_DEBUG(x) x
110 #else
111 # define WHEN_DEBUG(x) NULL
112 #endif
113
114 struct cmdline_option {
115   const char *long_name;
116   char short_name;
117   enum {
118     OPT_VALUE,
119     OPT_BOOLEAN,
120     OPT_FUNCALL,
121     /* Non-standard options that have to be handled specially in
122        main().  */
123     OPT__APPEND_OUTPUT,
124     OPT__CLOBBER,
125     OPT__DONT_REMOVE_LISTING,
126     OPT__EXECUTE,
127     OPT__NO,
128     OPT__PARENT
129   } type;
130   const void *data;             /* for standard options */
131   int argtype;                  /* for non-standard options */
132 };
133
134 static struct cmdline_option option_data[] =
135   {
136     { "accept", 'A', OPT_VALUE, "accept", -1 },
137     { "append-output", 'a', OPT__APPEND_OUTPUT, NULL, required_argument },
138     { "ask-password", 0, OPT_BOOLEAN, "askpassword", -1 },
139     { "auth-no-challenge", 0, OPT_BOOLEAN, "authnochallenge", -1 },
140     { "background", 'b', OPT_BOOLEAN, "background", -1 },
141     { "backup-converted", 'K', OPT_BOOLEAN, "backupconverted", -1 },
142     { "backups", 0, OPT_BOOLEAN, "backups", -1 },
143     { "base", 'B', OPT_VALUE, "base", -1 },
144     { "bind-address", 0, OPT_VALUE, "bindaddress", -1 },
145     { IF_SSL ("ca-certificate"), 0, OPT_VALUE, "cacertificate", -1 },
146     { IF_SSL ("ca-directory"), 0, OPT_VALUE, "cadirectory", -1 },
147     { "cache", 0, OPT_BOOLEAN, "cache", -1 },
148     { IF_SSL ("certificate"), 0, OPT_VALUE, "certificate", -1 },
149     { IF_SSL ("certificate-type"), 0, OPT_VALUE, "certificatetype", -1 },
150     { IF_SSL ("check-certificate"), 0, OPT_BOOLEAN, "checkcertificate", -1 },
151     { "clobber", 0, OPT__CLOBBER, NULL, optional_argument },
152     { "connect-timeout", 0, OPT_VALUE, "connecttimeout", -1 },
153     { "continue", 'c', OPT_BOOLEAN, "continue", -1 },
154     { "convert-links", 'k', OPT_BOOLEAN, "convertlinks", -1 },
155     { "content-disposition", 0, OPT_BOOLEAN, "contentdisposition", -1 },
156     { "cookies", 0, OPT_BOOLEAN, "cookies", -1 },
157     { "cut-dirs", 0, OPT_VALUE, "cutdirs", -1 },
158     { WHEN_DEBUG ("debug"), 'd', OPT_BOOLEAN, "debug", -1 },
159     { "delete-after", 0, OPT_BOOLEAN, "deleteafter", -1 },
160     { "directories", 0, OPT_BOOLEAN, "dirstruct", -1 },
161     { "directory-prefix", 'P', OPT_VALUE, "dirprefix", -1 },
162     { "dns-cache", 0, OPT_BOOLEAN, "dnscache", -1 },
163     { "dns-timeout", 0, OPT_VALUE, "dnstimeout", -1 },
164     { "domains", 'D', OPT_VALUE, "domains", -1 },
165     { "dont-remove-listing", 0, OPT__DONT_REMOVE_LISTING, NULL, no_argument },
166     { "dot-style", 0, OPT_VALUE, "dotstyle", -1 },
167     { "egd-file", 0, OPT_VALUE, "egdfile", -1 },
168     { "exclude-directories", 'X', OPT_VALUE, "excludedirectories", -1 },
169     { "exclude-domains", 0, OPT_VALUE, "excludedomains", -1 },
170     { "execute", 'e', OPT__EXECUTE, NULL, required_argument },
171     { "follow-ftp", 0, OPT_BOOLEAN, "followftp", -1 },
172     { "follow-tags", 0, OPT_VALUE, "followtags", -1 },
173     { "force-directories", 'x', OPT_BOOLEAN, "dirstruct", -1 },
174     { "force-html", 'F', OPT_BOOLEAN, "forcehtml", -1 },
175     { "ftp-password", 0, OPT_VALUE, "ftppassword", -1 },
176     { "ftp-user", 0, OPT_VALUE, "ftpuser", -1 },
177     { "glob", 0, OPT_BOOLEAN, "glob", -1 },
178     { "header", 0, OPT_VALUE, "header", -1 },
179     { "help", 'h', OPT_FUNCALL, (void *)print_help, no_argument },
180     { "host-directories", 0, OPT_BOOLEAN, "addhostdir", -1 },
181     { "html-extension", 'E', OPT_BOOLEAN, "htmlextension", -1 },
182     { "htmlify", 0, OPT_BOOLEAN, "htmlify", -1 },
183     { "http-keep-alive", 0, OPT_BOOLEAN, "httpkeepalive", -1 },
184     { "http-passwd", 0, OPT_VALUE, "httppassword", -1 }, /* deprecated */
185     { "http-password", 0, OPT_VALUE, "httppassword", -1 },
186     { "http-user", 0, OPT_VALUE, "httpuser", -1 },
187     { "ignore-case", 0, OPT_BOOLEAN, "ignorecase", -1 },
188     { "ignore-length", 0, OPT_BOOLEAN, "ignorelength", -1 },
189     { "ignore-tags", 0, OPT_VALUE, "ignoretags", -1 },
190     { "include-directories", 'I', OPT_VALUE, "includedirectories", -1 },
191 #ifdef ENABLE_IPV6
192     { "inet4-only", '4', OPT_BOOLEAN, "inet4only", -1 },
193     { "inet6-only", '6', OPT_BOOLEAN, "inet6only", -1 },
194 #endif
195     { "input-file", 'i', OPT_VALUE, "input", -1 },
196 #ifdef ENABLE_IRI
197     { "iri", 0, OPT_BOOLEAN, "iri", -1 },
198 #endif
199     { "keep-session-cookies", 0, OPT_BOOLEAN, "keepsessioncookies", -1 },
200     { "level", 'l', OPT_VALUE, "reclevel", -1 },
201     { "limit-rate", 0, OPT_VALUE, "limitrate", -1 },
202     { "load-cookies", 0, OPT_VALUE, "loadcookies", -1 },
203 #ifdef ENABLE_IRI
204     { "locale", 0, OPT_VALUE, "locale", -1 },
205 #endif
206     { "max-redirect", 0, OPT_VALUE, "maxredirect", -1 },
207     { "mirror", 'm', OPT_BOOLEAN, "mirror", -1 },
208     { "no", 'n', OPT__NO, NULL, required_argument },
209     { "no-clobber", 0, OPT_BOOLEAN, "noclobber", -1 },
210     { "no-parent", 0, OPT_BOOLEAN, "noparent", -1 },
211     { "output-document", 'O', OPT_VALUE, "outputdocument", -1 },
212     { "output-file", 'o', OPT_VALUE, "logfile", -1 },
213     { "page-requisites", 'p', OPT_BOOLEAN, "pagerequisites", -1 },
214     { "parent", 0, OPT__PARENT, NULL, optional_argument },
215     { "passive-ftp", 0, OPT_BOOLEAN, "passiveftp", -1 },
216     { "password", 0, OPT_VALUE, "password", -1 },
217     { "post-data", 0, OPT_VALUE, "postdata", -1 },
218     { "post-file", 0, OPT_VALUE, "postfile", -1 },
219     { "prefer-family", 0, OPT_VALUE, "preferfamily", -1 },
220     { "preserve-permissions", 0, OPT_BOOLEAN, "preservepermissions", -1 },
221     { IF_SSL ("private-key"), 0, OPT_VALUE, "privatekey", -1 },
222     { IF_SSL ("private-key-type"), 0, OPT_VALUE, "privatekeytype", -1 },
223     { "progress", 0, OPT_VALUE, "progress", -1 },
224     { "protocol-directories", 0, OPT_BOOLEAN, "protocoldirectories", -1 },
225     { "proxy", 0, OPT_BOOLEAN, "useproxy", -1 },
226     { "proxy__compat", 'Y', OPT_VALUE, "useproxy", -1 }, /* back-compatible */
227     { "proxy-passwd", 0, OPT_VALUE, "proxypassword", -1 }, /* deprecated */
228     { "proxy-password", 0, OPT_VALUE, "proxypassword", -1 },
229     { "proxy-user", 0, OPT_VALUE, "proxyuser", -1 },
230     { "quiet", 'q', OPT_BOOLEAN, "quiet", -1 },
231     { "quota", 'Q', OPT_VALUE, "quota", -1 },
232     { "random-file", 0, OPT_VALUE, "randomfile", -1 },
233     { "random-wait", 0, OPT_BOOLEAN, "randomwait", -1 },
234     { "read-timeout", 0, OPT_VALUE, "readtimeout", -1 },
235     { "recursive", 'r', OPT_BOOLEAN, "recursive", -1 },
236     { "referer", 0, OPT_VALUE, "referer", -1 },
237     { "reject", 'R', OPT_VALUE, "reject", -1 },
238     { "relative", 'L', OPT_BOOLEAN, "relativeonly", -1 },
239 #ifdef ENABLE_IRI
240     { "remote-encoding", 0, OPT_VALUE, "remoteencoding", -1},
241 #endif
242     { "remove-listing", 0, OPT_BOOLEAN, "removelisting", -1 },
243     { "restrict-file-names", 0, OPT_BOOLEAN, "restrictfilenames", -1 },
244     { "retr-symlinks", 0, OPT_BOOLEAN, "retrsymlinks", -1 },
245     { "retry-connrefused", 0, OPT_BOOLEAN, "retryconnrefused", -1 },
246     { "save-cookies", 0, OPT_VALUE, "savecookies", -1 },
247     { "save-headers", 0, OPT_BOOLEAN, "saveheaders", -1 },
248     { IF_SSL ("secure-protocol"), 0, OPT_VALUE, "secureprotocol", -1 },
249     { "server-response", 'S', OPT_BOOLEAN, "serverresponse", -1 },
250     { "span-hosts", 'H', OPT_BOOLEAN, "spanhosts", -1 },
251     { "spider", 0, OPT_BOOLEAN, "spider", -1 },
252     { "strict-comments", 0, OPT_BOOLEAN, "strictcomments", -1 },
253     { "timeout", 'T', OPT_VALUE, "timeout", -1 },
254     { "timestamping", 'N', OPT_BOOLEAN, "timestamping", -1 },
255     { "tries", 't', OPT_VALUE, "tries", -1 },
256     { "user", 0, OPT_VALUE, "user", -1 },
257     { "user-agent", 'U', OPT_VALUE, "useragent", -1 },
258     { "verbose", 'v', OPT_BOOLEAN, "verbose", -1 },
259     { "verbose", 0, OPT_BOOLEAN, "verbose", -1 },
260     { "version", 'V', OPT_FUNCALL, (void *) print_version, no_argument },
261     { "wait", 'w', OPT_VALUE, "wait", -1 },
262     { "waitretry", 0, OPT_VALUE, "waitretry", -1 },
263 #ifdef MSDOS
264     { "wdebug", 0, OPT_BOOLEAN, "wdebug", -1 },
265 #endif
266   };
267
268 #undef WHEN_DEBUG
269 #undef IF_SSL
270
271 /* Return a string that contains S with "no-" prepended.  The string
272    is NUL-terminated and allocated off static storage at Wget
273    startup.  */
274
275 static char *
276 no_prefix (const char *s)
277 {
278   static char buffer[1024];
279   static char *p = buffer;
280
281   char *cp = p;
282   int size = 3 + strlen (s) + 1;  /* "no-STRING\0" */
283   if (p + size >= buffer + sizeof (buffer))
284     abort ();
285
286   cp[0] = 'n', cp[1] = 'o', cp[2] = '-';
287   strcpy (cp + 3, s);
288   p += size;
289   return cp;
290 }
291
292 /* The arguments that that main passes to getopt_long. */
293 static struct option long_options[2 * countof (option_data) + 1];
294 static char short_options[128];
295
296 /* Mapping between short option chars and option_data indices. */
297 static unsigned char optmap[96];
298
299 /* Marker for `--no-FOO' values in long_options.  */
300 #define BOOLEAN_NEG_MARKER 1024
301
302 /* Initialize the long_options array used by getopt_long from the data
303    in option_data.  */
304
305 static void
306 init_switches (void)
307 {
308   char *p = short_options;
309   size_t i, o = 0;
310   for (i = 0; i < countof (option_data); i++)
311     {
312       struct cmdline_option *opt = &option_data[i];
313       struct option *longopt;
314
315       if (!opt->long_name)
316         /* The option is disabled. */
317         continue;
318
319       longopt = &long_options[o++];
320       longopt->name = opt->long_name;
321       longopt->val = i;
322       if (opt->short_name)
323         {
324           *p++ = opt->short_name;
325           optmap[opt->short_name - 32] = longopt - long_options;
326         }
327       switch (opt->type)
328         {
329         case OPT_VALUE:
330           longopt->has_arg = required_argument;
331           if (opt->short_name)
332             *p++ = ':';
333           break;
334         case OPT_BOOLEAN:
335           /* Specify an optional argument for long options, so that
336              --option=off works the same as --no-option, for
337              compatibility with pre-1.10 Wget.  However, don't specify
338              optional arguments short-option booleans because they
339              prevent combining of short options.  */
340           longopt->has_arg = optional_argument;
341           /* For Boolean options, add the "--no-FOO" variant, which is
342              identical to "--foo", except it has opposite meaning and
343              it doesn't allow an argument.  */
344           longopt = &long_options[o++];
345           longopt->name = no_prefix (opt->long_name);
346           longopt->has_arg = no_argument;
347           /* Mask the value so we'll be able to recognize that we're
348              dealing with the false value.  */
349           longopt->val = i | BOOLEAN_NEG_MARKER;
350           break;
351         default:
352           assert (opt->argtype != -1);
353           longopt->has_arg = opt->argtype;
354           if (opt->short_name)
355             {
356               if (longopt->has_arg == required_argument)
357                 *p++ = ':';
358               /* Don't handle optional_argument */
359             }
360         }
361     }
362   /* Terminate short_options. */
363   *p = '\0';
364   /* No need for xzero(long_options[o]) because its storage is static
365      and it will be zeroed by default.  */
366   assert (o <= countof (long_options));
367 }
368
369 /* Print the usage message.  */
370 static void
371 print_usage (void)
372 {
373   printf (_("Usage: %s [OPTION]... [URL]...\n"), exec_name);
374 }
375
376 /* Print the help message, describing all the available options.  If
377    you add an option, be sure to update this list.  */
378 static void
379 print_help (void)
380 {
381   /* We split the help text this way to ease translation of individual
382      entries.  */
383   static const char *help[] = {
384     "\n",
385     N_("\
386 Mandatory arguments to long options are mandatory for short options too.\n\n"),
387     N_("\
388 Startup:\n"),
389     N_("\
390   -V,  --version           display the version of Wget and exit.\n"),
391     N_("\
392   -h,  --help              print this help.\n"),
393     N_("\
394   -b,  --background        go to background after startup.\n"),
395     N_("\
396   -e,  --execute=COMMAND   execute a `.wgetrc'-style command.\n"),
397     "\n",
398
399     N_("\
400 Logging and input file:\n"),
401     N_("\
402   -o,  --output-file=FILE    log messages to FILE.\n"),
403     N_("\
404   -a,  --append-output=FILE  append messages to FILE.\n"),
405 #ifdef ENABLE_DEBUG
406     N_("\
407   -d,  --debug               print lots of debugging information.\n"),
408 #endif
409 #ifdef MSDOS
410     N_("\
411        --wdebug              print Watt-32 debug output.\n"),
412 #endif
413     N_("\
414   -q,  --quiet               quiet (no output).\n"),
415     N_("\
416   -v,  --verbose             be verbose (this is the default).\n"),
417     N_("\
418   -nv, --no-verbose          turn off verboseness, without being quiet.\n"),
419     N_("\
420   -i,  --input-file=FILE     download URLs found in FILE.\n"),
421     N_("\
422   -F,  --force-html          treat input file as HTML.\n"),
423     N_("\
424   -B,  --base=URL            prepends URL to relative links in -F -i file.\n"),
425     "\n",
426
427     N_("\
428 Download:\n"),
429     N_("\
430   -t,  --tries=NUMBER            set number of retries to NUMBER (0 unlimits).\n"),
431     N_("\
432        --retry-connrefused       retry even if connection is refused.\n"),
433     N_("\
434   -O,  --output-document=FILE    write documents to FILE.\n"),
435     N_("\
436   -nc, --no-clobber              skip downloads that would download to\n\
437                                  existing files.\n"),
438     N_("\
439   -c,  --continue                resume getting a partially-downloaded file.\n"),
440     N_("\
441        --progress=TYPE           select progress gauge type.\n"),
442     N_("\
443   -N,  --timestamping            don't re-retrieve files unless newer than\n\
444                                  local.\n"),
445     N_("\
446   -S,  --server-response         print server response.\n"),
447     N_("\
448        --spider                  don't download anything.\n"),
449     N_("\
450   -T,  --timeout=SECONDS         set all timeout values to SECONDS.\n"),
451     N_("\
452        --dns-timeout=SECS        set the DNS lookup timeout to SECS.\n"),
453     N_("\
454        --connect-timeout=SECS    set the connect timeout to SECS.\n"),
455     N_("\
456        --read-timeout=SECS       set the read timeout to SECS.\n"),
457     N_("\
458   -w,  --wait=SECONDS            wait SECONDS between retrievals.\n"),
459     N_("\
460        --waitretry=SECONDS       wait 1..SECONDS between retries of a retrieval.\n"),
461     N_("\
462        --random-wait             wait from 0...2*WAIT secs between retrievals.\n"),
463     N_("\
464        --no-proxy                explicitly turn off proxy.\n"),
465     N_("\
466   -Q,  --quota=NUMBER            set retrieval quota to NUMBER.\n"),
467     N_("\
468        --bind-address=ADDRESS    bind to ADDRESS (hostname or IP) on local host.\n"),
469     N_("\
470        --limit-rate=RATE         limit download rate to RATE.\n"),
471     N_("\
472        --no-dns-cache            disable caching DNS lookups.\n"),
473     N_("\
474        --restrict-file-names=OS  restrict chars in file names to ones OS allows.\n"),
475     N_("\
476        --ignore-case             ignore case when matching files/directories.\n"),
477 #ifdef ENABLE_IPV6
478     N_("\
479   -4,  --inet4-only              connect only to IPv4 addresses.\n"),
480     N_("\
481   -6,  --inet6-only              connect only to IPv6 addresses.\n"),
482     N_("\
483        --prefer-family=FAMILY    connect first to addresses of specified family,\n\
484                                  one of IPv6, IPv4, or none.\n"),
485 #endif
486     N_("\
487        --user=USER               set both ftp and http user to USER.\n"),
488     N_("\
489        --password=PASS           set both ftp and http password to PASS.\n"),
490     N_("\
491        --ask-password            prompt for passwords.\n"),
492     "\n",
493
494     N_("\
495 Directories:\n"),
496     N_("\
497   -nd, --no-directories           don't create directories.\n"),
498     N_("\
499   -x,  --force-directories        force creation of directories.\n"),
500     N_("\
501   -nH, --no-host-directories      don't create host directories.\n"),
502     N_("\
503        --protocol-directories     use protocol name in directories.\n"),
504     N_("\
505   -P,  --directory-prefix=PREFIX  save files to PREFIX/...\n"),
506     N_("\
507        --cut-dirs=NUMBER          ignore NUMBER remote directory components.\n"),
508     "\n",
509
510     N_("\
511 HTTP options:\n"),
512     N_("\
513        --http-user=USER        set http user to USER.\n"),
514     N_("\
515        --http-password=PASS    set http password to PASS.\n"),
516     N_("\
517        --no-cache              disallow server-cached data.\n"),
518     N_("\
519   -E,  --html-extension        save HTML documents with `.html' extension.\n"),
520     N_("\
521        --ignore-length         ignore `Content-Length' header field.\n"),
522     N_("\
523        --header=STRING         insert STRING among the headers.\n"),
524     N_("\
525        --max-redirect          maximum redirections allowed per page.\n"),
526     N_("\
527        --proxy-user=USER       set USER as proxy username.\n"),
528     N_("\
529        --proxy-password=PASS   set PASS as proxy password.\n"),
530     N_("\
531        --referer=URL           include `Referer: URL' header in HTTP request.\n"),
532     N_("\
533        --save-headers          save the HTTP headers to file.\n"),
534     N_("\
535   -U,  --user-agent=AGENT      identify as AGENT instead of Wget/VERSION.\n"),
536     N_("\
537        --no-http-keep-alive    disable HTTP keep-alive (persistent connections).\n"),
538     N_("\
539        --no-cookies            don't use cookies.\n"),
540     N_("\
541        --load-cookies=FILE     load cookies from FILE before session.\n"),
542     N_("\
543        --save-cookies=FILE     save cookies to FILE after session.\n"),
544     N_("\
545        --keep-session-cookies  load and save session (non-permanent) cookies.\n"),
546     N_("\
547        --post-data=STRING      use the POST method; send STRING as the data.\n"),
548     N_("\
549        --post-file=FILE        use the POST method; send contents of FILE.\n"),
550     N_("\
551        --content-disposition   honor the Content-Disposition header when\n\
552                                choosing local file names (EXPERIMENTAL).\n"),
553     N_("\
554        --auth-no-challenge     Send Basic HTTP authentication information\n\
555                                without first waiting for the server's\n\
556                                challenge.\n"),
557     "\n",
558
559 #ifdef HAVE_SSL
560     N_("\
561 HTTPS (SSL/TLS) options:\n"),
562     N_("\
563        --secure-protocol=PR     choose secure protocol, one of auto, SSLv2,\n\
564                                 SSLv3, and TLSv1.\n"),
565     N_("\
566        --no-check-certificate   don't validate the server's certificate.\n"),
567     N_("\
568        --certificate=FILE       client certificate file.\n"),
569     N_("\
570        --certificate-type=TYPE  client certificate type, PEM or DER.\n"),
571     N_("\
572        --private-key=FILE       private key file.\n"),
573     N_("\
574        --private-key-type=TYPE  private key type, PEM or DER.\n"),
575     N_("\
576        --ca-certificate=FILE    file with the bundle of CA's.\n"),
577     N_("\
578        --ca-directory=DIR       directory where hash list of CA's is stored.\n"),
579     N_("\
580        --random-file=FILE       file with random data for seeding the SSL PRNG.\n"),
581     N_("\
582        --egd-file=FILE          file naming the EGD socket with random data.\n"),
583     "\n",
584 #endif /* HAVE_SSL */
585
586     N_("\
587 FTP options:\n"),
588     N_("\
589        --ftp-user=USER         set ftp user to USER.\n"),
590     N_("\
591        --ftp-password=PASS     set ftp password to PASS.\n"),
592     N_("\
593        --no-remove-listing     don't remove `.listing' files.\n"),
594     N_("\
595        --no-glob               turn off FTP file name globbing.\n"),
596     N_("\
597        --no-passive-ftp        disable the \"passive\" transfer mode.\n"),
598     N_("\
599        --retr-symlinks         when recursing, get linked-to files (not dir).\n"),
600     N_("\
601        --preserve-permissions  preserve remote file permissions.\n"),
602     "\n",
603
604     N_("\
605 Recursive download:\n"),
606     N_("\
607   -r,  --recursive          specify recursive download.\n"),
608     N_("\
609   -l,  --level=NUMBER       maximum recursion depth (inf or 0 for infinite).\n"),
610     N_("\
611        --delete-after       delete files locally after downloading them.\n"),
612     N_("\
613   -k,  --convert-links      make links in downloaded HTML point to local files.\n"),
614     N_("\
615   -K,  --backup-converted   before converting file X, back up as X.orig.\n"),
616     N_("\
617   -m,  --mirror             shortcut for -N -r -l inf --no-remove-listing.\n"),
618     N_("\
619   -p,  --page-requisites    get all images, etc. needed to display HTML page.\n"),
620     N_("\
621        --strict-comments    turn on strict (SGML) handling of HTML comments.\n"),
622     "\n",
623
624     N_("\
625 Recursive accept/reject:\n"),
626     N_("\
627   -A,  --accept=LIST               comma-separated list of accepted extensions.\n"),
628     N_("\
629   -R,  --reject=LIST               comma-separated list of rejected extensions.\n"),
630     N_("\
631   -D,  --domains=LIST              comma-separated list of accepted domains.\n"),
632     N_("\
633        --exclude-domains=LIST      comma-separated list of rejected domains.\n"),
634     N_("\
635        --follow-ftp                follow FTP links from HTML documents.\n"),
636     N_("\
637        --follow-tags=LIST          comma-separated list of followed HTML tags.\n"),
638     N_("\
639        --ignore-tags=LIST          comma-separated list of ignored HTML tags.\n"),
640     N_("\
641   -H,  --span-hosts                go to foreign hosts when recursive.\n"),
642     N_("\
643   -L,  --relative                  follow relative links only.\n"),
644     N_("\
645   -I,  --include-directories=LIST  list of allowed directories.\n"),
646     N_("\
647   -X,  --exclude-directories=LIST  list of excluded directories.\n"),
648     N_("\
649   -np, --no-parent                 don't ascend to the parent directory.\n"),
650     "\n",
651
652     N_("Mail bug reports and suggestions to <bug-wget@gnu.org>.\n")
653   };
654
655   size_t i;
656
657   printf (_("GNU Wget %s, a non-interactive network retriever.\n"),
658           version_string);
659   print_usage ();
660
661   for (i = 0; i < countof (help); i++)
662     fputs (_(help[i]), stdout);
663
664   exit (0);
665 }
666
667 /* Return a human-readable printed representation of INTERVAL,
668    measured in seconds.  */
669
670 static char *
671 secs_to_human_time (double interval)
672 {
673   static char buf[32];
674   int secs = (int) (interval + 0.5);
675   int hours, mins, days;
676
677   days = secs / 86400, secs %= 86400;
678   hours = secs / 3600, secs %= 3600;
679   mins = secs / 60, secs %= 60;
680
681   if (days)
682     sprintf (buf, "%dd %dh %dm %ds", days, hours, mins, secs);
683   else if (hours)
684     sprintf (buf, "%dh %dm %ds", hours, mins, secs);
685   else if (mins)
686     sprintf (buf, "%dm %ds", mins, secs);
687   else
688     sprintf (buf, "%ss", print_decimal (interval));
689
690   return buf;
691 }
692
693 static char *
694 prompt_for_password (void)
695 {
696   if (opt.user)
697     printf (_("Password for user %s: "), quote (opt.user));
698   else
699     printf (_("Password: "));
700   return getpass("");
701 }
702
703 static void
704 print_version (void)
705 {
706   printf ("GNU Wget %s\n\n", version_string);
707   /* TRANSLATORS: When available, an actual copyright character
708      (cirle-c) should be used in preference to "(C)". */
709   fputs (_("\
710 Copyright (C) 2008 Free Software Foundation, Inc.\n"), stdout);
711   fputs (_("\
712 License GPLv3+: GNU GPL version 3 or later\n\
713 <http://www.gnu.org/licenses/gpl.html>.\n\
714 This is free software: you are free to change and redistribute it.\n\
715 There is NO WARRANTY, to the extent permitted by law.\n"), stdout);
716   /* TRANSLATORS: When available, please use the proper diacritics for
717      names such as this one. See en_US.po for reference. */
718   fputs (_("\nOriginally written by Hrvoje Niksic <hniksic@xemacs.org>.\n"),
719          stdout);
720   fputs (_("Currently maintained by Micah Cowan <micah@cowan.name>.\n"),
721          stdout);
722   exit (0);
723 }
724 \f
725
726 int
727 main (int argc, char **argv)
728 {
729   char **url, **t;
730   int i, ret, longindex;
731   int nurl, status;
732   bool append_to_log = false;
733
734   i18n_initialize ();
735
736   /* Construct the name of the executable, without the directory part.  */
737   exec_name = strrchr (argv[0], PATH_SEPARATOR);
738   if (!exec_name)
739     exec_name = argv[0];
740   else
741     ++exec_name;
742
743 #ifdef WINDOWS
744   /* Drop extension (typically .EXE) from executable filename. */
745   windows_main ((char **) &exec_name);
746 #endif
747
748   /* Set option defaults; read the system wgetrc and ~/.wgetrc.  */
749   initialize ();
750
751   init_switches ();
752   longindex = -1;
753   while ((ret = getopt_long (argc, argv,
754                              short_options, long_options, &longindex)) != -1)
755     {
756       int val;
757       struct cmdline_option *opt;
758
759       /* If LONGINDEX is unchanged, it means RET is referring a short
760          option.  */
761       if (longindex == -1)
762         {
763           if (ret == '?')
764             {
765               print_usage ();
766               printf ("\n");
767               printf (_("Try `%s --help' for more options.\n"), exec_name);
768               exit (2);
769             }
770           /* Find the short option character in the mapping.  */
771           longindex = optmap[ret - 32];
772         }
773       val = long_options[longindex].val;
774
775       /* Use the retrieved value to locate the option in the
776          option_data array, and to see if we're dealing with the
777          negated "--no-FOO" variant of the boolean option "--foo".  */
778       opt = &option_data[val & ~BOOLEAN_NEG_MARKER];
779       switch (opt->type)
780         {
781         case OPT_VALUE:
782           setoptval (opt->data, optarg, opt->long_name);
783           break;
784         case OPT_BOOLEAN:
785           if (optarg)
786             /* The user has specified a value -- use it. */
787             setoptval (opt->data, optarg, opt->long_name);
788           else
789             {
790               /* NEG is true for `--no-FOO' style boolean options. */
791               bool neg = !!(val & BOOLEAN_NEG_MARKER);
792               setoptval (opt->data, neg ? "0" : "1", opt->long_name);
793             }
794           break;
795         case OPT_FUNCALL:
796           {
797             void (*func) (void) = (void (*) (void)) opt->data;
798             func ();
799           }
800           break;
801         case OPT__APPEND_OUTPUT:
802           setoptval ("logfile", optarg, opt->long_name);
803           append_to_log = true;
804           break;
805         case OPT__EXECUTE:
806           run_command (optarg);
807           break;
808         case OPT__NO:
809           {
810             /* We support real --no-FOO flags now, but keep these
811                short options for convenience and backward
812                compatibility.  */
813             char *p;
814             for (p = optarg; *p; p++)
815               switch (*p)
816                 {
817                 case 'v':
818                   setoptval ("verbose", "0", opt->long_name);
819                   break;
820                 case 'H':
821                   setoptval ("addhostdir", "0", opt->long_name);
822                   break;
823                 case 'd':
824                   setoptval ("dirstruct", "0", opt->long_name);
825                   break;
826                 case 'c':
827                   setoptval ("noclobber", "1", opt->long_name);
828                   break;
829                 case 'p':
830                   setoptval ("noparent", "1", opt->long_name);
831                   break;
832                 default:
833                   printf (_("%s: illegal option -- `-n%c'\n"), exec_name, *p);
834                   print_usage ();
835                   printf ("\n");
836                   printf (_("Try `%s --help' for more options.\n"), exec_name);
837                   exit (1);
838                 }
839             break;
840           }
841         case OPT__PARENT:
842         case OPT__CLOBBER:
843           {
844             /* The wgetrc commands are named noparent and noclobber,
845                so we must revert the meaning of the cmdline options
846                before passing the value to setoptval.  */
847             bool flag = true;
848             if (optarg)
849               flag = (*optarg == '1' || c_tolower (*optarg) == 'y'
850                       || (c_tolower (optarg[0]) == 'o'
851                           && c_tolower (optarg[1]) == 'n'));
852             setoptval (opt->type == OPT__PARENT ? "noparent" : "noclobber",
853                        flag ? "0" : "1", opt->long_name);
854             break;
855           }
856         case OPT__DONT_REMOVE_LISTING:
857           setoptval ("removelisting", "0", opt->long_name);
858           break;
859         }
860
861       longindex = -1;
862     }
863
864   nurl = argc - optind;
865
866   /* All user options have now been processed, so it's now safe to do
867      interoption dependency checks. */
868
869   if (opt.reclevel == 0)
870       opt.reclevel = INFINITE_RECURSION; /* see recur.h for commentary */
871
872   if (opt.spider || opt.delete_after)
873       opt.no_dirstruct = true;
874
875   if (opt.page_requisites && !opt.recursive)
876     {
877       /* Don't set opt.recursive here because it would confuse the FTP
878          code.  Instead, call retrieve_tree below when either
879          page_requisites or recursive is requested.  */
880       opt.reclevel = 0;
881       if (!opt.no_dirstruct)
882         opt.dirstruct = 1;      /* normally handled by cmd_spec_recursive() */
883     }
884
885   if (opt.verbose == -1)
886     opt.verbose = !opt.quiet;
887
888   /* Sanity checks.  */
889   if (opt.verbose && opt.quiet)
890     {
891       printf (_("Can't be verbose and quiet at the same time.\n"));
892       print_usage ();
893       exit (1);
894     }
895   if (opt.timestamping && opt.noclobber)
896     {
897       printf (_("\
898 Can't timestamp and not clobber old files at the same time.\n"));
899       print_usage ();
900       exit (1);
901     }
902 #ifdef ENABLE_IPV6
903   if (opt.ipv4_only && opt.ipv6_only)
904     {
905       printf (_("Cannot specify both --inet4-only and --inet6-only.\n"));
906       print_usage ();
907       exit (1);
908     }
909 #endif
910   if (opt.output_document)
911     {
912       if (opt.convert_links 
913           && (nurl > 1 || opt.page_requisites || opt.recursive))
914         {
915           fputs (_("\
916 Cannot specify both -k and -O if multiple URLs are given, or in combination\n\
917 with -p or -r. See the manual for details.\n\n"), stdout);
918           print_usage ();
919           exit (1);
920         }
921       if (opt.page_requisites
922           || opt.recursive)
923         {
924           logprintf (LOG_NOTQUIET, "%s", _("\
925 WARNING: combining -O with -r or -p will mean that all downloaded content\n\
926 will be placed in the single file you specified.\n\n"));
927         }
928       if (opt.timestamping)
929         {
930           logprintf (LOG_NOTQUIET, "%s", _("\
931 WARNING: timestamping does nothing in combination with -O. See the manual\n\
932 for details.\n\n"));
933           opt.timestamping = false;
934         }
935       if (opt.noclobber && file_exists_p(opt.output_document)) 
936            { 
937               /* Check if output file exists; if it does, exit. */
938               logprintf (LOG_VERBOSE, _("File `%s' already there; not retrieving.\n"), opt.output_document);
939               exit(1);
940            }  
941     }
942
943   if (opt.ask_passwd && opt.passwd)
944     {
945       printf (_("Cannot specify both --ask-password and --password.\n"));
946       print_usage ();
947       exit (1);
948     }
949
950   if (!nurl && !opt.input_filename)
951     {
952       /* No URL specified.  */
953       printf (_("%s: missing URL\n"), exec_name);
954       print_usage ();
955       printf ("\n");
956       /* #### Something nicer should be printed here -- similar to the
957          pre-1.5 `--help' page.  */
958       printf (_("Try `%s --help' for more options.\n"), exec_name);
959       exit (1);
960     }
961
962 #ifdef ENABLE_IRI
963   if (opt.enable_iri)
964     {
965       if (!opt.locale)
966         {
967           opt.locale = getenv ("CHARSET");
968
969           if (opt.locale == NULL)
970             opt.locale = nl_langinfo(CODESET);
971         }
972       else
973         {
974           /* sXXXav : check given locale */
975           logprintf (LOG_VERBOSE, "Check the locale...\n");
976         }
977     }
978 #endif
979
980   if (opt.ask_passwd)
981     {
982       opt.passwd = prompt_for_password ();
983
984       if (opt.passwd == NULL || opt.passwd[0] == '\0')
985         exit (1);
986     }
987
988 #ifdef MSDOS
989   if (opt.wdebug)
990      dbug_init();
991   sock_init();
992 #else
993   if (opt.background)
994     fork_to_background ();
995 #endif
996
997   /* Initialize progress.  Have to do this after the options are
998      processed so we know where the log file is.  */
999   if (opt.verbose)
1000     set_progress_implementation (opt.progress_type);
1001
1002   /* Fill in the arguments.  */
1003   url = alloca_array (char *, nurl + 1);
1004   for (i = 0; i < nurl; i++, optind++)
1005     {
1006       char *rewritten = rewrite_shorthand_url (argv[optind]);
1007       if (rewritten)
1008         url[i] = rewritten;
1009       else
1010         url[i] = xstrdup (argv[optind]);
1011     }
1012   url[i] = NULL;
1013
1014   /* Initialize logging.  */
1015   log_init (opt.lfilename, append_to_log);
1016
1017   DEBUGP (("DEBUG output created by Wget %s on %s.\n\n", version_string,
1018            OS_TYPE));
1019
1020   /* Open the output filename if necessary.  */
1021   if (opt.output_document)
1022     {
1023       if (HYPHENP (opt.output_document))
1024         {
1025 #ifdef WINDOWS
1026           FILE *result;
1027           result = freopen (NULL, "wb", stdout);
1028           if (result == NULL)
1029             {
1030               logputs (LOG_NOTQUIET, _("\
1031 WARNING: Can't reopen standard output in binary mode;\n\
1032          downloaded file may contain inappropriate line endings.\n"));
1033             }
1034 #endif
1035           output_stream = stdout;
1036         }
1037       else
1038         {
1039           struct_fstat st;
1040           output_stream = fopen (opt.output_document,
1041                                  opt.always_rest ? "ab" : "wb");
1042           if (output_stream == NULL)
1043             {
1044               perror (opt.output_document);
1045               exit (1);
1046             }
1047           if (fstat (fileno (output_stream), &st) == 0 && S_ISREG (st.st_mode))
1048             output_stream_regular = true;
1049         }
1050     }
1051
1052 #ifdef WINDOWS
1053   ws_startup ();
1054 #endif
1055
1056 #ifdef SIGHUP
1057   /* Setup the signal handler to redirect output when hangup is
1058      received.  */
1059   if (signal(SIGHUP, SIG_IGN) != SIG_IGN)
1060     signal(SIGHUP, redirect_output_signal);
1061 #endif
1062   /* ...and do the same for SIGUSR1.  */
1063 #ifdef SIGUSR1
1064   signal (SIGUSR1, redirect_output_signal);
1065 #endif
1066 #ifdef SIGPIPE
1067   /* Writing to a closed socket normally signals SIGPIPE, and the
1068      process exits.  What we want is to ignore SIGPIPE and just check
1069      for the return value of write().  */
1070   signal (SIGPIPE, SIG_IGN);
1071 #endif
1072 #ifdef SIGWINCH
1073   signal (SIGWINCH, progress_handle_sigwinch);
1074 #endif
1075
1076   status = RETROK;              /* initialize it, just-in-case */
1077   /* Retrieve the URLs from argument list.  */
1078   for (t = url; *t; t++)
1079     {
1080       char *filename = NULL, *redirected_URL = NULL;
1081       int dt;
1082
1083       if ((opt.recursive || opt.page_requisites)
1084           && (url_scheme (*t) != SCHEME_FTP || url_uses_proxy (*t)))
1085         {
1086           int old_follow_ftp = opt.follow_ftp;
1087
1088           /* Turn opt.follow_ftp on in case of recursive FTP retrieval */
1089           if (url_scheme (*t) == SCHEME_FTP) 
1090             opt.follow_ftp = 1;
1091           
1092           status = retrieve_tree (*t);
1093
1094           opt.follow_ftp = old_follow_ftp;
1095         }
1096       else
1097         status = retrieve_url (*t, &filename, &redirected_URL, NULL, &dt, opt.recursive);
1098
1099       if (opt.delete_after && file_exists_p(filename))
1100         {
1101           DEBUGP (("Removing file due to --delete-after in main():\n"));
1102           logprintf (LOG_VERBOSE, _("Removing %s.\n"), filename);
1103           if (unlink (filename))
1104             logprintf (LOG_NOTQUIET, "unlink: %s\n", strerror (errno));
1105         }
1106
1107       xfree_null (redirected_URL);
1108       xfree_null (filename);
1109     }
1110
1111   /* And then from the input file, if any.  */
1112   if (opt.input_filename)
1113     {
1114       int count;
1115       status = retrieve_from_file (opt.input_filename, opt.force_html, &count);
1116       if (!count)
1117         logprintf (LOG_NOTQUIET, _("No URLs found in %s.\n"),
1118                    opt.input_filename);
1119     }
1120
1121   /* Print broken links. */
1122   if (opt.recursive && opt.spider)
1123     {
1124       print_broken_links();
1125     }
1126   
1127   /* Print the downloaded sum.  */
1128   if ((opt.recursive || opt.page_requisites
1129        || nurl > 1
1130        || (opt.input_filename && total_downloaded_bytes != 0))
1131       &&
1132       total_downloaded_bytes != 0)
1133     {
1134       logprintf (LOG_NOTQUIET,
1135                  _("FINISHED --%s--\nDownloaded: %d files, %s in %s (%s)\n"),
1136                  datetime_str (time (NULL)),
1137                  opt.numurls,
1138                  human_readable (total_downloaded_bytes),
1139                  secs_to_human_time (total_download_time),
1140                  retr_rate (total_downloaded_bytes, total_download_time));
1141       /* Print quota warning, if exceeded.  */
1142       if (opt.quota && total_downloaded_bytes > opt.quota)
1143         logprintf (LOG_NOTQUIET,
1144                    _("Download quota of %s EXCEEDED!\n"),
1145                    human_readable (opt.quota));
1146     }
1147
1148   if (opt.cookies_output)
1149     save_cookies ();
1150
1151   if (opt.convert_links && !opt.delete_after)
1152     convert_all_links ();
1153
1154   log_close ();
1155   for (i = 0; i < nurl; i++)
1156     xfree (url[i]);
1157   cleanup ();
1158
1159 #ifdef DEBUG_MALLOC
1160   print_malloc_debug_stats ();
1161 #endif
1162   if (status == RETROK)
1163     return 0;
1164   else
1165     return 1;
1166 }
1167 #endif /* TESTING */
1168 \f
1169 #if defined(SIGHUP) || defined(SIGUSR1)
1170
1171 /* So the signal_name check doesn't blow when only one is available. */
1172 #ifndef SIGHUP
1173 # define SIGHUP -1
1174 #endif
1175 #ifndef SIGUSR1
1176 # define SIGUSR1 -1
1177 #endif
1178
1179 /* Hangup signal handler.  When wget receives SIGHUP or SIGUSR1, it
1180    will proceed operation as usual, trying to write into a log file.
1181    If that is impossible, the output will be turned off.  */
1182
1183 static void
1184 redirect_output_signal (int sig)
1185 {
1186   const char *signal_name = (sig == SIGHUP ? "SIGHUP" :
1187                              (sig == SIGUSR1 ? "SIGUSR1" :
1188                               "WTF?!"));
1189   log_request_redirect_output (signal_name);
1190   progress_schedule_redirect ();
1191   signal (sig, redirect_output_signal);
1192 }
1193 #endif
1194
1195 /*
1196  * vim: et ts=2 sw=2
1197  */