]> sjero.net Git - wget/blob - src/main.c
Revised usage description of --convert-links to apply to CSS as well as to HTML.
[wget] / src / main.c
1 /* Command line parsing.
2    Copyright (C) 1996, 1997, 1998, 1999, 2000, 2001, 2002, 2003,
3    2004, 2005, 2006, 2007, 2008 Free Software Foundation, Inc.
4
5 This file is part of GNU Wget.
6
7 GNU Wget is free software; you can redistribute it and/or modify
8 it under the terms of the GNU General Public License as published by
9 the Free Software Foundation; either version 3 of the License, or
10 (at your option) any later version.
11
12 GNU Wget is distributed in the hope that it will be useful,
13 but WITHOUT ANY WARRANTY; without even the implied warranty of
14 MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15 GNU General Public License for more details.
16
17 You should have received a copy of the GNU General Public License
18 along with Wget.  If not, see <http://www.gnu.org/licenses/>.
19
20 Additional permission under GNU GPL version 3 section 7
21
22 If you modify this program, or any covered work, by linking or
23 combining it with the OpenSSL project's OpenSSL library (or a
24 modified version of that library), containing parts covered by the
25 terms of the OpenSSL or SSLeay licenses, the Free Software Foundation
26 grants you additional permission to convey the resulting work.
27 Corresponding Source for a non-source form of such a combination
28 shall include the source code for the parts of OpenSSL used as well
29 as that of the covered work.  */
30
31 #include "wget.h"
32
33 #include <stdio.h>
34 #include <stdlib.h>
35 #ifdef HAVE_UNISTD_H
36 # include <unistd.h>
37 #endif /* HAVE_UNISTD_H */
38 #include <string.h>
39 #include <signal.h>
40 #ifdef ENABLE_NLS
41 # include <locale.h>
42 #endif
43 #include <assert.h>
44 #include <errno.h>
45 #include <time.h>
46
47 #include "utils.h"
48 #include "init.h"
49 #include "retr.h"
50 #include "recur.h"
51 #include "host.h"
52 #include "url.h"
53 #include "progress.h"           /* for progress_handle_sigwinch */
54 #include "convert.h"
55 #include "spider.h"
56 #include "http.h"               /* for save_cookies */
57
58 #include <getopt.h>
59
60 #ifndef PATH_SEPARATOR
61 # define PATH_SEPARATOR '/'
62 #endif
63
64 struct options opt;
65
66 extern char *version_string;
67
68 #if defined(SIGHUP) || defined(SIGUSR1)
69 static void redirect_output_signal (int);
70 #endif
71
72 const char *exec_name;
73 \f
74 #ifndef TESTING
75 /* Initialize I18N/L10N.  That amounts to invoking setlocale, and
76    setting up gettext's message catalog using bindtextdomain and
77    textdomain.  Does nothing if NLS is disabled or missing.  */
78
79 static void
80 i18n_initialize (void)
81 {
82   /* ENABLE_NLS implies existence of functions invoked here.  */
83 #ifdef ENABLE_NLS
84   /* Set the current locale.  */
85   setlocale (LC_ALL, "");
86   /* Set the text message domain.  */
87   bindtextdomain ("wget", LOCALEDIR);
88   textdomain ("wget");
89 #endif /* ENABLE_NLS */
90 }
91 \f
92 /* Definition of command-line options. */
93
94 static void print_help (void);
95 static void print_version (void);
96
97 #ifdef HAVE_SSL
98 # define IF_SSL(x) x
99 #else
100 # define IF_SSL(x) NULL
101 #endif
102
103 #ifdef ENABLE_DEBUG
104 # define WHEN_DEBUG(x) x
105 #else
106 # define WHEN_DEBUG(x) NULL
107 #endif
108
109 struct cmdline_option {
110   const char *long_name;
111   char short_name;
112   enum {
113     OPT_VALUE,
114     OPT_BOOLEAN,
115     OPT_FUNCALL,
116     /* Non-standard options that have to be handled specially in
117        main().  */
118     OPT__APPEND_OUTPUT,
119     OPT__CLOBBER,
120     OPT__DONT_REMOVE_LISTING,
121     OPT__EXECUTE,
122     OPT__NO,
123     OPT__PARENT
124   } type;
125   const void *data;             /* for standard options */
126   int argtype;                  /* for non-standard options */
127 };
128
129 static struct cmdline_option option_data[] =
130   {
131     { "accept", 'A', OPT_VALUE, "accept", -1 },
132     { "append-output", 'a', OPT__APPEND_OUTPUT, NULL, required_argument },
133     { "auth-no-challenge", 0, OPT_BOOLEAN, "authnochallenge", -1 },
134     { "background", 'b', OPT_BOOLEAN, "background", -1 },
135     { "backup-converted", 'K', OPT_BOOLEAN, "backupconverted", -1 },
136     { "backups", 0, OPT_BOOLEAN, "backups", -1 },
137     { "base", 'B', OPT_VALUE, "base", -1 },
138     { "bind-address", 0, OPT_VALUE, "bindaddress", -1 },
139     { IF_SSL ("ca-certificate"), 0, OPT_VALUE, "cacertificate", -1 },
140     { IF_SSL ("ca-directory"), 0, OPT_VALUE, "cadirectory", -1 },
141     { "cache", 0, OPT_BOOLEAN, "cache", -1 },
142     { IF_SSL ("certificate"), 0, OPT_VALUE, "certificate", -1 },
143     { IF_SSL ("certificate-type"), 0, OPT_VALUE, "certificatetype", -1 },
144     { IF_SSL ("check-certificate"), 0, OPT_BOOLEAN, "checkcertificate", -1 },
145     { "clobber", 0, OPT__CLOBBER, NULL, optional_argument },
146     { "connect-timeout", 0, OPT_VALUE, "connecttimeout", -1 },
147     { "continue", 'c', OPT_BOOLEAN, "continue", -1 },
148     { "convert-links", 'k', OPT_BOOLEAN, "convertlinks", -1 },
149     { "content-disposition", 0, OPT_BOOLEAN, "contentdisposition", -1 },
150     { "cookies", 0, OPT_BOOLEAN, "cookies", -1 },
151     { "cut-dirs", 0, OPT_VALUE, "cutdirs", -1 },
152     { WHEN_DEBUG ("debug"), 'd', OPT_BOOLEAN, "debug", -1 },
153     { "delete-after", 0, OPT_BOOLEAN, "deleteafter", -1 },
154     { "directories", 0, OPT_BOOLEAN, "dirstruct", -1 },
155     { "directory-prefix", 'P', OPT_VALUE, "dirprefix", -1 },
156     { "dns-cache", 0, OPT_BOOLEAN, "dnscache", -1 },
157     { "dns-timeout", 0, OPT_VALUE, "dnstimeout", -1 },
158     { "domains", 'D', OPT_VALUE, "domains", -1 },
159     { "dont-remove-listing", 0, OPT__DONT_REMOVE_LISTING, NULL, no_argument },
160     { "dot-style", 0, OPT_VALUE, "dotstyle", -1 },
161     { "egd-file", 0, OPT_VALUE, "egdfile", -1 },
162     { "exclude-directories", 'X', OPT_VALUE, "excludedirectories", -1 },
163     { "exclude-domains", 0, OPT_VALUE, "excludedomains", -1 },
164     { "execute", 'e', OPT__EXECUTE, NULL, required_argument },
165     { "follow-ftp", 0, OPT_BOOLEAN, "followftp", -1 },
166     { "follow-tags", 0, OPT_VALUE, "followtags", -1 },
167     { "force-directories", 'x', OPT_BOOLEAN, "dirstruct", -1 },
168     { "force-html", 'F', OPT_BOOLEAN, "forcehtml", -1 },
169     { "ftp-password", 0, OPT_VALUE, "ftppassword", -1 },
170     { "ftp-user", 0, OPT_VALUE, "ftpuser", -1 },
171     { "glob", 0, OPT_BOOLEAN, "glob", -1 },
172     { "header", 0, OPT_VALUE, "header", -1 },
173     { "help", 'h', OPT_FUNCALL, (void *)print_help, no_argument },
174     { "host-directories", 0, OPT_BOOLEAN, "addhostdir", -1 },
175     { "html-extension", 'E', OPT_BOOLEAN, "htmlextension", -1 },
176     { "htmlify", 0, OPT_BOOLEAN, "htmlify", -1 },
177     { "http-keep-alive", 0, OPT_BOOLEAN, "httpkeepalive", -1 },
178     { "http-passwd", 0, OPT_VALUE, "httppassword", -1 }, /* deprecated */
179     { "http-password", 0, OPT_VALUE, "httppassword", -1 },
180     { "http-user", 0, OPT_VALUE, "httpuser", -1 },
181     { "ignore-case", 0, OPT_BOOLEAN, "ignorecase", -1 },
182     { "ignore-length", 0, OPT_BOOLEAN, "ignorelength", -1 },
183     { "ignore-tags", 0, OPT_VALUE, "ignoretags", -1 },
184     { "include-directories", 'I', OPT_VALUE, "includedirectories", -1 },
185 #ifdef ENABLE_IPV6
186     { "inet4-only", '4', OPT_BOOLEAN, "inet4only", -1 },
187     { "inet6-only", '6', OPT_BOOLEAN, "inet6only", -1 },
188 #endif
189     { "input-file", 'i', OPT_VALUE, "input", -1 },
190     { "keep-session-cookies", 0, OPT_BOOLEAN, "keepsessioncookies", -1 },
191     { "level", 'l', OPT_VALUE, "reclevel", -1 },
192     { "limit-rate", 0, OPT_VALUE, "limitrate", -1 },
193     { "load-cookies", 0, OPT_VALUE, "loadcookies", -1 },
194     { "max-redirect", 0, OPT_VALUE, "maxredirect", -1 },
195     { "mirror", 'm', OPT_BOOLEAN, "mirror", -1 },
196     { "no", 'n', OPT__NO, NULL, required_argument },
197     { "no-clobber", 0, OPT_BOOLEAN, "noclobber", -1 },
198     { "no-parent", 0, OPT_BOOLEAN, "noparent", -1 },
199     { "output-document", 'O', OPT_VALUE, "outputdocument", -1 },
200     { "output-file", 'o', OPT_VALUE, "logfile", -1 },
201     { "page-requisites", 'p', OPT_BOOLEAN, "pagerequisites", -1 },
202     { "parent", 0, OPT__PARENT, NULL, optional_argument },
203     { "passive-ftp", 0, OPT_BOOLEAN, "passiveftp", -1 },
204     { "password", 0, OPT_VALUE, "password", -1 },
205     { "post-data", 0, OPT_VALUE, "postdata", -1 },
206     { "post-file", 0, OPT_VALUE, "postfile", -1 },
207     { "prefer-family", 0, OPT_VALUE, "preferfamily", -1 },
208     { "preserve-permissions", 0, OPT_BOOLEAN, "preservepermissions", -1 },
209     { IF_SSL ("private-key"), 0, OPT_VALUE, "privatekey", -1 },
210     { IF_SSL ("private-key-type"), 0, OPT_VALUE, "privatekeytype", -1 },
211     { "progress", 0, OPT_VALUE, "progress", -1 },
212     { "protocol-directories", 0, OPT_BOOLEAN, "protocoldirectories", -1 },
213     { "proxy", 0, OPT_BOOLEAN, "useproxy", -1 },
214     { "proxy__compat", 'Y', OPT_VALUE, "useproxy", -1 }, /* back-compatible */
215     { "proxy-passwd", 0, OPT_VALUE, "proxypassword", -1 }, /* deprecated */
216     { "proxy-password", 0, OPT_VALUE, "proxypassword", -1 },
217     { "proxy-user", 0, OPT_VALUE, "proxyuser", -1 },
218     { "quiet", 'q', OPT_BOOLEAN, "quiet", -1 },
219     { "quota", 'Q', OPT_VALUE, "quota", -1 },
220     { "random-file", 0, OPT_VALUE, "randomfile", -1 },
221     { "random-wait", 0, OPT_BOOLEAN, "randomwait", -1 },
222     { "read-timeout", 0, OPT_VALUE, "readtimeout", -1 },
223     { "recursive", 'r', OPT_BOOLEAN, "recursive", -1 },
224     { "referer", 0, OPT_VALUE, "referer", -1 },
225     { "reject", 'R', OPT_VALUE, "reject", -1 },
226     { "relative", 'L', OPT_BOOLEAN, "relativeonly", -1 },
227     { "remove-listing", 0, OPT_BOOLEAN, "removelisting", -1 },
228     { "restrict-file-names", 0, OPT_BOOLEAN, "restrictfilenames", -1 },
229     { "retr-symlinks", 0, OPT_BOOLEAN, "retrsymlinks", -1 },
230     { "retry-connrefused", 0, OPT_BOOLEAN, "retryconnrefused", -1 },
231     { "save-cookies", 0, OPT_VALUE, "savecookies", -1 },
232     { "save-headers", 0, OPT_BOOLEAN, "saveheaders", -1 },
233     { IF_SSL ("secure-protocol"), 0, OPT_VALUE, "secureprotocol", -1 },
234     { "server-response", 'S', OPT_BOOLEAN, "serverresponse", -1 },
235     { "span-hosts", 'H', OPT_BOOLEAN, "spanhosts", -1 },
236     { "spider", 0, OPT_BOOLEAN, "spider", -1 },
237     { "strict-comments", 0, OPT_BOOLEAN, "strictcomments", -1 },
238     { "timeout", 'T', OPT_VALUE, "timeout", -1 },
239     { "timestamping", 'N', OPT_BOOLEAN, "timestamping", -1 },
240     { "tries", 't', OPT_VALUE, "tries", -1 },
241     { "user", 0, OPT_VALUE, "user", -1 },
242     { "user-agent", 'U', OPT_VALUE, "useragent", -1 },
243     { "verbose", 'v', OPT_BOOLEAN, "verbose", -1 },
244     { "verbose", 0, OPT_BOOLEAN, "verbose", -1 },
245     { "version", 'V', OPT_FUNCALL, (void *) print_version, no_argument },
246     { "wait", 'w', OPT_VALUE, "wait", -1 },
247     { "waitretry", 0, OPT_VALUE, "waitretry", -1 },
248 #ifdef MSDOS
249     { "wdebug", 0, OPT_BOOLEAN, "wdebug", -1 },
250 #endif
251   };
252
253 #undef WHEN_DEBUG
254 #undef IF_SSL
255
256 /* Return a string that contains S with "no-" prepended.  The string
257    is NUL-terminated and allocated off static storage at Wget
258    startup.  */
259
260 static char *
261 no_prefix (const char *s)
262 {
263   static char buffer[1024];
264   static char *p = buffer;
265
266   char *cp = p;
267   int size = 3 + strlen (s) + 1;  /* "no-STRING\0" */
268   if (p + size >= buffer + sizeof (buffer))
269     abort ();
270
271   cp[0] = 'n', cp[1] = 'o', cp[2] = '-';
272   strcpy (cp + 3, s);
273   p += size;
274   return cp;
275 }
276
277 /* The arguments that that main passes to getopt_long. */
278 static struct option long_options[2 * countof (option_data) + 1];
279 static char short_options[128];
280
281 /* Mapping between short option chars and option_data indices. */
282 static unsigned char optmap[96];
283
284 /* Marker for `--no-FOO' values in long_options.  */
285 #define BOOLEAN_NEG_MARKER 1024
286
287 /* Initialize the long_options array used by getopt_long from the data
288    in option_data.  */
289
290 static void
291 init_switches (void)
292 {
293   char *p = short_options;
294   int i, o = 0;
295   for (i = 0; i < countof (option_data); i++)
296     {
297       struct cmdline_option *opt = &option_data[i];
298       struct option *longopt;
299
300       if (!opt->long_name)
301         /* The option is disabled. */
302         continue;
303
304       longopt = &long_options[o++];
305       longopt->name = opt->long_name;
306       longopt->val = i;
307       if (opt->short_name)
308         {
309           *p++ = opt->short_name;
310           optmap[opt->short_name - 32] = longopt - long_options;
311         }
312       switch (opt->type)
313         {
314         case OPT_VALUE:
315           longopt->has_arg = required_argument;
316           if (opt->short_name)
317             *p++ = ':';
318           break;
319         case OPT_BOOLEAN:
320           /* Specify an optional argument for long options, so that
321              --option=off works the same as --no-option, for
322              compatibility with pre-1.10 Wget.  However, don't specify
323              optional arguments short-option booleans because they
324              prevent combining of short options.  */
325           longopt->has_arg = optional_argument;
326           /* For Boolean options, add the "--no-FOO" variant, which is
327              identical to "--foo", except it has opposite meaning and
328              it doesn't allow an argument.  */
329           longopt = &long_options[o++];
330           longopt->name = no_prefix (opt->long_name);
331           longopt->has_arg = no_argument;
332           /* Mask the value so we'll be able to recognize that we're
333              dealing with the false value.  */
334           longopt->val = i | BOOLEAN_NEG_MARKER;
335           break;
336         default:
337           assert (opt->argtype != -1);
338           longopt->has_arg = opt->argtype;
339           if (opt->short_name)
340             {
341               if (longopt->has_arg == required_argument)
342                 *p++ = ':';
343               /* Don't handle optional_argument */
344             }
345         }
346     }
347   /* Terminate short_options. */
348   *p = '\0';
349   /* No need for xzero(long_options[o]) because its storage is static
350      and it will be zeroed by default.  */
351   assert (o <= countof (long_options));
352 }
353
354 /* Print the usage message.  */
355 static void
356 print_usage (void)
357 {
358   printf (_("Usage: %s [OPTION]... [URL]...\n"), exec_name);
359 }
360
361 /* Print the help message, describing all the available options.  If
362    you add an option, be sure to update this list.  */
363 static void
364 print_help (void)
365 {
366   /* We split the help text this way to ease translation of individual
367      entries.  */
368   static const char *help[] = {
369     "\n",
370     N_("\
371 Mandatory arguments to long options are mandatory for short options too.\n\n"),
372     N_("\
373 Startup:\n"),
374     N_("\
375   -V,  --version           display the version of Wget and exit.\n"),
376     N_("\
377   -h,  --help              print this help.\n"),
378     N_("\
379   -b,  --background        go to background after startup.\n"),
380     N_("\
381   -e,  --execute=COMMAND   execute a `.wgetrc'-style command.\n"),
382     "\n",
383
384     N_("\
385 Logging and input file:\n"),
386     N_("\
387   -o,  --output-file=FILE    log messages to FILE.\n"),
388     N_("\
389   -a,  --append-output=FILE  append messages to FILE.\n"),
390 #ifdef ENABLE_DEBUG
391     N_("\
392   -d,  --debug               print lots of debugging information.\n"),
393 #endif
394 #ifdef MSDOS
395     N_("\
396        --wdebug              print Watt-32 debug output.\n"),
397 #endif
398     N_("\
399   -q,  --quiet               quiet (no output).\n"),
400     N_("\
401   -v,  --verbose             be verbose (this is the default).\n"),
402     N_("\
403   -nv, --no-verbose          turn off verboseness, without being quiet.\n"),
404     N_("\
405   -i,  --input-file=FILE     download URLs found in FILE.\n"),
406     N_("\
407   -F,  --force-html          treat input file as HTML.\n"),
408     N_("\
409   -B,  --base=URL            prepends URL to relative links in -F -i file.\n"),
410     "\n",
411
412     N_("\
413 Download:\n"),
414     N_("\
415   -t,  --tries=NUMBER            set number of retries to NUMBER (0 unlimits).\n"),
416     N_("\
417        --retry-connrefused       retry even if connection is refused.\n"),
418     N_("\
419   -O,  --output-document=FILE    write documents to FILE.\n"),
420     N_("\
421   -nc, --no-clobber              skip downloads that would download to\n\
422                                  existing files.\n"),
423     N_("\
424   -c,  --continue                resume getting a partially-downloaded file.\n"),
425     N_("\
426        --progress=TYPE           select progress gauge type.\n"),
427     N_("\
428   -N,  --timestamping            don't re-retrieve files unless newer than\n\
429                                  local.\n"),
430     N_("\
431   -S,  --server-response         print server response.\n"),
432     N_("\
433        --spider                  don't download anything.\n"),
434     N_("\
435   -T,  --timeout=SECONDS         set all timeout values to SECONDS.\n"),
436     N_("\
437        --dns-timeout=SECS        set the DNS lookup timeout to SECS.\n"),
438     N_("\
439        --connect-timeout=SECS    set the connect timeout to SECS.\n"),
440     N_("\
441        --read-timeout=SECS       set the read timeout to SECS.\n"),
442     N_("\
443   -w,  --wait=SECONDS            wait SECONDS between retrievals.\n"),
444     N_("\
445        --waitretry=SECONDS       wait 1..SECONDS between retries of a retrieval.\n"),
446     N_("\
447        --random-wait             wait from 0...2*WAIT secs between retrievals.\n"),
448     N_("\
449        --no-proxy                explicitly turn off proxy.\n"),
450     N_("\
451   -Q,  --quota=NUMBER            set retrieval quota to NUMBER.\n"),
452     N_("\
453        --bind-address=ADDRESS    bind to ADDRESS (hostname or IP) on local host.\n"),
454     N_("\
455        --limit-rate=RATE         limit download rate to RATE.\n"),
456     N_("\
457        --no-dns-cache            disable caching DNS lookups.\n"),
458     N_("\
459        --restrict-file-names=OS  restrict chars in file names to ones OS allows.\n"),
460     N_("\
461        --ignore-case             ignore case when matching files/directories.\n"),
462 #ifdef ENABLE_IPV6
463     N_("\
464   -4,  --inet4-only              connect only to IPv4 addresses.\n"),
465     N_("\
466   -6,  --inet6-only              connect only to IPv6 addresses.\n"),
467     N_("\
468        --prefer-family=FAMILY    connect first to addresses of specified family,\n\
469                                  one of IPv6, IPv4, or none.\n"),
470 #endif
471     N_("\
472        --user=USER               set both ftp and http user to USER.\n"),
473     N_("\
474        --password=PASS           set both ftp and http password to PASS.\n"),
475     "\n",
476
477     N_("\
478 Directories:\n"),
479     N_("\
480   -nd, --no-directories           don't create directories.\n"),
481     N_("\
482   -x,  --force-directories        force creation of directories.\n"),
483     N_("\
484   -nH, --no-host-directories      don't create host directories.\n"),
485     N_("\
486        --protocol-directories     use protocol name in directories.\n"),
487     N_("\
488   -P,  --directory-prefix=PREFIX  save files to PREFIX/...\n"),
489     N_("\
490        --cut-dirs=NUMBER          ignore NUMBER remote directory components.\n"),
491     "\n",
492
493     N_("\
494 HTTP options:\n"),
495     N_("\
496        --http-user=USER        set http user to USER.\n"),
497     N_("\
498        --http-password=PASS    set http password to PASS.\n"),
499     N_("\
500        --no-cache              disallow server-cached data.\n"),
501     N_("\
502   -E,  --html-extension        save HTML documents with `.html' extension.\n"),
503     N_("\
504        --ignore-length         ignore `Content-Length' header field.\n"),
505     N_("\
506        --header=STRING         insert STRING among the headers.\n"),
507     N_("\
508        --max-redirect          maximum redirections allowed per page.\n"),
509     N_("\
510        --proxy-user=USER       set USER as proxy username.\n"),
511     N_("\
512        --proxy-password=PASS   set PASS as proxy password.\n"),
513     N_("\
514        --referer=URL           include `Referer: URL' header in HTTP request.\n"),
515     N_("\
516        --save-headers          save the HTTP headers to file.\n"),
517     N_("\
518   -U,  --user-agent=AGENT      identify as AGENT instead of Wget/VERSION.\n"),
519     N_("\
520        --no-http-keep-alive    disable HTTP keep-alive (persistent connections).\n"),
521     N_("\
522        --no-cookies            don't use cookies.\n"),
523     N_("\
524        --load-cookies=FILE     load cookies from FILE before session.\n"),
525     N_("\
526        --save-cookies=FILE     save cookies to FILE after session.\n"),
527     N_("\
528        --keep-session-cookies  load and save session (non-permanent) cookies.\n"),
529     N_("\
530        --post-data=STRING      use the POST method; send STRING as the data.\n"),
531     N_("\
532        --post-file=FILE        use the POST method; send contents of FILE.\n"),
533     N_("\
534        --content-disposition   honor the Content-Disposition header when\n\
535                                choosing local file names (EXPERIMENTAL).\n"),
536     N_("\
537        --auth-no-challenge     Send Basic HTTP authentication information\n\
538                                without first waiting for the server's\n\
539                                challenge.\n"),
540     "\n",
541
542 #ifdef HAVE_SSL
543     N_("\
544 HTTPS (SSL/TLS) options:\n"),
545     N_("\
546        --secure-protocol=PR     choose secure protocol, one of auto, SSLv2,\n\
547                                 SSLv3, and TLSv1.\n"),
548     N_("\
549        --no-check-certificate   don't validate the server's certificate.\n"),
550     N_("\
551        --certificate=FILE       client certificate file.\n"),
552     N_("\
553        --certificate-type=TYPE  client certificate type, PEM or DER.\n"),
554     N_("\
555        --private-key=FILE       private key file.\n"),
556     N_("\
557        --private-key-type=TYPE  private key type, PEM or DER.\n"),
558     N_("\
559        --ca-certificate=FILE    file with the bundle of CA's.\n"),
560     N_("\
561        --ca-directory=DIR       directory where hash list of CA's is stored.\n"),
562     N_("\
563        --random-file=FILE       file with random data for seeding the SSL PRNG.\n"),
564     N_("\
565        --egd-file=FILE          file naming the EGD socket with random data.\n"),
566     "\n",
567 #endif /* HAVE_SSL */
568
569     N_("\
570 FTP options:\n"),
571     N_("\
572        --ftp-user=USER         set ftp user to USER.\n"),
573     N_("\
574        --ftp-password=PASS     set ftp password to PASS.\n"),
575     N_("\
576        --no-remove-listing     don't remove `.listing' files.\n"),
577     N_("\
578        --no-glob               turn off FTP file name globbing.\n"),
579     N_("\
580        --no-passive-ftp        disable the \"passive\" transfer mode.\n"),
581     N_("\
582        --retr-symlinks         when recursing, get linked-to files (not dir).\n"),
583     N_("\
584        --preserve-permissions  preserve remote file permissions.\n"),
585     "\n",
586
587     N_("\
588 Recursive download:\n"),
589     N_("\
590   -r,  --recursive          specify recursive download.\n"),
591     N_("\
592   -l,  --level=NUMBER       maximum recursion depth (inf or 0 for infinite).\n"),
593     N_("\
594        --delete-after       delete files locally after downloading them.\n"),
595     N_("\
596   -k,  --convert-links      make links in downloaded HTML or CSS point to\n\
597                             local files.\n"),
598     N_("\
599   -K,  --backup-converted   before converting file X, back up as X.orig.\n"),
600     N_("\
601   -m,  --mirror             shortcut for -N -r -l inf --no-remove-listing.\n"),
602     N_("\
603   -p,  --page-requisites    get all images, etc. needed to display HTML page.\n"),
604     N_("\
605        --strict-comments    turn on strict (SGML) handling of HTML comments.\n"),
606     "\n",
607
608     N_("\
609 Recursive accept/reject:\n"),
610     N_("\
611   -A,  --accept=LIST               comma-separated list of accepted extensions.\n"),
612     N_("\
613   -R,  --reject=LIST               comma-separated list of rejected extensions.\n"),
614     N_("\
615   -D,  --domains=LIST              comma-separated list of accepted domains.\n"),
616     N_("\
617        --exclude-domains=LIST      comma-separated list of rejected domains.\n"),
618     N_("\
619        --follow-ftp                follow FTP links from HTML documents.\n"),
620     N_("\
621        --follow-tags=LIST          comma-separated list of followed HTML tags.\n"),
622     N_("\
623        --ignore-tags=LIST          comma-separated list of ignored HTML tags.\n"),
624     N_("\
625   -H,  --span-hosts                go to foreign hosts when recursive.\n"),
626     N_("\
627   -L,  --relative                  follow relative links only.\n"),
628     N_("\
629   -I,  --include-directories=LIST  list of allowed directories.\n"),
630     N_("\
631   -X,  --exclude-directories=LIST  list of excluded directories.\n"),
632     N_("\
633   -np, --no-parent                 don't ascend to the parent directory.\n"),
634     "\n",
635
636     N_("Mail bug reports and suggestions to <bug-wget@gnu.org>.\n")
637   };
638
639   int i;
640
641   printf (_("GNU Wget %s, a non-interactive network retriever.\n"),
642           version_string);
643   print_usage ();
644
645   for (i = 0; i < countof (help); i++)
646     fputs (_(help[i]), stdout);
647
648   exit (0);
649 }
650
651 /* Return a human-readable printed representation of INTERVAL,
652    measured in seconds.  */
653
654 static char *
655 secs_to_human_time (double interval)
656 {
657   static char buf[32];
658   int secs = (int) (interval + 0.5);
659   int hours, mins, days;
660
661   days = secs / 86400, secs %= 86400;
662   hours = secs / 3600, secs %= 3600;
663   mins = secs / 60, secs %= 60;
664
665   if (days)
666     sprintf (buf, "%dd %dh %dm %ds", days, hours, mins, secs);
667   else if (hours)
668     sprintf (buf, "%dh %dm %ds", hours, mins, secs);
669   else if (mins)
670     sprintf (buf, "%dm %ds", mins, secs);
671   else
672     sprintf (buf, "%ss", print_decimal (interval));
673
674   return buf;
675 }
676
677 static void
678 print_version (void)
679 {
680   printf ("GNU Wget %s\n\n", version_string);
681   /* TRANSLATORS: When available, an actual copyright character
682      (cirle-c) should be used in preference to "(C)". */
683   fputs (_("\
684 Copyright (C) 2008 Free Software Foundation, Inc.\n"), stdout);
685   fputs (_("\
686 License GPLv3+: GNU GPL version 3 or later\n\
687 <http://www.gnu.org/licenses/gpl.html>.\n\
688 This is free software: you are free to change and redistribute it.\n\
689 There is NO WARRANTY, to the extent permitted by law.\n"), stdout);
690   /* TRANSLATORS: When available, please use the proper diacritics for
691      names such as this one. See en_US.po for reference. */
692   fputs (_("\nOriginally written by Hrvoje Niksic <hniksic@xemacs.org>.\n"),
693          stdout);
694   fputs (_("Currently maintained by Micah Cowan <micah@cowan.name>.\n"),
695          stdout);
696   exit (0);
697 }
698 \f
699
700 int
701 main (int argc, char **argv)
702 {
703   char **url, **t;
704   int i, ret, longindex;
705   int nurl, status;
706   bool append_to_log = false;
707
708   i18n_initialize ();
709
710   /* Construct the name of the executable, without the directory part.  */
711   exec_name = strrchr (argv[0], PATH_SEPARATOR);
712   if (!exec_name)
713     exec_name = argv[0];
714   else
715     ++exec_name;
716
717 #ifdef WINDOWS
718   /* Drop extension (typically .EXE) from executable filename. */
719   windows_main ((char **) &exec_name);
720 #endif
721
722   /* Set option defaults; read the system wgetrc and ~/.wgetrc.  */
723   initialize ();
724
725   init_switches ();
726   longindex = -1;
727   while ((ret = getopt_long (argc, argv,
728                              short_options, long_options, &longindex)) != -1)
729     {
730       int val;
731       struct cmdline_option *opt;
732
733       /* If LONGINDEX is unchanged, it means RET is referring a short
734          option.  */
735       if (longindex == -1)
736         {
737           if (ret == '?')
738             {
739               print_usage ();
740               printf ("\n");
741               printf (_("Try `%s --help' for more options.\n"), exec_name);
742               exit (2);
743             }
744           /* Find the short option character in the mapping.  */
745           longindex = optmap[ret - 32];
746         }
747       val = long_options[longindex].val;
748
749       /* Use the retrieved value to locate the option in the
750          option_data array, and to see if we're dealing with the
751          negated "--no-FOO" variant of the boolean option "--foo".  */
752       opt = &option_data[val & ~BOOLEAN_NEG_MARKER];
753       switch (opt->type)
754         {
755         case OPT_VALUE:
756           setoptval (opt->data, optarg, opt->long_name);
757           break;
758         case OPT_BOOLEAN:
759           if (optarg)
760             /* The user has specified a value -- use it. */
761             setoptval (opt->data, optarg, opt->long_name);
762           else
763             {
764               /* NEG is true for `--no-FOO' style boolean options. */
765               bool neg = !!(val & BOOLEAN_NEG_MARKER);
766               setoptval (opt->data, neg ? "0" : "1", opt->long_name);
767             }
768           break;
769         case OPT_FUNCALL:
770           {
771             void (*func) (void) = (void (*) (void)) opt->data;
772             func ();
773           }
774           break;
775         case OPT__APPEND_OUTPUT:
776           setoptval ("logfile", optarg, opt->long_name);
777           append_to_log = true;
778           break;
779         case OPT__EXECUTE:
780           run_command (optarg);
781           break;
782         case OPT__NO:
783           {
784             /* We support real --no-FOO flags now, but keep these
785                short options for convenience and backward
786                compatibility.  */
787             char *p;
788             for (p = optarg; *p; p++)
789               switch (*p)
790                 {
791                 case 'v':
792                   setoptval ("verbose", "0", opt->long_name);
793                   break;
794                 case 'H':
795                   setoptval ("addhostdir", "0", opt->long_name);
796                   break;
797                 case 'd':
798                   setoptval ("dirstruct", "0", opt->long_name);
799                   break;
800                 case 'c':
801                   setoptval ("noclobber", "1", opt->long_name);
802                   break;
803                 case 'p':
804                   setoptval ("noparent", "1", opt->long_name);
805                   break;
806                 default:
807                   printf (_("%s: illegal option -- `-n%c'\n"), exec_name, *p);
808                   print_usage ();
809                   printf ("\n");
810                   printf (_("Try `%s --help' for more options.\n"), exec_name);
811                   exit (1);
812                 }
813             break;
814           }
815         case OPT__PARENT:
816         case OPT__CLOBBER:
817           {
818             /* The wgetrc commands are named noparent and noclobber,
819                so we must revert the meaning of the cmdline options
820                before passing the value to setoptval.  */
821             bool flag = true;
822             if (optarg)
823               flag = (*optarg == '1' || c_tolower (*optarg) == 'y'
824                       || (c_tolower (optarg[0]) == 'o'
825                           && c_tolower (optarg[1]) == 'n'));
826             setoptval (opt->type == OPT__PARENT ? "noparent" : "noclobber",
827                        flag ? "0" : "1", opt->long_name);
828             break;
829           }
830         case OPT__DONT_REMOVE_LISTING:
831           setoptval ("removelisting", "0", opt->long_name);
832           break;
833         }
834
835       longindex = -1;
836     }
837
838   nurl = argc - optind;
839
840   /* All user options have now been processed, so it's now safe to do
841      interoption dependency checks. */
842
843   if (opt.reclevel == 0)
844       opt.reclevel = INFINITE_RECURSION; /* see recur.h for commentary */
845
846   if (opt.spider || opt.delete_after)
847       opt.no_dirstruct = true;
848
849   if (opt.page_requisites && !opt.recursive)
850     {
851       /* Don't set opt.recursive here because it would confuse the FTP
852          code.  Instead, call retrieve_tree below when either
853          page_requisites or recursive is requested.  */
854       opt.reclevel = 0;
855       if (!opt.no_dirstruct)
856         opt.dirstruct = 1;      /* normally handled by cmd_spec_recursive() */
857     }
858
859   if (opt.verbose == -1)
860     opt.verbose = !opt.quiet;
861
862   /* Sanity checks.  */
863   if (opt.verbose && opt.quiet)
864     {
865       printf (_("Can't be verbose and quiet at the same time.\n"));
866       print_usage ();
867       exit (1);
868     }
869   if (opt.timestamping && opt.noclobber)
870     {
871       printf (_("\
872 Can't timestamp and not clobber old files at the same time.\n"));
873       print_usage ();
874       exit (1);
875     }
876 #ifdef ENABLE_IPV6
877   if (opt.ipv4_only && opt.ipv6_only)
878     {
879       printf (_("Cannot specify both --inet4-only and --inet6-only.\n"));
880       print_usage ();
881       exit (1);
882     }
883 #endif
884   if (opt.output_document
885       && (opt.page_requisites
886           || opt.recursive
887           || opt.timestamping))
888     {
889           printf (_("Cannot specify -r, -p or -N if -O is given.\n"));
890           print_usage ();
891           exit (1);
892     }
893   if (opt.output_document
894       && opt.convert_links 
895       && nurl > 1)
896     {
897           printf (_("Cannot specify both -k and -O if multiple URLs are given.\n"));
898           print_usage ();
899           exit (1);
900     }
901
902   if (!nurl && !opt.input_filename)
903     {
904       /* No URL specified.  */
905       printf (_("%s: missing URL\n"), exec_name);
906       print_usage ();
907       printf ("\n");
908       /* #### Something nicer should be printed here -- similar to the
909          pre-1.5 `--help' page.  */
910       printf (_("Try `%s --help' for more options.\n"), exec_name);
911       exit (1);
912     }
913
914 #ifdef MSDOS
915   if (opt.wdebug)
916      dbug_init();
917   sock_init();
918 #else
919   if (opt.background)
920     fork_to_background ();
921 #endif
922
923   /* Initialize progress.  Have to do this after the options are
924      processed so we know where the log file is.  */
925   if (opt.verbose)
926     set_progress_implementation (opt.progress_type);
927
928   /* Fill in the arguments.  */
929   url = alloca_array (char *, nurl + 1);
930   for (i = 0; i < nurl; i++, optind++)
931     {
932       char *rewritten = rewrite_shorthand_url (argv[optind]);
933       if (rewritten)
934         url[i] = rewritten;
935       else
936         url[i] = xstrdup (argv[optind]);
937     }
938   url[i] = NULL;
939
940   /* Initialize logging.  */
941   log_init (opt.lfilename, append_to_log);
942
943   DEBUGP (("DEBUG output created by Wget %s on %s.\n\n", version_string,
944            OS_TYPE));
945
946   /* Open the output filename if necessary.  */
947   if (opt.output_document)
948     {
949       if (HYPHENP (opt.output_document))
950         output_stream = stdout;
951       else
952         {
953           struct_fstat st;
954           output_stream = fopen (opt.output_document,
955                                  opt.always_rest ? "ab" : "wb");
956           if (output_stream == NULL)
957             {
958               perror (opt.output_document);
959               exit (1);
960             }
961           if (fstat (fileno (output_stream), &st) == 0 && S_ISREG (st.st_mode))
962             output_stream_regular = true;
963         }
964     }
965
966 #ifdef WINDOWS
967   ws_startup ();
968 #endif
969
970 #ifdef SIGHUP
971   /* Setup the signal handler to redirect output when hangup is
972      received.  */
973   if (signal(SIGHUP, SIG_IGN) != SIG_IGN)
974     signal(SIGHUP, redirect_output_signal);
975 #endif
976   /* ...and do the same for SIGUSR1.  */
977 #ifdef SIGUSR1
978   signal (SIGUSR1, redirect_output_signal);
979 #endif
980 #ifdef SIGPIPE
981   /* Writing to a closed socket normally signals SIGPIPE, and the
982      process exits.  What we want is to ignore SIGPIPE and just check
983      for the return value of write().  */
984   signal (SIGPIPE, SIG_IGN);
985 #endif
986 #ifdef SIGWINCH
987   signal (SIGWINCH, progress_handle_sigwinch);
988 #endif
989
990   status = RETROK;              /* initialize it, just-in-case */
991   /* Retrieve the URLs from argument list.  */
992   for (t = url; *t; t++)
993     {
994       char *filename = NULL, *redirected_URL = NULL;
995       int dt;
996
997       if ((opt.recursive || opt.page_requisites)
998           && (url_scheme (*t) != SCHEME_FTP || url_uses_proxy (*t)))
999         {
1000           int old_follow_ftp = opt.follow_ftp;
1001
1002           /* Turn opt.follow_ftp on in case of recursive FTP retrieval */
1003           if (url_scheme (*t) == SCHEME_FTP) 
1004             opt.follow_ftp = 1;
1005           
1006           status = retrieve_tree (*t);
1007
1008           opt.follow_ftp = old_follow_ftp;
1009         }
1010       else
1011         status = retrieve_url (*t, &filename, &redirected_URL, NULL, &dt, opt.recursive);
1012
1013       if (opt.delete_after && file_exists_p(filename))
1014         {
1015           DEBUGP (("Removing file due to --delete-after in main():\n"));
1016           logprintf (LOG_VERBOSE, _("Removing %s.\n"), filename);
1017           if (unlink (filename))
1018             logprintf (LOG_NOTQUIET, "unlink: %s\n", strerror (errno));
1019         }
1020
1021       xfree_null (redirected_URL);
1022       xfree_null (filename);
1023     }
1024
1025   /* And then from the input file, if any.  */
1026   if (opt.input_filename)
1027     {
1028       int count;
1029       status = retrieve_from_file (opt.input_filename, opt.force_html, &count);
1030       if (!count)
1031         logprintf (LOG_NOTQUIET, _("No URLs found in %s.\n"),
1032                    opt.input_filename);
1033     }
1034
1035   /* Print broken links. */
1036   if (opt.recursive && opt.spider)
1037     {
1038       print_broken_links();
1039     }
1040   
1041   /* Print the downloaded sum.  */
1042   if ((opt.recursive || opt.page_requisites
1043        || nurl > 1
1044        || (opt.input_filename && total_downloaded_bytes != 0))
1045       &&
1046       total_downloaded_bytes != 0)
1047     {
1048       logprintf (LOG_NOTQUIET,
1049                  _("FINISHED --%s--\nDownloaded: %d files, %s in %s (%s)\n"),
1050                  datetime_str (time (NULL)),
1051                  opt.numurls,
1052                  human_readable (total_downloaded_bytes),
1053                  secs_to_human_time (total_download_time),
1054                  retr_rate (total_downloaded_bytes, total_download_time));
1055       /* Print quota warning, if exceeded.  */
1056       if (opt.quota && total_downloaded_bytes > opt.quota)
1057         logprintf (LOG_NOTQUIET,
1058                    _("Download quota of %s EXCEEDED!\n"),
1059                    human_readable (opt.quota));
1060     }
1061
1062   if (opt.cookies_output)
1063     save_cookies ();
1064
1065   if (opt.convert_links && !opt.delete_after)
1066     convert_all_links ();
1067
1068   log_close ();
1069   for (i = 0; i < nurl; i++)
1070     xfree (url[i]);
1071   cleanup ();
1072
1073 #ifdef DEBUG_MALLOC
1074   print_malloc_debug_stats ();
1075 #endif
1076   if (status == RETROK)
1077     return 0;
1078   else
1079     return 1;
1080 }
1081 #endif /* TESTING */
1082 \f
1083 #if defined(SIGHUP) || defined(SIGUSR1)
1084
1085 /* So the signal_name check doesn't blow when only one is available. */
1086 #ifndef SIGHUP
1087 # define SIGHUP -1
1088 #endif
1089 #ifndef SIGUSR1
1090 # define SIGUSR1 -1
1091 #endif
1092
1093 /* Hangup signal handler.  When wget receives SIGHUP or SIGUSR1, it
1094    will proceed operation as usual, trying to write into a log file.
1095    If that is impossible, the output will be turned off.  */
1096
1097 static void
1098 redirect_output_signal (int sig)
1099 {
1100   const char *signal_name = (sig == SIGHUP ? "SIGHUP" :
1101                              (sig == SIGUSR1 ? "SIGUSR1" :
1102                               "WTF?!"));
1103   log_request_redirect_output (signal_name);
1104   progress_schedule_redirect ();
1105   signal (sig, redirect_output_signal);
1106 }
1107 #endif
1108
1109 /*
1110  * vim: et ts=2 sw=2
1111  */