]> sjero.net Git - wget/blob - src/main.c
[svn] New option --ignore-case for case-insensitive matching.
[wget] / src / main.c
1 /* Command line parsing.
2    Copyright (C) 1996-2005 Free Software Foundation, Inc.
3
4 This file is part of GNU Wget.
5
6 GNU Wget is free software; you can redistribute it and/or modify
7 it under the terms of the GNU General Public License as published by
8 the Free Software Foundation; either version 2 of the License, or
9 (at your option) any later version.
10
11 GNU Wget is distributed in the hope that it will be useful,
12 but WITHOUT ANY WARRANTY; without even the implied warranty of
13 MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
14 GNU General Public License for more details.
15
16 You should have received a copy of the GNU General Public License
17 along with Wget; if not, write to the Free Software Foundation, Inc.,
18 51 Franklin St, Fifth Floor, Boston, MA 02110-1301 USA.
19
20 In addition, as a special exception, the Free Software Foundation
21 gives permission to link the code of its release of Wget with the
22 OpenSSL project's "OpenSSL" library (or with modified versions of it
23 that use the same license as the "OpenSSL" library), and distribute
24 the linked executables.  You must obey the GNU General Public License
25 in all respects for all of the code used other than "OpenSSL".  If you
26 modify this file, you may extend this exception to your version of the
27 file, but you are not obligated to do so.  If you do not wish to do
28 so, delete this exception statement from your version.  */
29
30 #include <config.h>
31
32 #include <stdio.h>
33 #include <stdlib.h>
34 #ifdef HAVE_UNISTD_H
35 # include <unistd.h>
36 #endif /* HAVE_UNISTD_H */
37 #include <string.h>
38 #include <signal.h>
39 #ifdef HAVE_NLS
40 # include <locale.h>
41 #endif
42 #include <assert.h>
43 #include <errno.h>
44
45 #include "wget.h"
46 #include "utils.h"
47 #include "init.h"
48 #include "retr.h"
49 #include "recur.h"
50 #include "host.h"
51 #include "url.h"
52 #include "progress.h"           /* for progress_handle_sigwinch */
53 #include "convert.h"
54 #include "http.h"               /* for save_cookies */
55
56 /* On GNU system this will include system-wide getopt.h. */
57 #include "getopt.h"
58
59 #ifndef PATH_SEPARATOR
60 # define PATH_SEPARATOR '/'
61 #endif
62
63 struct options opt;
64
65 extern char *version_string;
66
67 #if defined(SIGHUP) || defined(SIGUSR1)
68 static void redirect_output_signal (int);
69 #endif
70
71 const char *exec_name;
72 \f
73 /* Initialize I18N/L10N.  That amounts to invoking setlocale, and
74    setting up gettext's message catalog using bindtextdomain and
75    textdomain.  Does nothing if NLS is disabled or missing.  */
76
77 static void
78 i18n_initialize (void)
79 {
80   /* HAVE_NLS implies existence of functions invoked here.  */
81 #ifdef HAVE_NLS
82   /* Set the current locale.  */
83   setlocale (LC_ALL, "");
84   /* Set the text message domain.  */
85   bindtextdomain ("wget", LOCALEDIR);
86   textdomain ("wget");
87 #endif /* HAVE_NLS */
88 }
89 \f
90 /* Definition of command-line options. */
91
92 static void print_help (void);
93 static void print_version (void);
94
95 #ifdef HAVE_SSL
96 # define IF_SSL(x) x
97 #else
98 # define IF_SSL(x) NULL
99 #endif
100
101 #ifdef ENABLE_DEBUG
102 # define WHEN_DEBUG(x) x
103 #else
104 # define WHEN_DEBUG(x) NULL
105 #endif
106
107 struct cmdline_option {
108   const char *long_name;
109   char short_name;
110   enum {
111     OPT_VALUE,
112     OPT_BOOLEAN,
113     OPT_FUNCALL,
114     /* Non-standard options that have to be handled specially in
115        main().  */
116     OPT__APPEND_OUTPUT,
117     OPT__CLOBBER,
118     OPT__DONT_REMOVE_LISTING,
119     OPT__EXECUTE,
120     OPT__NO,
121     OPT__PARENT
122   } type;
123   const void *data;             /* for standard options */
124   int argtype;                  /* for non-standard options */
125 };
126
127 static struct cmdline_option option_data[] =
128   {
129     { "accept", 'A', OPT_VALUE, "accept", -1 },
130     { "append-output", 'a', OPT__APPEND_OUTPUT, NULL, required_argument },
131     { "background", 'b', OPT_BOOLEAN, "background", -1 },
132     { "backup-converted", 'K', OPT_BOOLEAN, "backupconverted", -1 },
133     { "backups", 0, OPT_BOOLEAN, "backups", -1 },
134     { "base", 'B', OPT_VALUE, "base", -1 },
135     { "bind-address", 0, OPT_VALUE, "bindaddress", -1 },
136     { IF_SSL ("ca-certificate"), 0, OPT_VALUE, "cacertificate", -1 },
137     { IF_SSL ("ca-directory"), 0, OPT_VALUE, "cadirectory", -1 },
138     { "cache", 0, OPT_BOOLEAN, "cache", -1 },
139     { IF_SSL ("certificate"), 0, OPT_VALUE, "certificate", -1 },
140     { IF_SSL ("certificate-type"), 0, OPT_VALUE, "certificatetype", -1 },
141     { IF_SSL ("check-certificate"), 0, OPT_BOOLEAN, "checkcertificate", -1 },
142     { "clobber", 0, OPT__CLOBBER, NULL, optional_argument },
143     { "connect-timeout", 0, OPT_VALUE, "connecttimeout", -1 },
144     { "continue", 'c', OPT_BOOLEAN, "continue", -1 },
145     { "convert-links", 'k', OPT_BOOLEAN, "convertlinks", -1 },
146     { "cookies", 0, OPT_BOOLEAN, "cookies", -1 },
147     { "cut-dirs", 0, OPT_VALUE, "cutdirs", -1 },
148     { WHEN_DEBUG ("debug"), 'd', OPT_BOOLEAN, "debug", -1 },
149     { "delete-after", 0, OPT_BOOLEAN, "deleteafter", -1 },
150     { "directories", 0, OPT_BOOLEAN, "dirstruct", -1 },
151     { "directory-prefix", 'P', OPT_VALUE, "dirprefix", -1 },
152     { "dns-cache", 0, OPT_BOOLEAN, "dnscache", -1 },
153     { "dns-timeout", 0, OPT_VALUE, "dnstimeout", -1 },
154     { "domains", 'D', OPT_VALUE, "domains", -1 },
155     { "dont-remove-listing", 0, OPT__DONT_REMOVE_LISTING, NULL, no_argument },
156     { "dot-style", 0, OPT_VALUE, "dotstyle", -1 },
157     { "egd-file", 0, OPT_VALUE, "egdfile", -1 },
158     { "exclude-directories", 'X', OPT_VALUE, "excludedirectories", -1 },
159     { "exclude-domains", 0, OPT_VALUE, "excludedomains", -1 },
160     { "execute", 'e', OPT__EXECUTE, NULL, required_argument },
161     { "follow-ftp", 0, OPT_BOOLEAN, "followftp", -1 },
162     { "follow-tags", 0, OPT_VALUE, "followtags", -1 },
163     { "force-directories", 'x', OPT_BOOLEAN, "dirstruct", -1 },
164     { "force-html", 'F', OPT_BOOLEAN, "forcehtml", -1 },
165     { "ftp-password", 0, OPT_VALUE, "ftppassword", -1 },
166     { "ftp-user", 0, OPT_VALUE, "ftpuser", -1 },
167     { "glob", 0, OPT_BOOLEAN, "glob", -1 },
168     { "header", 0, OPT_VALUE, "header", -1 },
169     { "help", 'h', OPT_FUNCALL, (void *)print_help, no_argument },
170     { "host-directories", 0, OPT_BOOLEAN, "addhostdir", -1 },
171     { "html-extension", 'E', OPT_BOOLEAN, "htmlextension", -1 },
172     { "htmlify", 0, OPT_BOOLEAN, "htmlify", -1 },
173     { "http-keep-alive", 0, OPT_BOOLEAN, "httpkeepalive", -1 },
174     { "http-passwd", 0, OPT_VALUE, "httppassword", -1 }, /* deprecated */
175     { "http-password", 0, OPT_VALUE, "httppassword", -1 },
176     { "http-user", 0, OPT_VALUE, "httpuser", -1 },
177     { "ignore-case", 0, OPT_BOOLEAN, "ignorecase", -1 },
178     { "ignore-length", 0, OPT_BOOLEAN, "ignorelength", -1 },
179     { "ignore-tags", 0, OPT_VALUE, "ignoretags", -1 },
180     { "include-directories", 'I', OPT_VALUE, "includedirectories", -1 },
181 #ifdef ENABLE_IPV6
182     { "inet4-only", '4', OPT_BOOLEAN, "inet4only", -1 },
183     { "inet6-only", '6', OPT_BOOLEAN, "inet6only", -1 },
184 #endif
185     { "input-file", 'i', OPT_VALUE, "input", -1 },
186     { "keep-session-cookies", 0, OPT_BOOLEAN, "keepsessioncookies", -1 },
187     { "level", 'l', OPT_VALUE, "reclevel", -1 },
188     { "limit-rate", 0, OPT_VALUE, "limitrate", -1 },
189     { "load-cookies", 0, OPT_VALUE, "loadcookies", -1 },
190     { "mirror", 'm', OPT_BOOLEAN, "mirror", -1 },
191     { "no", 'n', OPT__NO, NULL, required_argument },
192     { "no-clobber", 0, OPT_BOOLEAN, "noclobber", -1 },
193     { "no-parent", 0, OPT_BOOLEAN, "noparent", -1 },
194     { "output-document", 'O', OPT_VALUE, "outputdocument", -1 },
195     { "output-file", 'o', OPT_VALUE, "logfile", -1 },
196     { "page-requisites", 'p', OPT_BOOLEAN, "pagerequisites", -1 },
197     { "parent", 0, OPT__PARENT, NULL, optional_argument },
198     { "passive-ftp", 0, OPT_BOOLEAN, "passiveftp", -1 },
199     { "password", 0, OPT_VALUE, "password", -1 },
200     { "post-data", 0, OPT_VALUE, "postdata", -1 },
201     { "post-file", 0, OPT_VALUE, "postfile", -1 },
202     { "prefer-family", 0, OPT_VALUE, "preferfamily", -1 },
203     { "preserve-permissions", 0, OPT_BOOLEAN, "preservepermissions", -1 },
204     { IF_SSL ("private-key"), 0, OPT_VALUE, "privatekey", -1 },
205     { IF_SSL ("private-key-type"), 0, OPT_VALUE, "privatekeytype", -1 },
206     { "progress", 0, OPT_VALUE, "progress", -1 },
207     { "protocol-directories", 0, OPT_BOOLEAN, "protocoldirectories", -1 },
208     { "proxy", 0, OPT_BOOLEAN, "useproxy", -1 },
209     { "proxy__compat", 'Y', OPT_VALUE, "useproxy", -1 }, /* back-compatible */
210     { "proxy-passwd", 0, OPT_VALUE, "proxypassword", -1 }, /* deprecated */
211     { "proxy-password", 0, OPT_VALUE, "proxypassword", -1 },
212     { "proxy-user", 0, OPT_VALUE, "proxyuser", -1 },
213     { "quiet", 'q', OPT_BOOLEAN, "quiet", -1 },
214     { "quota", 'Q', OPT_VALUE, "quota", -1 },
215     { "random-file", 0, OPT_VALUE, "randomfile", -1 },
216     { "random-wait", 0, OPT_BOOLEAN, "randomwait", -1 },
217     { "read-timeout", 0, OPT_VALUE, "readtimeout", -1 },
218     { "recursive", 'r', OPT_BOOLEAN, "recursive", -1 },
219     { "referer", 0, OPT_VALUE, "referer", -1 },
220     { "reject", 'R', OPT_VALUE, "reject", -1 },
221     { "relative", 'L', OPT_BOOLEAN, "relativeonly", -1 },
222     { "remove-listing", 0, OPT_BOOLEAN, "removelisting", -1 },
223     { "restrict-file-names", 0, OPT_BOOLEAN, "restrictfilenames", -1 },
224     { "retr-symlinks", 0, OPT_BOOLEAN, "retrsymlinks", -1 },
225     { "retry-connrefused", 0, OPT_BOOLEAN, "retryconnrefused", -1 },
226     { "save-cookies", 0, OPT_VALUE, "savecookies", -1 },
227     { "save-headers", 0, OPT_BOOLEAN, "saveheaders", -1 },
228     { IF_SSL ("secure-protocol"), 0, OPT_VALUE, "secureprotocol", -1 },
229     { "server-response", 'S', OPT_BOOLEAN, "serverresponse", -1 },
230     { "span-hosts", 'H', OPT_BOOLEAN, "spanhosts", -1 },
231     { "spider", 0, OPT_BOOLEAN, "spider", -1 },
232     { "strict-comments", 0, OPT_BOOLEAN, "strictcomments", -1 },
233     { "timeout", 'T', OPT_VALUE, "timeout", -1 },
234     { "timestamping", 'N', OPT_BOOLEAN, "timestamping", -1 },
235     { "tries", 't', OPT_VALUE, "tries", -1 },
236     { "user", 0, OPT_VALUE, "user", -1 },
237     { "user-agent", 'U', OPT_VALUE, "useragent", -1 },
238     { "verbose", 'v', OPT_BOOLEAN, "verbose", -1 },
239     { "verbose", 0, OPT_BOOLEAN, "verbose", -1 },
240     { "version", 'V', OPT_FUNCALL, (void *) print_version, no_argument },
241     { "wait", 'w', OPT_VALUE, "wait", -1 },
242     { "waitretry", 0, OPT_VALUE, "waitretry", -1 },
243   };
244
245 #undef WHEN_DEBUG
246 #undef IF_SSL
247
248 /* Return a string that contains S with "no-" prepended.  The string
249    is NUL-terminated and allocated off static storage at Wget
250    startup.  */
251
252 static char *
253 no_prefix (const char *s)
254 {
255   static char buffer[1024];
256   static char *p = buffer;
257
258   char *cp = p;
259   int size = 3 + strlen (s) + 1;  /* "no-STRING\0" */
260   if (p + size >= buffer + sizeof (buffer))
261     abort ();
262
263   cp[0] = 'n', cp[1] = 'o', cp[2] = '-';
264   strcpy (cp + 3, s);
265   p += size;
266   return cp;
267 }
268
269 /* The arguments that that main passes to getopt_long. */
270 static struct option long_options[2 * countof (option_data) + 1];
271 static char short_options[128];
272
273 /* Mapping between short option chars and option_data indices. */
274 static unsigned char optmap[96];
275
276 /* Marker for `--no-FOO' values in long_options.  */
277 #define BOOLEAN_NEG_MARKER 1024
278
279 /* Initialize the long_options array used by getopt_long from the data
280    in option_data.  */
281
282 static void
283 init_switches (void)
284 {
285   char *p = short_options;
286   int i, o = 0;
287   for (i = 0; i < countof (option_data); i++)
288     {
289       struct cmdline_option *opt = &option_data[i];
290       struct option *longopt;
291
292       if (!opt->long_name)
293         /* The option is disabled. */
294         continue;
295
296       longopt = &long_options[o++];
297       longopt->name = opt->long_name;
298       longopt->val = i;
299       if (opt->short_name)
300         {
301           *p++ = opt->short_name;
302           optmap[opt->short_name - 32] = longopt - long_options;
303         }
304       switch (opt->type)
305         {
306         case OPT_VALUE:
307           longopt->has_arg = required_argument;
308           if (opt->short_name)
309             *p++ = ':';
310           break;
311         case OPT_BOOLEAN:
312           /* Specify an optional argument for long options, so that
313              --option=off works the same as --no-option, for
314              compatibility with pre-1.10 Wget.  However, don't specify
315              optional arguments short-option booleans because they
316              prevent combining of short options.  */
317           longopt->has_arg = optional_argument;
318           /* For Boolean options, add the "--no-FOO" variant, which is
319              identical to "--foo", except it has opposite meaning and
320              it doesn't allow an argument.  */
321           longopt = &long_options[o++];
322           longopt->name = no_prefix (opt->long_name);
323           longopt->has_arg = no_argument;
324           /* Mask the value so we'll be able to recognize that we're
325              dealing with the false value.  */
326           longopt->val = i | BOOLEAN_NEG_MARKER;
327           break;
328         default:
329           assert (opt->argtype != -1);
330           longopt->has_arg = opt->argtype;
331           if (opt->short_name)
332             {
333               if (longopt->has_arg == required_argument)
334                 *p++ = ':';
335               /* Don't handle optional_argument */
336             }
337         }
338     }
339   /* Terminate short_options. */
340   *p = '\0';
341   /* No need for xzero(long_options[o]) because its storage is static
342      and it will be zeroed by default.  */
343   assert (o <= countof (long_options));
344 }
345
346 /* Print the usage message.  */
347 static void
348 print_usage (void)
349 {
350   printf (_("Usage: %s [OPTION]... [URL]...\n"), exec_name);
351 }
352
353 /* Print the help message, describing all the available options.  If
354    you add an option, be sure to update this list.  */
355 static void
356 print_help (void)
357 {
358   /* We split the help text this way to ease translation of individual
359      entries.  */
360   static const char *help[] = {
361     "\n",
362     N_("\
363 Mandatory arguments to long options are mandatory for short options too.\n\n"),
364     N_("\
365 Startup:\n"),
366     N_("\
367   -V,  --version           display the version of Wget and exit.\n"),
368     N_("\
369   -h,  --help              print this help.\n"),
370     N_("\
371   -b,  --background        go to background after startup.\n"),
372     N_("\
373   -e,  --execute=COMMAND   execute a `.wgetrc'-style command.\n"),
374     "\n",
375
376     N_("\
377 Logging and input file:\n"),
378     N_("\
379   -o,  --output-file=FILE    log messages to FILE.\n"),
380     N_("\
381   -a,  --append-output=FILE  append messages to FILE.\n"),
382 #ifdef ENABLE_DEBUG
383     N_("\
384   -d,  --debug               print lots of debugging information.\n"),
385 #endif
386     N_("\
387   -q,  --quiet               quiet (no output).\n"),
388     N_("\
389   -v,  --verbose             be verbose (this is the default).\n"),
390     N_("\
391   -nv, --no-verbose          turn off verboseness, without being quiet.\n"),
392     N_("\
393   -i,  --input-file=FILE     download URLs found in FILE.\n"),
394     N_("\
395   -F,  --force-html          treat input file as HTML.\n"),
396     N_("\
397   -B,  --base=URL            prepends URL to relative links in -F -i file.\n"),
398     "\n",
399
400     N_("\
401 Download:\n"),
402     N_("\
403   -t,  --tries=NUMBER            set number of retries to NUMBER (0 unlimits).\n"),
404     N_("\
405        --retry-connrefused       retry even if connection is refused.\n"),
406     N_("\
407   -O,  --output-document=FILE    write documents to FILE.\n"),
408     N_("\
409   -nc, --no-clobber              skip downloads that would download to\n\
410                                  existing files.\n"),
411     N_("\
412   -c,  --continue                resume getting a partially-downloaded file.\n"),
413     N_("\
414        --progress=TYPE           select progress gauge type.\n"),
415     N_("\
416   -N,  --timestamping            don't re-retrieve files unless newer than\n\
417                                  local.\n"),
418     N_("\
419   -S,  --server-response         print server response.\n"),
420     N_("\
421        --spider                  don't download anything.\n"),
422     N_("\
423   -T,  --timeout=SECONDS         set all timeout values to SECONDS.\n"),
424     N_("\
425        --dns-timeout=SECS        set the DNS lookup timeout to SECS.\n"),
426     N_("\
427        --connect-timeout=SECS    set the connect timeout to SECS.\n"),
428     N_("\
429        --read-timeout=SECS       set the read timeout to SECS.\n"),
430     N_("\
431   -w,  --wait=SECONDS            wait SECONDS between retrievals.\n"),
432     N_("\
433        --waitretry=SECONDS       wait 1..SECONDS between retries of a retrieval.\n"),
434     N_("\
435        --random-wait             wait from 0...2*WAIT secs between retrievals.\n"),
436     N_("\
437   -Y,  --proxy                   explicitly turn on proxy.\n"),
438     N_("\
439        --no-proxy                explicitly turn off proxy.\n"),
440     N_("\
441   -Q,  --quota=NUMBER            set retrieval quota to NUMBER.\n"),
442     N_("\
443        --bind-address=ADDRESS    bind to ADDRESS (hostname or IP) on local host.\n"),
444     N_("\
445        --limit-rate=RATE         limit download rate to RATE.\n"),
446     N_("\
447        --no-dns-cache            disable caching DNS lookups.\n"),
448     N_("\
449        --restrict-file-names=OS  restrict chars in file names to ones OS allows.\n"),
450     N_("\
451        --ignore-case             ignore case when matching files/directories.\n"),
452 #ifdef ENABLE_IPV6
453     N_("\
454   -4,  --inet4-only              connect only to IPv4 addresses.\n"),
455     N_("\
456   -6,  --inet6-only              connect only to IPv6 addresses.\n"),
457     N_("\
458        --prefer-family=FAMILY    connect first to addresses of specified family,\n\
459                                  one of IPv6, IPv4, or none.\n"),
460 #endif
461     N_("\
462        --user=USER               set both ftp and http user to USER.\n"),
463     N_("\
464        --password=PASS           set both ftp and http password to PASS.\n"),
465     "\n",
466
467     N_("\
468 Directories:\n"),
469     N_("\
470   -nd, --no-directories           don't create directories.\n"),
471     N_("\
472   -x,  --force-directories        force creation of directories.\n"),
473     N_("\
474   -nH, --no-host-directories      don't create host directories.\n"),
475     N_("\
476        --protocol-directories     use protocol name in directories.\n"),
477     N_("\
478   -P,  --directory-prefix=PREFIX  save files to PREFIX/...\n"),
479     N_("\
480        --cut-dirs=NUMBER          ignore NUMBER remote directory components.\n"),
481     "\n",
482
483     N_("\
484 HTTP options:\n"),
485     N_("\
486        --http-user=USER        set http user to USER.\n"),
487     N_("\
488        --http-password=PASS    set http password to PASS.\n"),
489     N_("\
490        --no-cache              disallow server-cached data.\n"),
491     N_("\
492   -E,  --html-extension        save HTML documents with `.html' extension.\n"),
493     N_("\
494        --ignore-length         ignore `Content-Length' header field.\n"),
495     N_("\
496        --header=STRING         insert STRING among the headers.\n"),
497     N_("\
498        --proxy-user=USER       set USER as proxy username.\n"),
499     N_("\
500        --proxy-password=PASS   set PASS as proxy password.\n"),
501     N_("\
502        --referer=URL           include `Referer: URL' header in HTTP request.\n"),
503     N_("\
504        --save-headers          save the HTTP headers to file.\n"),
505     N_("\
506   -U,  --user-agent=AGENT      identify as AGENT instead of Wget/VERSION.\n"),
507     N_("\
508        --no-http-keep-alive    disable HTTP keep-alive (persistent connections).\n"),
509     N_("\
510        --no-cookies            don't use cookies.\n"),
511     N_("\
512        --load-cookies=FILE     load cookies from FILE before session.\n"),
513     N_("\
514        --save-cookies=FILE     save cookies to FILE after session.\n"),
515     N_("\
516        --keep-session-cookies  load and save session (non-permanent) cookies.\n"),
517     N_("\
518        --post-data=STRING      use the POST method; send STRING as the data.\n"),
519     N_("\
520        --post-file=FILE        use the POST method; send contents of FILE.\n"),
521     "\n",
522
523 #ifdef HAVE_SSL
524     N_("\
525 HTTPS (SSL/TLS) options:\n"),
526     N_("\
527        --secure-protocol=PR     choose secure protocol, one of auto, SSLv2,\n\
528                                 SSLv3, and TLSv1.\n"),
529     N_("\
530        --no-check-certificate   don't validate the server's certificate.\n"),
531     N_("\
532        --certificate=FILE       client certificate file.\n"),
533     N_("\
534        --certificate-type=TYPE  client certificate type, PEM or DER.\n"),
535     N_("\
536        --private-key=FILE       private key file.\n"),
537     N_("\
538        --private-key-type=TYPE  private key type, PEM or DER.\n"),
539     N_("\
540        --ca-certificate=FILE    file with the bundle of CA's.\n"),
541     N_("\
542        --ca-directory=DIR       directory where hash list of CA's is stored.\n"),
543     N_("\
544        --random-file=FILE       file with random data for seeding the SSL PRNG.\n"),
545     N_("\
546        --egd-file=FILE          file naming the EGD socket with random data.\n"),
547     "\n",
548 #endif /* HAVE_SSL */
549
550     N_("\
551 FTP options:\n"),
552     N_("\
553        --ftp-user=USER         set ftp user to USER.\n"),
554     N_("\
555        --ftp-password=PASS     set ftp password to PASS.\n"),
556     N_("\
557        --no-remove-listing     don't remove `.listing' files.\n"),
558     N_("\
559        --no-glob               turn off FTP file name globbing.\n"),
560     N_("\
561        --no-passive-ftp        disable the \"passive\" transfer mode.\n"),
562     N_("\
563        --retr-symlinks         when recursing, get linked-to files (not dir).\n"),
564     N_("\
565        --preserve-permissions  preserve remote file permissions.\n"),
566     "\n",
567
568     N_("\
569 Recursive download:\n"),
570     N_("\
571   -r,  --recursive          specify recursive download.\n"),
572     N_("\
573   -l,  --level=NUMBER       maximum recursion depth (inf or 0 for infinite).\n"),
574     N_("\
575        --delete-after       delete files locally after downloading them.\n"),
576     N_("\
577   -k,  --convert-links      make links in downloaded HTML point to local files.\n"),
578     N_("\
579   -K,  --backup-converted   before converting file X, back up as X.orig.\n"),
580     N_("\
581   -m,  --mirror             shortcut for -N -r -l inf --no-remove-listing.\n"),
582     N_("\
583   -p,  --page-requisites    get all images, etc. needed to display HTML page.\n"),
584     N_("\
585        --strict-comments    turn on strict (SGML) handling of HTML comments.\n"),
586     "\n",
587
588     N_("\
589 Recursive accept/reject:\n"),
590     N_("\
591   -A,  --accept=LIST               comma-separated list of accepted extensions.\n"),
592     N_("\
593   -R,  --reject=LIST               comma-separated list of rejected extensions.\n"),
594     N_("\
595   -D,  --domains=LIST              comma-separated list of accepted domains.\n"),
596     N_("\
597        --exclude-domains=LIST      comma-separated list of rejected domains.\n"),
598     N_("\
599        --follow-ftp                follow FTP links from HTML documents.\n"),
600     N_("\
601        --follow-tags=LIST          comma-separated list of followed HTML tags.\n"),
602     N_("\
603        --ignore-tags=LIST          comma-separated list of ignored HTML tags.\n"),
604     N_("\
605   -H,  --span-hosts                go to foreign hosts when recursive.\n"),
606     N_("\
607   -L,  --relative                  follow relative links only.\n"),
608     N_("\
609   -I,  --include-directories=LIST  list of allowed directories.\n"),
610     N_("\
611   -X,  --exclude-directories=LIST  list of excluded directories.\n"),
612     N_("\
613   -np, --no-parent                 don't ascend to the parent directory.\n"),
614     "\n",
615
616     N_("Mail bug reports and suggestions to <bug-wget@gnu.org>.\n")
617   };
618
619   int i;
620
621   printf (_("GNU Wget %s, a non-interactive network retriever.\n"),
622           version_string);
623   print_usage ();
624
625   for (i = 0; i < countof (help); i++)
626     fputs (_(help[i]), stdout);
627
628   exit (0);
629 }
630
631 /* Return a human-readable printed representation of INTERVAL,
632    measured in seconds.  */
633
634 static char *
635 secs_to_human_time (double interval)
636 {
637   static char buf[32];
638   int secs = (int) (interval + 0.5);
639   int hours, mins, days;
640
641   days = secs / 86400, secs %= 86400;
642   hours = secs / 3600, secs %= 3600;
643   mins = secs / 60, secs %= 60;
644
645   if (days)
646     sprintf (buf, "%dd %dh %dm %ds", days, hours, mins, secs);
647   else if (hours)
648     sprintf (buf, "%dh %dm %ds", hours, mins, secs);
649   else if (mins)
650     sprintf (buf, "%dm %ds", mins, secs);
651   else
652     sprintf (buf, "%ss", print_decimal (interval));
653
654   return buf;
655 }
656
657 static void
658 print_version (void)
659 {
660   printf ("GNU Wget %s\n\n", version_string);
661   fputs (_("\
662 Copyright (C) 2005 Free Software Foundation, Inc.\n"), stdout);
663   fputs (_("\
664 This program is distributed in the hope that it will be useful,\n\
665 but WITHOUT ANY WARRANTY; without even the implied warranty of\n\
666 MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the\n\
667 GNU General Public License for more details.\n"), stdout);
668   fputs (_("\nOriginally written by Hrvoje Niksic <hniksic@xemacs.org>.\n"),
669          stdout);
670   exit (0);
671 }
672 \f
673 int
674 main (int argc, char *const *argv)
675 {
676   char **url, **t;
677   int i, ret, longindex;
678   int nurl, status;
679   bool append_to_log = false;
680
681   i18n_initialize ();
682
683   /* Construct the name of the executable, without the directory part.  */
684   exec_name = strrchr (argv[0], PATH_SEPARATOR);
685   if (!exec_name)
686     exec_name = argv[0];
687   else
688     ++exec_name;
689
690 #ifdef WINDOWS
691   /* Drop extension (typically .EXE) from executable filename. */
692   windows_main (&argc, (char **) argv, (char **) &exec_name);
693 #endif
694
695   /* Set option defaults; read the system wgetrc and ~/.wgetrc.  */
696   initialize ();
697
698   init_switches ();
699   longindex = -1;
700   while ((ret = getopt_long (argc, argv,
701                              short_options, long_options, &longindex)) != -1)
702     {
703       int val;
704       struct cmdline_option *opt;
705
706       /* If LONGINDEX is unchanged, it means RET is referring a short
707          option.  */
708       if (longindex == -1)
709         {
710           if (ret == '?')
711             {
712               print_usage ();
713               printf ("\n");
714               printf (_("Try `%s --help' for more options.\n"), exec_name);
715               exit (2);
716             }
717           /* Find the short option character in the mapping.  */
718           longindex = optmap[ret - 32];
719         }
720       val = long_options[longindex].val;
721
722       /* Use the retrieved value to locate the option in the
723          option_data array, and to see if we're dealing with the
724          negated "--no-FOO" variant of the boolean option "--foo".  */
725       opt = &option_data[val & ~BOOLEAN_NEG_MARKER];
726       switch (opt->type)
727         {
728         case OPT_VALUE:
729           setoptval (opt->data, optarg, opt->long_name);
730           break;
731         case OPT_BOOLEAN:
732           if (optarg)
733             /* The user has specified a value -- use it. */
734             setoptval (opt->data, optarg, opt->long_name);
735           else
736             {
737               /* NEG is true for `--no-FOO' style boolean options. */
738               bool neg = !!(val & BOOLEAN_NEG_MARKER);
739               setoptval (opt->data, neg ? "0" : "1", opt->long_name);
740             }
741           break;
742         case OPT_FUNCALL:
743           {
744             void (*func) (void) = (void (*) (void)) opt->data;
745             func ();
746           }
747           break;
748         case OPT__APPEND_OUTPUT:
749           setoptval ("logfile", optarg, opt->long_name);
750           append_to_log = true;
751           break;
752         case OPT__EXECUTE:
753           run_command (optarg);
754           break;
755         case OPT__NO:
756           {
757             /* We support real --no-FOO flags now, but keep these
758                short options for convenience and backward
759                compatibility.  */
760             char *p;
761             for (p = optarg; *p; p++)
762               switch (*p)
763                 {
764                 case 'v':
765                   setoptval ("verbose", "0", opt->long_name);
766                   break;
767                 case 'H':
768                   setoptval ("addhostdir", "0", opt->long_name);
769                   break;
770                 case 'd':
771                   setoptval ("dirstruct", "0", opt->long_name);
772                   break;
773                 case 'c':
774                   setoptval ("noclobber", "1", opt->long_name);
775                   break;
776                 case 'p':
777                   setoptval ("noparent", "1", opt->long_name);
778                   break;
779                 default:
780                   printf (_("%s: illegal option -- `-n%c'\n"), exec_name, *p);
781                   print_usage ();
782                   printf ("\n");
783                   printf (_("Try `%s --help' for more options.\n"), exec_name);
784                   exit (1);
785                 }
786             break;
787           }
788         case OPT__PARENT:
789         case OPT__CLOBBER:
790           {
791             /* The wgetrc commands are named noparent and noclobber,
792                so we must revert the meaning of the cmdline options
793                before passing the value to setoptval.  */
794             bool flag = true;
795             if (optarg)
796               flag = (*optarg == '1' || TOLOWER (*optarg) == 'y'
797                       || (TOLOWER (optarg[0]) == 'o'
798                           && TOLOWER (optarg[1]) == 'n'));
799             setoptval (opt->type == OPT__PARENT ? "noparent" : "noclobber",
800                        flag ? "0" : "1", opt->long_name);
801             break;
802           }
803         case OPT__DONT_REMOVE_LISTING:
804           setoptval ("removelisting", "0", opt->long_name);
805           break;
806         }
807
808       longindex = -1;
809     }
810
811   /* All user options have now been processed, so it's now safe to do
812      interoption dependency checks. */
813
814   if (opt.reclevel == 0)
815     opt.reclevel = INFINITE_RECURSION; /* see recur.h for commentary on this */
816
817   if (opt.page_requisites && !opt.recursive)
818     {
819       /* Don't set opt.recursive here because it would confuse the FTP
820          code.  Instead, call retrieve_tree below when either
821          page_requisites or recursive is requested.  */
822       opt.reclevel = 0;
823       if (!opt.no_dirstruct)
824         opt.dirstruct = 1;      /* normally handled by cmd_spec_recursive() */
825     }
826
827   if (opt.verbose == -1)
828     opt.verbose = !opt.quiet;
829
830   /* Sanity checks.  */
831   if (opt.verbose && opt.quiet)
832     {
833       printf (_("Can't be verbose and quiet at the same time.\n"));
834       print_usage ();
835       exit (1);
836     }
837   if (opt.timestamping && opt.noclobber)
838     {
839       printf (_("\
840 Can't timestamp and not clobber old files at the same time.\n"));
841       print_usage ();
842       exit (1);
843     }
844 #ifdef ENABLE_IPV6
845   if (opt.ipv4_only && opt.ipv6_only)
846     {
847       printf (_("Cannot specify both --inet4-only and --inet6-only.\n"));
848       print_usage ();
849       exit (1);
850     }
851 #endif
852
853   nurl = argc - optind;
854   if (!nurl && !opt.input_filename)
855     {
856       /* No URL specified.  */
857       printf (_("%s: missing URL\n"), exec_name);
858       print_usage ();
859       printf ("\n");
860       /* #### Something nicer should be printed here -- similar to the
861          pre-1.5 `--help' page.  */
862       printf (_("Try `%s --help' for more options.\n"), exec_name);
863       exit (1);
864     }
865
866   if (opt.background)
867     fork_to_background ();
868
869   /* Initialize progress.  Have to do this after the options are
870      processed so we know where the log file is.  */
871   if (opt.verbose)
872     set_progress_implementation (opt.progress_type);
873
874   /* Fill in the arguments.  */
875   url = alloca_array (char *, nurl + 1);
876   for (i = 0; i < nurl; i++, optind++)
877     {
878       char *rewritten = rewrite_shorthand_url (argv[optind]);
879       if (rewritten)
880         url[i] = rewritten;
881       else
882         url[i] = xstrdup (argv[optind]);
883     }
884   url[i] = NULL;
885
886   /* Initialize logging.  */
887   log_init (opt.lfilename, append_to_log);
888
889   DEBUGP (("DEBUG output created by Wget %s on %s.\n\n", version_string,
890            OS_TYPE));
891
892   /* Open the output filename if necessary.  */
893   if (opt.output_document)
894     {
895       if (HYPHENP (opt.output_document))
896         output_stream = stdout;
897       else
898         {
899           struct_fstat st;
900           output_stream = fopen (opt.output_document,
901                                  opt.always_rest ? "ab" : "wb");
902           if (output_stream == NULL)
903             {
904               perror (opt.output_document);
905               exit (1);
906             }
907           if (fstat (fileno (output_stream), &st) == 0 && S_ISREG (st.st_mode))
908             output_stream_regular = true;
909         }
910     }
911
912 #ifdef WINDOWS
913   ws_startup ();
914 #endif
915
916 #ifdef SIGHUP
917   /* Setup the signal handler to redirect output when hangup is
918      received.  */
919   if (signal(SIGHUP, SIG_IGN) != SIG_IGN)
920     signal(SIGHUP, redirect_output_signal);
921 #endif
922   /* ...and do the same for SIGUSR1.  */
923 #ifdef SIGUSR1
924   signal (SIGUSR1, redirect_output_signal);
925 #endif
926 #ifdef SIGPIPE
927   /* Writing to a closed socket normally signals SIGPIPE, and the
928      process exits.  What we want is to ignore SIGPIPE and just check
929      for the return value of write().  */
930   signal (SIGPIPE, SIG_IGN);
931 #endif
932 #ifdef SIGWINCH
933   signal (SIGWINCH, progress_handle_sigwinch);
934 #endif
935
936   status = RETROK;              /* initialize it, just-in-case */
937   /* Retrieve the URLs from argument list.  */
938   for (t = url; *t; t++)
939     {
940       char *filename = NULL, *redirected_URL = NULL;
941       int dt;
942
943       if ((opt.recursive || opt.page_requisites)
944           && url_scheme (*t) != SCHEME_FTP)
945         status = retrieve_tree (*t);
946       else
947         status = retrieve_url (*t, &filename, &redirected_URL, NULL, &dt);
948
949       if (opt.delete_after && file_exists_p(filename))
950         {
951           DEBUGP (("Removing file due to --delete-after in main():\n"));
952           logprintf (LOG_VERBOSE, _("Removing %s.\n"), filename);
953           if (unlink (filename))
954             logprintf (LOG_NOTQUIET, "unlink: %s\n", strerror (errno));
955         }
956
957       xfree_null (redirected_URL);
958       xfree_null (filename);
959     }
960
961   /* And then from the input file, if any.  */
962   if (opt.input_filename)
963     {
964       int count;
965       status = retrieve_from_file (opt.input_filename, opt.force_html, &count);
966       if (!count)
967         logprintf (LOG_NOTQUIET, _("No URLs found in %s.\n"),
968                    opt.input_filename);
969     }
970   /* Print the downloaded sum.  */
971   if (opt.recursive || opt.page_requisites
972       || nurl > 1
973       || (opt.input_filename && total_downloaded_bytes != 0))
974     {
975       logprintf (LOG_NOTQUIET,
976                  _("FINISHED --%s--\nDownloaded: %d files, %s in %s (%s)\n"),
977                  time_str (NULL),
978                  opt.numurls,
979                  human_readable (total_downloaded_bytes),
980                  secs_to_human_time (total_download_time),
981                  retr_rate (total_downloaded_bytes, total_download_time));
982       /* Print quota warning, if exceeded.  */
983       if (opt.quota && total_downloaded_bytes > opt.quota)
984         logprintf (LOG_NOTQUIET,
985                    _("Download quota of %s EXCEEDED!\n"),
986                    human_readable (opt.quota));
987     }
988
989   if (opt.cookies_output)
990     save_cookies ();
991
992   if (opt.convert_links && !opt.delete_after)
993     convert_all_links ();
994
995   log_close ();
996   for (i = 0; i < nurl; i++)
997     xfree (url[i]);
998   cleanup ();
999
1000 #ifdef DEBUG_MALLOC
1001   print_malloc_debug_stats ();
1002 #endif
1003   if (status == RETROK)
1004     return 0;
1005   else
1006     return 1;
1007 }
1008 \f
1009 #if defined(SIGHUP) || defined(SIGUSR1)
1010
1011 /* So the signal_name check doesn't blow when only one is available. */
1012 #ifndef SIGHUP
1013 # define SIGHUP -1
1014 #endif
1015 #ifndef SIGUSR1
1016 # define SIGUSR1 -1
1017 #endif
1018
1019 /* Hangup signal handler.  When wget receives SIGHUP or SIGUSR1, it
1020    will proceed operation as usual, trying to write into a log file.
1021    If that is impossible, the output will be turned off.  */
1022
1023 static void
1024 redirect_output_signal (int sig)
1025 {
1026   const char *signal_name = (sig == SIGHUP ? "SIGHUP" :
1027                              (sig == SIGUSR1 ? "SIGUSR1" :
1028                               "WTF?!"));
1029   log_request_redirect_output (signal_name);
1030   progress_schedule_redirect ();
1031   signal (sig, redirect_output_signal);
1032 }
1033 #endif