]> sjero.net Git - wget/blob - src/main.c
added option --https-only
[wget] / src / main.c
1 /* Command line parsing.
2    Copyright (C) 1996, 1997, 1998, 1999, 2000, 2001, 2002, 2003, 2004,
3    2005, 2006, 2007, 2008, 2009, 2010, 2011, 2012 Free Software Foundation,
4    Inc.
5
6 This file is part of GNU Wget.
7
8 GNU Wget is free software; you can redistribute it and/or modify
9 it under the terms of the GNU General Public License as published by
10 the Free Software Foundation; either version 3 of the License, or
11 (at your option) any later version.
12
13 GNU Wget is distributed in the hope that it will be useful,
14 but WITHOUT ANY WARRANTY; without even the implied warranty of
15 MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
16 GNU General Public License for more details.
17
18 You should have received a copy of the GNU General Public License
19 along with Wget.  If not, see <http://www.gnu.org/licenses/>.
20
21 Additional permission under GNU GPL version 3 section 7
22
23 If you modify this program, or any covered work, by linking or
24 combining it with the OpenSSL project's OpenSSL library (or a
25 modified version of that library), containing parts covered by the
26 terms of the OpenSSL or SSLeay licenses, the Free Software Foundation
27 grants you additional permission to convey the resulting work.
28 Corresponding Source for a non-source form of such a combination
29 shall include the source code for the parts of OpenSSL used as well
30 as that of the covered work.  */
31
32 #include "wget.h"
33
34 #include <stdio.h>
35 #include <stdlib.h>
36 #include <unistd.h>
37 #include <string.h>
38 #include <signal.h>
39 #ifdef ENABLE_NLS
40 # include <locale.h>
41 #endif
42 #include <assert.h>
43 #include <errno.h>
44 #include <time.h>
45
46 #include "exits.h"
47 #include "utils.h"
48 #include "init.h"
49 #include "retr.h"
50 #include "recur.h"
51 #include "host.h"
52 #include "url.h"
53 #include "progress.h"           /* for progress_handle_sigwinch */
54 #include "convert.h"
55 #include "spider.h"
56 #include "http.h"               /* for save_cookies */
57 #include "ptimer.h"
58 #include "warc.h"
59 #include <getopt.h>
60 #include <getpass.h>
61 #include <quote.h>
62
63 #ifdef WINDOWS
64 # include <io.h>
65 # include <fcntl.h>
66 #endif
67
68 #ifdef __VMS
69 # include "vms.h"
70 #endif /* __VMS */
71
72 #ifndef PATH_SEPARATOR
73 # define PATH_SEPARATOR '/'
74 #endif
75
76 #ifndef ENABLE_IRI
77 struct iri dummy_iri;
78 #endif
79
80 struct options opt;
81
82 /* defined in version.c */
83 extern char *version_string;
84 extern char *compilation_string;
85 extern char *system_getrc;
86 extern char *link_string;
87 /* defined in build_info.c */
88 extern const char *compiled_features[];
89 /* Used for --version output in print_version */
90 #define MAX_CHARS_PER_LINE      72
91 #define TABULATION              4
92
93 #if defined(SIGHUP) || defined(SIGUSR1)
94 static void redirect_output_signal (int);
95 #endif
96
97 const char *exec_name;
98
99 /* Number of successfully downloaded URLs */
100 int numurls = 0;
101 \f
102 #ifndef TESTING
103 /* Initialize I18N/L10N.  That amounts to invoking setlocale, and
104    setting up gettext's message catalog using bindtextdomain and
105    textdomain.  Does nothing if NLS is disabled or missing.  */
106
107 static void
108 i18n_initialize (void)
109 {
110   /* ENABLE_NLS implies existence of functions invoked here.  */
111 #ifdef ENABLE_NLS
112   /* Set the current locale.  */
113   setlocale (LC_ALL, "");
114   /* Set the text message domain.  */
115   bindtextdomain ("wget", LOCALEDIR);
116   textdomain ("wget");
117 #endif /* ENABLE_NLS */
118 }
119 \f
120 /* Definition of command-line options. */
121
122 static void print_help (void);
123 static void print_version (void);
124
125 #ifdef HAVE_SSL
126 # define IF_SSL(x) x
127 #else
128 # define IF_SSL(x) NULL
129 #endif
130
131 #ifdef ENABLE_DEBUG
132 # define WHEN_DEBUG(x) x
133 #else
134 # define WHEN_DEBUG(x) NULL
135 #endif
136
137 struct cmdline_option {
138   const char *long_name;
139   char short_name;
140   enum {
141     OPT_VALUE,
142     OPT_BOOLEAN,
143     OPT_FUNCALL,
144     /* Non-standard options that have to be handled specially in
145        main().  */
146     OPT__APPEND_OUTPUT,
147     OPT__CLOBBER,
148     OPT__DONT_REMOVE_LISTING,
149     OPT__EXECUTE,
150     OPT__NO,
151     OPT__PARENT
152   } type;
153   const void *data;             /* for standard options */
154   int argtype;                  /* for non-standard options */
155 };
156
157 static struct cmdline_option option_data[] =
158   {
159     { "accept", 'A', OPT_VALUE, "accept", -1 },
160     { "accept-regex", 0, OPT_VALUE, "acceptregex", -1 },
161     { "adjust-extension", 'E', OPT_BOOLEAN, "adjustextension", -1 },
162     { "append-output", 'a', OPT__APPEND_OUTPUT, NULL, required_argument },
163     { "ask-password", 0, OPT_BOOLEAN, "askpassword", -1 },
164     { "auth-no-challenge", 0, OPT_BOOLEAN, "authnochallenge", -1 },
165     { "background", 'b', OPT_BOOLEAN, "background", -1 },
166     { "backup-converted", 'K', OPT_BOOLEAN, "backupconverted", -1 },
167     { "backups", 0, OPT_BOOLEAN, "backups", -1 },
168     { "base", 'B', OPT_VALUE, "base", -1 },
169     { "bind-address", 0, OPT_VALUE, "bindaddress", -1 },
170     { "body-data", 0, OPT_VALUE, "bodydata", -1 },
171     { "body-file", 0, OPT_VALUE, "bodyfile", -1 },
172     { IF_SSL ("ca-certificate"), 0, OPT_VALUE, "cacertificate", -1 },
173     { IF_SSL ("ca-directory"), 0, OPT_VALUE, "cadirectory", -1 },
174     { "cache", 0, OPT_BOOLEAN, "cache", -1 },
175     { IF_SSL ("certificate"), 0, OPT_VALUE, "certificate", -1 },
176     { IF_SSL ("certificate-type"), 0, OPT_VALUE, "certificatetype", -1 },
177     { IF_SSL ("check-certificate"), 0, OPT_BOOLEAN, "checkcertificate", -1 },
178     { "clobber", 0, OPT__CLOBBER, NULL, optional_argument },
179     { "config", 0, OPT_VALUE, "chooseconfig", -1 },
180     { "connect-timeout", 0, OPT_VALUE, "connecttimeout", -1 },
181     { "continue", 'c', OPT_BOOLEAN, "continue", -1 },
182     { "convert-links", 'k', OPT_BOOLEAN, "convertlinks", -1 },
183     { "content-disposition", 0, OPT_BOOLEAN, "contentdisposition", -1 },
184     { "content-on-error", 0, OPT_BOOLEAN, "contentonerror", -1 },
185     { "cookies", 0, OPT_BOOLEAN, "cookies", -1 },
186     { "cut-dirs", 0, OPT_VALUE, "cutdirs", -1 },
187     { WHEN_DEBUG ("debug"), 'd', OPT_BOOLEAN, "debug", -1 },
188     { "default-page", 0, OPT_VALUE, "defaultpage", -1 },
189     { "delete-after", 0, OPT_BOOLEAN, "deleteafter", -1 },
190     { "directories", 0, OPT_BOOLEAN, "dirstruct", -1 },
191     { "directory-prefix", 'P', OPT_VALUE, "dirprefix", -1 },
192     { "dns-cache", 0, OPT_BOOLEAN, "dnscache", -1 },
193     { "dns-timeout", 0, OPT_VALUE, "dnstimeout", -1 },
194     { "domains", 'D', OPT_VALUE, "domains", -1 },
195     { "dont-remove-listing", 0, OPT__DONT_REMOVE_LISTING, NULL, no_argument },
196     { "dot-style", 0, OPT_VALUE, "dotstyle", -1 }, /* deprecated */
197     { "egd-file", 0, OPT_VALUE, "egdfile", -1 },
198     { "exclude-directories", 'X', OPT_VALUE, "excludedirectories", -1 },
199     { "exclude-domains", 0, OPT_VALUE, "excludedomains", -1 },
200     { "execute", 'e', OPT__EXECUTE, NULL, required_argument },
201     { "follow-ftp", 0, OPT_BOOLEAN, "followftp", -1 },
202     { "follow-tags", 0, OPT_VALUE, "followtags", -1 },
203     { "force-directories", 'x', OPT_BOOLEAN, "dirstruct", -1 },
204     { "force-html", 'F', OPT_BOOLEAN, "forcehtml", -1 },
205     { "ftp-password", 0, OPT_VALUE, "ftppassword", -1 },
206 #ifdef __VMS
207     { "ftp-stmlf", 0, OPT_BOOLEAN, "ftpstmlf", -1 },
208 #endif /* def __VMS */
209     { "ftp-user", 0, OPT_VALUE, "ftpuser", -1 },
210     { "glob", 0, OPT_BOOLEAN, "glob", -1 },
211     { "header", 0, OPT_VALUE, "header", -1 },
212     { "help", 'h', OPT_FUNCALL, (void *)print_help, no_argument },
213     { "host-directories", 0, OPT_BOOLEAN, "addhostdir", -1 },
214     { "html-extension", 'E', OPT_BOOLEAN, "adjustextension", -1 }, /* deprecated */
215     { "htmlify", 0, OPT_BOOLEAN, "htmlify", -1 },
216     { "http-keep-alive", 0, OPT_BOOLEAN, "httpkeepalive", -1 },
217     { "http-passwd", 0, OPT_VALUE, "httppassword", -1 }, /* deprecated */
218     { "http-password", 0, OPT_VALUE, "httppassword", -1 },
219     { "http-user", 0, OPT_VALUE, "httpuser", -1 },
220     { IF_SSL ("https-only"), 0, OPT_BOOLEAN, "httpsonly", -1 },
221     { "ignore-case", 0, OPT_BOOLEAN, "ignorecase", -1 },
222     { "ignore-length", 0, OPT_BOOLEAN, "ignorelength", -1 },
223     { "ignore-tags", 0, OPT_VALUE, "ignoretags", -1 },
224     { "include-directories", 'I', OPT_VALUE, "includedirectories", -1 },
225 #ifdef ENABLE_IPV6
226     { "inet4-only", '4', OPT_BOOLEAN, "inet4only", -1 },
227     { "inet6-only", '6', OPT_BOOLEAN, "inet6only", -1 },
228 #endif
229     { "input-file", 'i', OPT_VALUE, "input", -1 },
230     { "iri", 0, OPT_BOOLEAN, "iri", -1 },
231     { "keep-session-cookies", 0, OPT_BOOLEAN, "keepsessioncookies", -1 },
232     { "level", 'l', OPT_VALUE, "reclevel", -1 },
233     { "limit-rate", 0, OPT_VALUE, "limitrate", -1 },
234     { "load-cookies", 0, OPT_VALUE, "loadcookies", -1 },
235     { "local-encoding", 0, OPT_VALUE, "localencoding", -1 },
236     { "max-redirect", 0, OPT_VALUE, "maxredirect", -1 },
237     { "method", 0, OPT_VALUE, "method", -1 },
238     { "mirror", 'm', OPT_BOOLEAN, "mirror", -1 },
239     { "no", 'n', OPT__NO, NULL, required_argument },
240     { "no-clobber", 0, OPT_BOOLEAN, "noclobber", -1 },
241     { "no-parent", 0, OPT_BOOLEAN, "noparent", -1 },
242     { "output-document", 'O', OPT_VALUE, "outputdocument", -1 },
243     { "output-file", 'o', OPT_VALUE, "logfile", -1 },
244     { "page-requisites", 'p', OPT_BOOLEAN, "pagerequisites", -1 },
245     { "parent", 0, OPT__PARENT, NULL, optional_argument },
246     { "passive-ftp", 0, OPT_BOOLEAN, "passiveftp", -1 },
247     { "password", 0, OPT_VALUE, "password", -1 },
248     { "post-data", 0, OPT_VALUE, "postdata", -1 },
249     { "post-file", 0, OPT_VALUE, "postfile", -1 },
250     { "prefer-family", 0, OPT_VALUE, "preferfamily", -1 },
251     { "preserve-permissions", 0, OPT_BOOLEAN, "preservepermissions", -1 },
252     { IF_SSL ("private-key"), 0, OPT_VALUE, "privatekey", -1 },
253     { IF_SSL ("private-key-type"), 0, OPT_VALUE, "privatekeytype", -1 },
254     { "progress", 0, OPT_VALUE, "progress", -1 },
255     { "protocol-directories", 0, OPT_BOOLEAN, "protocoldirectories", -1 },
256     { "proxy", 0, OPT_BOOLEAN, "useproxy", -1 },
257     { "proxy__compat", 'Y', OPT_VALUE, "useproxy", -1 }, /* back-compatible */
258     { "proxy-passwd", 0, OPT_VALUE, "proxypassword", -1 }, /* deprecated */
259     { "proxy-password", 0, OPT_VALUE, "proxypassword", -1 },
260     { "proxy-user", 0, OPT_VALUE, "proxyuser", -1 },
261     { "quiet", 'q', OPT_BOOLEAN, "quiet", -1 },
262     { "quota", 'Q', OPT_VALUE, "quota", -1 },
263     { "random-file", 0, OPT_VALUE, "randomfile", -1 },
264     { "random-wait", 0, OPT_BOOLEAN, "randomwait", -1 },
265     { "read-timeout", 0, OPT_VALUE, "readtimeout", -1 },
266     { "recursive", 'r', OPT_BOOLEAN, "recursive", -1 },
267     { "referer", 0, OPT_VALUE, "referer", -1 },
268     { "regex-type", 0, OPT_VALUE, "regextype", -1 },
269     { "reject", 'R', OPT_VALUE, "reject", -1 },
270     { "reject-regex", 0, OPT_VALUE, "rejectregex", -1 },
271     { "relative", 'L', OPT_BOOLEAN, "relativeonly", -1 },
272     { "remote-encoding", 0, OPT_VALUE, "remoteencoding", -1 },
273     { "remove-listing", 0, OPT_BOOLEAN, "removelisting", -1 },
274     { "report-speed", 0, OPT_BOOLEAN, "reportspeed", -1 },
275     { "restrict-file-names", 0, OPT_BOOLEAN, "restrictfilenames", -1 },
276     { "retr-symlinks", 0, OPT_BOOLEAN, "retrsymlinks", -1 },
277     { "retry-connrefused", 0, OPT_BOOLEAN, "retryconnrefused", -1 },
278     { "save-cookies", 0, OPT_VALUE, "savecookies", -1 },
279     { "save-headers", 0, OPT_BOOLEAN, "saveheaders", -1 },
280     { IF_SSL ("secure-protocol"), 0, OPT_VALUE, "secureprotocol", -1 },
281     { "server-response", 'S', OPT_BOOLEAN, "serverresponse", -1 },
282     { "span-hosts", 'H', OPT_BOOLEAN, "spanhosts", -1 },
283     { "spider", 0, OPT_BOOLEAN, "spider", -1 },
284     { "strict-comments", 0, OPT_BOOLEAN, "strictcomments", -1 },
285     { "timeout", 'T', OPT_VALUE, "timeout", -1 },
286     { "timestamping", 'N', OPT_BOOLEAN, "timestamping", -1 },
287     { "tries", 't', OPT_VALUE, "tries", -1 },
288     { "unlink", 0, OPT_BOOLEAN, "unlink", -1 },
289     { "trust-server-names", 0, OPT_BOOLEAN, "trustservernames", -1 },
290     { "use-server-timestamps", 0, OPT_BOOLEAN, "useservertimestamps", -1 },
291     { "user", 0, OPT_VALUE, "user", -1 },
292     { "user-agent", 'U', OPT_VALUE, "useragent", -1 },
293     { "verbose", 'v', OPT_BOOLEAN, "verbose", -1 },
294     { "verbose", 0, OPT_BOOLEAN, "verbose", -1 },
295     { "version", 'V', OPT_FUNCALL, (void *) print_version, no_argument },
296     { "wait", 'w', OPT_VALUE, "wait", -1 },
297     { "waitretry", 0, OPT_VALUE, "waitretry", -1 },
298     { "warc-cdx", 0, OPT_BOOLEAN, "warccdx", -1 },
299 #ifdef HAVE_LIBZ
300     { "warc-compression", 0, OPT_BOOLEAN, "warccompression", -1 },
301 #endif
302     { "warc-dedup", 0, OPT_VALUE, "warccdxdedup", -1 },
303     { "warc-digests", 0, OPT_BOOLEAN, "warcdigests", -1 },
304     { "warc-file", 0, OPT_VALUE, "warcfile", -1 },
305     { "warc-header", 0, OPT_VALUE, "warcheader", -1 },
306     { "warc-keep-log", 0, OPT_BOOLEAN, "warckeeplog", -1 },
307     { "warc-max-size", 0, OPT_VALUE, "warcmaxsize", -1 },
308     { "warc-tempdir", 0, OPT_VALUE, "warctempdir", -1 },
309 #ifdef USE_WATT32
310     { "wdebug", 0, OPT_BOOLEAN, "wdebug", -1 },
311 #endif
312   };
313
314 #undef WHEN_DEBUG
315 #undef IF_SSL
316
317 /* Return a string that contains S with "no-" prepended.  The string
318    is NUL-terminated and allocated off static storage at Wget
319    startup.  */
320
321 static char *
322 no_prefix (const char *s)
323 {
324   static char buffer[1024];
325   static char *p = buffer;
326
327   char *cp = p;
328   int size = 3 + strlen (s) + 1;  /* "no-STRING\0" */
329   if (p + size >= buffer + sizeof (buffer))
330     abort ();
331
332   cp[0] = 'n', cp[1] = 'o', cp[2] = '-';
333   strcpy (cp + 3, s);
334   p += size;
335   return cp;
336 }
337
338 /* The arguments that that main passes to getopt_long. */
339 static struct option long_options[2 * countof (option_data) + 1];
340 static char short_options[128];
341
342 /* Mapping between short option chars and option_data indices. */
343 static unsigned char optmap[96];
344
345 /* Marker for `--no-FOO' values in long_options.  */
346 #define BOOLEAN_NEG_MARKER 1024
347
348 /* Initialize the long_options array used by getopt_long from the data
349    in option_data.  */
350
351 static void
352 init_switches (void)
353 {
354   char *p = short_options;
355   size_t i, o = 0;
356   for (i = 0; i < countof (option_data); i++)
357     {
358       struct cmdline_option *opt = &option_data[i];
359       struct option *longopt;
360
361       if (!opt->long_name)
362         /* The option is disabled. */
363         continue;
364
365       longopt = &long_options[o++];
366       longopt->name = opt->long_name;
367       longopt->val = i;
368       if (opt->short_name)
369         {
370           *p++ = opt->short_name;
371           optmap[opt->short_name - 32] = longopt - long_options;
372         }
373       switch (opt->type)
374         {
375         case OPT_VALUE:
376           longopt->has_arg = required_argument;
377           if (opt->short_name)
378             *p++ = ':';
379           break;
380         case OPT_BOOLEAN:
381           /* Specify an optional argument for long options, so that
382              --option=off works the same as --no-option, for
383              compatibility with pre-1.10 Wget.  However, don't specify
384              optional arguments short-option booleans because they
385              prevent combining of short options.  */
386           longopt->has_arg = optional_argument;
387           /* For Boolean options, add the "--no-FOO" variant, which is
388              identical to "--foo", except it has opposite meaning and
389              it doesn't allow an argument.  */
390           longopt = &long_options[o++];
391           longopt->name = no_prefix (opt->long_name);
392           longopt->has_arg = no_argument;
393           /* Mask the value so we'll be able to recognize that we're
394              dealing with the false value.  */
395           longopt->val = i | BOOLEAN_NEG_MARKER;
396           break;
397         default:
398           assert (opt->argtype != -1);
399           longopt->has_arg = opt->argtype;
400           if (opt->short_name)
401             {
402               if (longopt->has_arg == required_argument)
403                 *p++ = ':';
404               /* Don't handle optional_argument */
405             }
406         }
407     }
408   /* Terminate short_options. */
409   *p = '\0';
410   /* No need for xzero(long_options[o]) because its storage is static
411      and it will be zeroed by default.  */
412   assert (o <= countof (long_options));
413 }
414
415 /* Print the usage message.  */
416 static int
417 print_usage (int error)
418 {
419   return fprintf (error ? stderr : stdout,
420                   _("Usage: %s [OPTION]... [URL]...\n"), exec_name);
421 }
422
423 /* Print the help message, describing all the available options.  If
424    you add an option, be sure to update this list.  */
425 static void
426 print_help (void)
427 {
428   /* We split the help text this way to ease translation of individual
429      entries.  */
430   static const char *help[] = {
431     "\n",
432     N_("\
433 Mandatory arguments to long options are mandatory for short options too.\n\n"),
434     N_("\
435 Startup:\n"),
436     N_("\
437   -V,  --version           display the version of Wget and exit.\n"),
438     N_("\
439   -h,  --help              print this help.\n"),
440     N_("\
441   -b,  --background        go to background after startup.\n"),
442     N_("\
443   -e,  --execute=COMMAND   execute a `.wgetrc'-style command.\n"),
444     "\n",
445
446     N_("\
447 Logging and input file:\n"),
448     N_("\
449   -o,  --output-file=FILE    log messages to FILE.\n"),
450     N_("\
451   -a,  --append-output=FILE  append messages to FILE.\n"),
452 #ifdef ENABLE_DEBUG
453     N_("\
454   -d,  --debug               print lots of debugging information.\n"),
455 #endif
456 #ifdef USE_WATT32
457     N_("\
458        --wdebug              print Watt-32 debug output.\n"),
459 #endif
460     N_("\
461   -q,  --quiet               quiet (no output).\n"),
462     N_("\
463   -v,  --verbose             be verbose (this is the default).\n"),
464     N_("\
465   -nv, --no-verbose          turn off verboseness, without being quiet.\n"),
466     N_("\
467        --report-speed=TYPE   Output bandwidth as TYPE.  TYPE can be bits.\n"),
468     N_("\
469   -i,  --input-file=FILE     download URLs found in local or external FILE.\n"),
470     N_("\
471   -F,  --force-html          treat input file as HTML.\n"),
472     N_("\
473   -B,  --base=URL            resolves HTML input-file links (-i -F)\n\
474                              relative to URL.\n"),
475     N_("\
476        --config=FILE         Specify config file to use.\n"), 
477     "\n",
478
479     N_("\
480 Download:\n"),
481     N_("\
482   -t,  --tries=NUMBER            set number of retries to NUMBER (0 unlimits).\n"),
483     N_("\
484        --retry-connrefused       retry even if connection is refused.\n"),
485     N_("\
486   -O,  --output-document=FILE    write documents to FILE.\n"),
487     N_("\
488   -nc, --no-clobber              skip downloads that would download to\n\
489                                  existing files (overwriting them).\n"),
490     N_("\
491   -c,  --continue                resume getting a partially-downloaded file.\n"),
492     N_("\
493        --progress=TYPE           select progress gauge type.\n"),
494     N_("\
495   -N,  --timestamping            don't re-retrieve files unless newer than\n\
496                                  local.\n"),
497     N_("\
498   --no-use-server-timestamps     don't set the local file's timestamp by\n\
499                                  the one on the server.\n"),
500     N_("\
501   -S,  --server-response         print server response.\n"),
502     N_("\
503        --spider                  don't download anything.\n"),
504     N_("\
505   -T,  --timeout=SECONDS         set all timeout values to SECONDS.\n"),
506     N_("\
507        --dns-timeout=SECS        set the DNS lookup timeout to SECS.\n"),
508     N_("\
509        --connect-timeout=SECS    set the connect timeout to SECS.\n"),
510     N_("\
511        --read-timeout=SECS       set the read timeout to SECS.\n"),
512     N_("\
513   -w,  --wait=SECONDS            wait SECONDS between retrievals.\n"),
514     N_("\
515        --waitretry=SECONDS       wait 1..SECONDS between retries of a retrieval.\n"),
516     N_("\
517        --random-wait             wait from 0.5*WAIT...1.5*WAIT secs between retrievals.\n"),
518     N_("\
519        --no-proxy                explicitly turn off proxy.\n"),
520     N_("\
521   -Q,  --quota=NUMBER            set retrieval quota to NUMBER.\n"),
522     N_("\
523        --bind-address=ADDRESS    bind to ADDRESS (hostname or IP) on local host.\n"),
524     N_("\
525        --limit-rate=RATE         limit download rate to RATE.\n"),
526     N_("\
527        --no-dns-cache            disable caching DNS lookups.\n"),
528     N_("\
529        --restrict-file-names=OS  restrict chars in file names to ones OS allows.\n"),
530     N_("\
531        --ignore-case             ignore case when matching files/directories.\n"),
532 #ifdef ENABLE_IPV6
533     N_("\
534   -4,  --inet4-only              connect only to IPv4 addresses.\n"),
535     N_("\
536   -6,  --inet6-only              connect only to IPv6 addresses.\n"),
537     N_("\
538        --prefer-family=FAMILY    connect first to addresses of specified family,\n\
539                                  one of IPv6, IPv4, or none.\n"),
540 #endif
541     N_("\
542        --user=USER               set both ftp and http user to USER.\n"),
543     N_("\
544        --password=PASS           set both ftp and http password to PASS.\n"),
545     N_("\
546        --ask-password            prompt for passwords.\n"),
547     N_("\
548        --no-iri                  turn off IRI support.\n"),
549     N_("\
550        --local-encoding=ENC      use ENC as the local encoding for IRIs.\n"),
551     N_("\
552        --remote-encoding=ENC     use ENC as the default remote encoding.\n"),
553     N_("\
554        --unlink                  remove file before clobber.\n"),
555     "\n",
556
557     N_("\
558 Directories:\n"),
559     N_("\
560   -nd, --no-directories           don't create directories.\n"),
561     N_("\
562   -x,  --force-directories        force creation of directories.\n"),
563     N_("\
564   -nH, --no-host-directories      don't create host directories.\n"),
565     N_("\
566        --protocol-directories     use protocol name in directories.\n"),
567     N_("\
568   -P,  --directory-prefix=PREFIX  save files to PREFIX/...\n"),
569     N_("\
570        --cut-dirs=NUMBER          ignore NUMBER remote directory components.\n"),
571     "\n",
572
573     N_("\
574 HTTP options:\n"),
575     N_("\
576        --http-user=USER        set http user to USER.\n"),
577     N_("\
578        --http-password=PASS    set http password to PASS.\n"),
579     N_("\
580        --no-cache              disallow server-cached data.\n"),
581     N_ ("\
582        --default-page=NAME     Change the default page name (normally\n\
583                                this is `index.html'.).\n"),
584     N_("\
585   -E,  --adjust-extension      save HTML/CSS documents with proper extensions.\n"),
586     N_("\
587        --ignore-length         ignore `Content-Length' header field.\n"),
588     N_("\
589        --header=STRING         insert STRING among the headers.\n"),
590     N_("\
591        --max-redirect          maximum redirections allowed per page.\n"),
592     N_("\
593        --proxy-user=USER       set USER as proxy username.\n"),
594     N_("\
595        --proxy-password=PASS   set PASS as proxy password.\n"),
596     N_("\
597        --referer=URL           include `Referer: URL' header in HTTP request.\n"),
598     N_("\
599        --save-headers          save the HTTP headers to file.\n"),
600     N_("\
601   -U,  --user-agent=AGENT      identify as AGENT instead of Wget/VERSION.\n"),
602     N_("\
603        --no-http-keep-alive    disable HTTP keep-alive (persistent connections).\n"),
604     N_("\
605        --no-cookies            don't use cookies.\n"),
606     N_("\
607        --load-cookies=FILE     load cookies from FILE before session.\n"),
608     N_("\
609        --save-cookies=FILE     save cookies to FILE after session.\n"),
610     N_("\
611        --keep-session-cookies  load and save session (non-permanent) cookies.\n"),
612     N_("\
613        --post-data=STRING      use the POST method; send STRING as the data.\n"),
614     N_("\
615        --post-file=FILE        use the POST method; send contents of FILE.\n"),
616     N_("\
617        --method=HTTPMethod     use method \"HTTPMethod\" in the header.\n"),
618     N_("\
619        --body-data=STRING      Send STRING as data. --method MUST be set.\n"),
620     N_("\
621        --body-file=FILE        Send contents of FILE. --method MUST be set.\n"),
622     N_("\
623        --content-disposition   honor the Content-Disposition header when\n\
624                                choosing local file names (EXPERIMENTAL).\n"),
625     N_("\
626        --content-on-error      output the received content on server errors.\n"),
627     N_("\
628        --auth-no-challenge     send Basic HTTP authentication information\n\
629                                without first waiting for the server's\n\
630                                challenge.\n"),
631     "\n",
632
633 #ifdef HAVE_SSL
634     N_("\
635 HTTPS (SSL/TLS) options:\n"),
636     N_("\
637        --secure-protocol=PR     choose secure protocol, one of auto, SSLv2,\n\
638                                 SSLv3, and TLSv1.\n"),
639     N_("\
640        --https-only             only follow secure HTTPS links\n"),
641     N_("\
642        --no-check-certificate   don't validate the server's certificate.\n"),
643     N_("\
644        --certificate=FILE       client certificate file.\n"),
645     N_("\
646        --certificate-type=TYPE  client certificate type, PEM or DER.\n"),
647     N_("\
648        --private-key=FILE       private key file.\n"),
649     N_("\
650        --private-key-type=TYPE  private key type, PEM or DER.\n"),
651     N_("\
652        --ca-certificate=FILE    file with the bundle of CA's.\n"),
653     N_("\
654        --ca-directory=DIR       directory where hash list of CA's is stored.\n"),
655     N_("\
656        --random-file=FILE       file with random data for seeding the SSL PRNG.\n"),
657     N_("\
658        --egd-file=FILE          file naming the EGD socket with random data.\n"),
659     "\n",
660 #endif /* HAVE_SSL */
661
662     N_("\
663 FTP options:\n"),
664 #ifdef __VMS
665     N_("\
666        --ftp-stmlf             Use Stream_LF format for all binary FTP files.\n"),
667 #endif /* def __VMS */
668     N_("\
669        --ftp-user=USER         set ftp user to USER.\n"),
670     N_("\
671        --ftp-password=PASS     set ftp password to PASS.\n"),
672     N_("\
673        --no-remove-listing     don't remove `.listing' files.\n"),
674     N_("\
675        --no-glob               turn off FTP file name globbing.\n"),
676     N_("\
677        --no-passive-ftp        disable the \"passive\" transfer mode.\n"),
678     N_("\
679        --preserve-permissions  preserve remote file permissions.\n"),
680     N_("\
681        --retr-symlinks         when recursing, get linked-to files (not dir).\n"),
682     "\n",
683
684     N_("\
685 WARC options:\n"),
686     N_("\
687        --warc-file=FILENAME      save request/response data to a .warc.gz file.\n"),
688     N_("\
689        --warc-header=STRING      insert STRING into the warcinfo record.\n"),
690     N_("\
691        --warc-max-size=NUMBER    set maximum size of WARC files to NUMBER.\n"),
692     N_("\
693        --warc-cdx                write CDX index files.\n"),
694     N_("\
695        --warc-dedup=FILENAME     do not store records listed in this CDX file.\n"),
696 #ifdef HAVE_LIBZ
697     N_("\
698        --no-warc-compression     do not compress WARC files with GZIP.\n"),
699 #endif
700     N_("\
701        --no-warc-digests         do not calculate SHA1 digests.\n"),
702     N_("\
703        --no-warc-keep-log        do not store the log file in a WARC record.\n"),
704     N_("\
705        --warc-tempdir=DIRECTORY  location for temporary files created by the\n\
706                                  WARC writer.\n"),
707     "\n",
708
709     N_("\
710 Recursive download:\n"),
711     N_("\
712   -r,  --recursive          specify recursive download.\n"),
713     N_("\
714   -l,  --level=NUMBER       maximum recursion depth (inf or 0 for infinite).\n"),
715     N_("\
716        --delete-after       delete files locally after downloading them.\n"),
717     N_("\
718   -k,  --convert-links      make links in downloaded HTML or CSS point to\n\
719                             local files.\n"),
720     N_("\
721   --backups=N   before writing file X, rotate up to N backup files.\n"),
722
723 #ifdef __VMS
724     N_("\
725   -K,  --backup-converted   before converting file X, back up as X_orig.\n"),
726 #else /* def __VMS */
727     N_("\
728   -K,  --backup-converted   before converting file X, back up as X.orig.\n"),
729 #endif /* def __VMS [else] */
730     N_("\
731   -m,  --mirror             shortcut for -N -r -l inf --no-remove-listing.\n"),
732     N_("\
733   -p,  --page-requisites    get all images, etc. needed to display HTML page.\n"),
734     N_("\
735        --strict-comments    turn on strict (SGML) handling of HTML comments.\n"),
736     "\n",
737
738     N_("\
739 Recursive accept/reject:\n"),
740     N_("\
741   -A,  --accept=LIST               comma-separated list of accepted extensions.\n"),
742     N_("\
743   -R,  --reject=LIST               comma-separated list of rejected extensions.\n"),
744     N_("\
745        --accept-regex=REGEX        regex matching accepted URLs.\n"),
746     N_("\
747        --reject-regex=REGEX        regex matching rejected URLs.\n"),
748 #ifdef HAVE_LIBPCRE
749     N_("\
750        --regex-type=TYPE           regex type (posix|pcre).\n"),
751 #else
752     N_("\
753        --regex-type=TYPE           regex type (posix).\n"),
754 #endif
755     N_("\
756   -D,  --domains=LIST              comma-separated list of accepted domains.\n"),
757     N_("\
758        --exclude-domains=LIST      comma-separated list of rejected domains.\n"),
759     N_("\
760        --follow-ftp                follow FTP links from HTML documents.\n"),
761     N_("\
762        --follow-tags=LIST          comma-separated list of followed HTML tags.\n"),
763     N_("\
764        --ignore-tags=LIST          comma-separated list of ignored HTML tags.\n"),
765     N_("\
766   -H,  --span-hosts                go to foreign hosts when recursive.\n"),
767     N_("\
768   -L,  --relative                  follow relative links only.\n"),
769     N_("\
770   -I,  --include-directories=LIST  list of allowed directories.\n"),
771     N_("\
772   --trust-server-names             use the name specified by the redirection\n\
773                                    url last component.\n"),
774     N_("\
775   -X,  --exclude-directories=LIST  list of excluded directories.\n"),
776     N_("\
777   -np, --no-parent                 don't ascend to the parent directory.\n"),
778     "\n",
779     N_("Mail bug reports and suggestions to <bug-wget@gnu.org>.\n")
780   };
781
782   size_t i;
783
784   if (printf (_("GNU Wget %s, a non-interactive network retriever.\n"),
785               version_string) < 0)
786     exit (3);
787   if (print_usage (0) < 0)
788     exit (3);
789
790   for (i = 0; i < countof (help); i++)
791     if (fputs (_(help[i]), stdout) < 0)
792       exit (3);
793
794   exit (0);
795 }
796
797 /* Return a human-readable printed representation of INTERVAL,
798    measured in seconds.  */
799
800 static char *
801 secs_to_human_time (double interval)
802 {
803   static char buf[32];
804   int secs = (int) (interval + 0.5);
805   int hours, mins, days;
806
807   days = secs / 86400, secs %= 86400;
808   hours = secs / 3600, secs %= 3600;
809   mins = secs / 60, secs %= 60;
810
811   if (days)
812     sprintf (buf, "%dd %dh %dm %ds", days, hours, mins, secs);
813   else if (hours)
814     sprintf (buf, "%dh %dm %ds", hours, mins, secs);
815   else if (mins)
816     sprintf (buf, "%dm %ds", mins, secs);
817   else
818     sprintf (buf, "%ss", print_decimal (interval));
819
820   return buf;
821 }
822
823 static char *
824 prompt_for_password (void)
825 {
826   if (opt.user)
827     fprintf (stderr, _("Password for user %s: "), quote (opt.user));
828   else
829     fprintf (stderr, _("Password: "));
830   return getpass("");
831 }
832
833 /* Function that prints the line argument while limiting it
834    to at most line_length. prefix is printed on the first line
835    and an appropriate number of spaces are added on subsequent
836    lines.*/
837 static int
838 format_and_print_line (const char *prefix, const char *line,
839                        int line_length)
840 {
841   int remaining_chars;
842   char *line_dup, *token;
843
844   assert (prefix != NULL);
845   assert (line != NULL);
846   assert (line_length > TABULATION);
847
848   line_dup = xstrdup (line);
849
850   if (printf ("%s", prefix) < 0)
851     return -1;
852
853   /* Wrap to new line after prefix. */
854   remaining_chars = 0;
855
856   /* We break on spaces. */
857   token = strtok (line_dup, " ");
858   while (token != NULL)
859     {
860       /* If however a token is much larger than the maximum
861          line length, all bets are off and we simply print the
862          token on the next line. */
863       if (remaining_chars <= (int) strlen (token))
864         {
865           if (printf ("\n%*c", TABULATION, ' ') < 0)
866             return -1;
867           remaining_chars = line_length - TABULATION;
868         }
869       if (printf ("%s ", token) < 0)
870         return -1;
871       remaining_chars -= strlen (token) + 1;  /* account for " " */
872       token = strtok (NULL, " ");
873     }
874
875   if (printf ("\n") < 0)
876     return -1;
877
878   xfree (line_dup);
879   return 0;
880 }
881
882 static void
883 print_version (void)
884 {
885   const char *wgetrc_title  = _("Wgetrc: ");
886   const char *locale_title  = _("Locale: ");
887   const char *compile_title = _("Compile: ");
888   const char *link_title    = _("Link: ");
889   char *env_wgetrc, *user_wgetrc;
890   int i;
891
892   if (printf (_("GNU Wget %s built on %s.\n\n"), version_string, OS_TYPE) < 0)
893     exit (3);
894
895   for (i = 0; compiled_features[i] != NULL; )
896     {
897       int line_length = MAX_CHARS_PER_LINE;
898       while ((line_length > 0) && (compiled_features[i] != NULL))
899         {
900           if (printf ("%s ", compiled_features[i]) < 0)
901             exit (3);
902           line_length -= strlen (compiled_features[i]) + 2;
903           i++;
904         }
905       if (printf ("\n") < 0)
906         exit (3);
907     }
908   if (printf ("\n") < 0)
909     exit (3);
910
911   /* Handle the case when $WGETRC is unset and $HOME/.wgetrc is
912      absent. */
913   if (printf ("%s\n", wgetrc_title) < 0)
914     exit (3);
915
916   env_wgetrc = wgetrc_env_file_name ();
917   if (env_wgetrc && *env_wgetrc)
918     {
919       if (printf (_("    %s (env)\n"), env_wgetrc) < 0)
920         exit (3);
921       xfree (env_wgetrc);
922     }
923   user_wgetrc = wgetrc_user_file_name ();
924   if (user_wgetrc)
925     {
926       if (printf (_("    %s (user)\n"), user_wgetrc) < 0)
927         exit (3);
928       xfree (user_wgetrc);
929     }
930 #ifdef SYSTEM_WGETRC
931   if (printf (_("    %s (system)\n"), SYSTEM_WGETRC) < 0)
932     exit (3);
933 #endif
934
935 #ifdef ENABLE_NLS
936   if (format_and_print_line (locale_title,
937                              LOCALEDIR,
938                              MAX_CHARS_PER_LINE) < 0)
939     exit (3);
940 #endif /* def ENABLE_NLS */
941
942   if (compilation_string != NULL)
943     if (format_and_print_line (compile_title,
944                                compilation_string,
945                                MAX_CHARS_PER_LINE) < 0)
946       exit (3);
947
948   if (link_string != NULL)
949     if (format_and_print_line (link_title,
950                                link_string,
951                                MAX_CHARS_PER_LINE) < 0)
952       exit (3);
953
954   if (printf ("\n") < 0)
955     exit (3);
956
957   /* TRANSLATORS: When available, an actual copyright character
958      (circle-c) should be used in preference to "(C)". */
959   if (fputs (_("\
960 Copyright (C) 2011 Free Software Foundation, Inc.\n"), stdout) < 0)
961     exit (3);
962   if (fputs (_("\
963 License GPLv3+: GNU GPL version 3 or later\n\
964 <http://www.gnu.org/licenses/gpl.html>.\n\
965 This is free software: you are free to change and redistribute it.\n\
966 There is NO WARRANTY, to the extent permitted by law.\n"), stdout) < 0)
967     exit (3);
968   /* TRANSLATORS: When available, please use the proper diacritics for
969      names such as this one. See en_US.po for reference. */
970   if (fputs (_("\nOriginally written by Hrvoje Niksic <hniksic@xemacs.org>.\n"),
971              stdout) < 0)
972     exit (3);
973   if (fputs (_("Please send bug reports and questions to <bug-wget@gnu.org>.\n"),
974              stdout) < 0)
975     exit (3);
976
977   exit (0);
978 }
979
980 char *program_name; /* Needed by lib/error.c. */
981 char *program_argstring; /* Needed by wget_warc.c. */
982
983 int
984 main (int argc, char **argv)
985 {
986   char **url, **t;
987   int i, ret, longindex;
988   int nurl;
989   bool append_to_log = false;
990
991   total_downloaded_bytes = 0;
992
993   program_name = argv[0];
994
995   struct ptimer *timer = ptimer_new ();
996   double start_time = ptimer_measure (timer);
997
998   i18n_initialize ();
999
1000   /* Construct the name of the executable, without the directory part.  */
1001 #ifdef __VMS
1002   /* On VMS, lose the "dev:[dir]" prefix and the ".EXE;nnn" suffix. */
1003   exec_name = vms_basename (argv[0]);
1004 #else /* def __VMS */
1005   exec_name = strrchr (argv[0], PATH_SEPARATOR);
1006   if (!exec_name)
1007     exec_name = argv[0];
1008   else
1009     ++exec_name;
1010 #endif /* def __VMS [else] */
1011
1012 #ifdef WINDOWS
1013   /* Drop extension (typically .EXE) from executable filename. */
1014   windows_main ((char **) &exec_name);
1015 #endif
1016
1017   /* Construct the arguments string. */
1018   int argstring_length = 1;
1019   for (i = 1; i < argc; i++)
1020     argstring_length += strlen (argv[i]) + 2 + 1;
1021   char *p = program_argstring = malloc (argstring_length * sizeof (char));
1022   if (p == NULL)
1023     {
1024       fprintf (stderr, _("Memory allocation problem\n"));
1025       exit (2);
1026     }
1027   for (i = 1; i < argc; i++)
1028     {
1029       *p++ = '"';
1030       int arglen = strlen (argv[i]);
1031       memcpy (p, argv[i], arglen);
1032       p += arglen;
1033       *p++ = '"';
1034       *p++ = ' ';
1035     }
1036   *p = '\0';
1037
1038   /* Load the hard-coded defaults.  */
1039   defaults ();
1040
1041   init_switches ();
1042
1043   /* This separate getopt_long is needed to find the user config file
1044      option ("--config") and parse it before the other user options. */
1045   longindex = -1;
1046   int retconf;
1047   bool use_userconfig = false;
1048
1049   while ((retconf = getopt_long (argc, argv,
1050                                 short_options, long_options, &longindex)) != -1)
1051     {
1052       int confval;
1053       struct cmdline_option *config_opt;
1054
1055       /* There is no short option for "--config". */
1056       if (longindex >= 0)
1057         {
1058           confval = long_options[longindex].val;
1059           config_opt = &option_data[confval & ~BOOLEAN_NEG_MARKER];
1060           if (strcmp (config_opt->long_name, "config") == 0)
1061             {
1062               bool userrc_ret = true;
1063               userrc_ret &= run_wgetrc (optarg);
1064               use_userconfig = true;
1065               if (userrc_ret)
1066                 break;
1067               else
1068                 {
1069                   fprintf (stderr, _("Exiting due to error in %s\n"), optarg);
1070                   exit (2);
1071                 }
1072             }
1073         }
1074     }
1075
1076   /* If the user did not specify a config, read the system wgetrc and ~/.wgetrc. */
1077   if (use_userconfig == false)
1078     initialize ();
1079
1080   opterr = 0;
1081   optind = 0;
1082
1083   longindex = -1;
1084   while ((ret = getopt_long (argc, argv,
1085                              short_options, long_options, &longindex)) != -1)
1086     {
1087       int val;
1088       struct cmdline_option *opt;
1089
1090       /* If LONGINDEX is unchanged, it means RET is referring a short
1091          option.  */
1092       if (longindex == -1)
1093         {
1094           if (ret == '?')
1095             {
1096               print_usage (1);
1097               fprintf (stderr, "\n");
1098               fprintf (stderr, _("Try `%s --help' for more options.\n"),
1099                        exec_name);
1100               exit (2);
1101             }
1102           /* Find the short option character in the mapping.  */
1103           longindex = optmap[ret - 32];
1104         }
1105       val = long_options[longindex].val;
1106
1107       /* Use the retrieved value to locate the option in the
1108          option_data array, and to see if we're dealing with the
1109          negated "--no-FOO" variant of the boolean option "--foo".  */
1110       opt = &option_data[val & ~BOOLEAN_NEG_MARKER];
1111       switch (opt->type)
1112         {
1113         case OPT_VALUE:
1114           setoptval (opt->data, optarg, opt->long_name);
1115           break;
1116         case OPT_BOOLEAN:
1117           if (optarg)
1118             /* The user has specified a value -- use it. */
1119             setoptval (opt->data, optarg, opt->long_name);
1120           else
1121             {
1122               /* NEG is true for `--no-FOO' style boolean options. */
1123               bool neg = !!(val & BOOLEAN_NEG_MARKER);
1124               setoptval (opt->data, neg ? "0" : "1", opt->long_name);
1125             }
1126           break;
1127         case OPT_FUNCALL:
1128           {
1129             void (*func) (void) = (void (*) (void)) opt->data;
1130             func ();
1131           }
1132           break;
1133         case OPT__APPEND_OUTPUT:
1134           setoptval ("logfile", optarg, opt->long_name);
1135           append_to_log = true;
1136           break;
1137         case OPT__EXECUTE:
1138           run_command (optarg);
1139           break;
1140         case OPT__NO:
1141           {
1142             /* We support real --no-FOO flags now, but keep these
1143                short options for convenience and backward
1144                compatibility.  */
1145             char *p;
1146             for (p = optarg; p && *p; p++)
1147               switch (*p)
1148                 {
1149                 case 'v':
1150                   setoptval ("verbose", "0", opt->long_name);
1151                   break;
1152                 case 'H':
1153                   setoptval ("addhostdir", "0", opt->long_name);
1154                   break;
1155                 case 'd':
1156                   setoptval ("dirstruct", "0", opt->long_name);
1157                   break;
1158                 case 'c':
1159                   setoptval ("noclobber", "1", opt->long_name);
1160                   break;
1161                 case 'p':
1162                   setoptval ("noparent", "1", opt->long_name);
1163                   break;
1164                 default:
1165                   fprintf (stderr, _("%s: illegal option -- `-n%c'\n"),
1166                            exec_name, *p);
1167                   print_usage (1);
1168                   fprintf (stderr, "\n");
1169                   fprintf (stderr, _("Try `%s --help' for more options.\n"),
1170                            exec_name);
1171                   exit (1);
1172                 }
1173             break;
1174           }
1175         case OPT__PARENT:
1176         case OPT__CLOBBER:
1177           {
1178             /* The wgetrc commands are named noparent and noclobber,
1179                so we must revert the meaning of the cmdline options
1180                before passing the value to setoptval.  */
1181             bool flag = true;
1182             if (optarg)
1183               flag = (*optarg == '1' || c_tolower (*optarg) == 'y'
1184                       || (c_tolower (optarg[0]) == 'o'
1185                           && c_tolower (optarg[1]) == 'n'));
1186             setoptval (opt->type == OPT__PARENT ? "noparent" : "noclobber",
1187                        flag ? "0" : "1", opt->long_name);
1188             break;
1189           }
1190         case OPT__DONT_REMOVE_LISTING:
1191           setoptval ("removelisting", "0", opt->long_name);
1192           break;
1193         }
1194
1195       longindex = -1;
1196     }
1197
1198   nurl = argc - optind;
1199
1200   /* All user options have now been processed, so it's now safe to do
1201      interoption dependency checks. */
1202
1203   if (opt.noclobber && opt.convert_links)
1204     {
1205       fprintf (stderr,
1206                _("Both --no-clobber and --convert-links were specified,"
1207                  " only --convert-links will be used.\n"));
1208       opt.noclobber = false;
1209     }
1210
1211   if (opt.reclevel == 0)
1212       opt.reclevel = INFINITE_RECURSION; /* see recur.h for commentary */
1213
1214   if (opt.spider || opt.delete_after)
1215       opt.no_dirstruct = true;
1216
1217   if (opt.page_requisites && !opt.recursive)
1218     {
1219       /* Don't set opt.recursive here because it would confuse the FTP
1220          code.  Instead, call retrieve_tree below when either
1221          page_requisites or recursive is requested.  */
1222       opt.reclevel = 0;
1223       if (!opt.no_dirstruct)
1224         opt.dirstruct = 1;      /* normally handled by cmd_spec_recursive() */
1225     }
1226
1227   if (opt.verbose == -1)
1228     opt.verbose = !opt.quiet;
1229
1230
1231   /* Sanity checks.  */
1232   if (opt.verbose && opt.quiet)
1233     {
1234       fprintf (stderr, _("Can't be verbose and quiet at the same time.\n"));
1235       print_usage (1);
1236       exit (1);
1237     }
1238   if (opt.timestamping && opt.noclobber)
1239     {
1240       fprintf (stderr, _("\
1241 Can't timestamp and not clobber old files at the same time.\n"));
1242       print_usage (1);
1243       exit (1);
1244     }
1245 #ifdef ENABLE_IPV6
1246   if (opt.ipv4_only && opt.ipv6_only)
1247     {
1248       fprintf (stderr,
1249                _("Cannot specify both --inet4-only and --inet6-only.\n"));
1250       print_usage (1);
1251       exit (1);
1252     }
1253 #endif
1254   if (opt.output_document)
1255     {
1256       if (opt.convert_links
1257           && (nurl > 1 || opt.page_requisites || opt.recursive))
1258         {
1259           fputs (_("\
1260 Cannot specify both -k and -O if multiple URLs are given, or in combination\n\
1261 with -p or -r. See the manual for details.\n\n"), stderr);
1262           print_usage (1);
1263           exit (1);
1264         }
1265       if (opt.page_requisites
1266           || opt.recursive)
1267         {
1268           logprintf (LOG_NOTQUIET, "%s", _("\
1269 WARNING: combining -O with -r or -p will mean that all downloaded content\n\
1270 will be placed in the single file you specified.\n\n"));
1271         }
1272       if (opt.timestamping)
1273         {
1274           logprintf (LOG_NOTQUIET, "%s", _("\
1275 WARNING: timestamping does nothing in combination with -O. See the manual\n\
1276 for details.\n\n"));
1277           opt.timestamping = false;
1278         }
1279       if (opt.noclobber && file_exists_p(opt.output_document))
1280            {
1281               /* Check if output file exists; if it does, exit. */
1282               logprintf (LOG_VERBOSE,
1283                          _("File `%s' already there; not retrieving.\n"),
1284                          opt.output_document);
1285               exit(1);
1286            }
1287     }
1288
1289   if (opt.warc_filename != 0)
1290     {
1291       if (opt.noclobber)
1292         {
1293           fprintf (stderr,
1294                    _("WARC output does not work with --no-clobber, "
1295                      "--no-clobber will be disabled.\n"));
1296           opt.noclobber = false;
1297         }
1298       if (opt.timestamping)
1299         {
1300           fprintf (stderr,
1301                    _("WARC output does not work with timestamping, "
1302                      "timestamping will be disabled.\n"));
1303           opt.timestamping = false;
1304         }
1305       if (opt.spider)
1306         {
1307           fprintf (stderr,
1308                    _("WARC output does not work with --spider.\n"));
1309           exit (1);
1310         }
1311       if (opt.always_rest)
1312         {
1313           fprintf (stderr,
1314                    _("WARC output does not work with --continue, "
1315                      "--continue will be disabled.\n"));
1316           opt.always_rest = false;
1317         }
1318       if (opt.warc_cdx_dedup_filename != 0 && !opt.warc_digests_enabled)
1319         {
1320           fprintf (stderr,
1321                    _("Digests are disabled; WARC deduplication will "
1322                      "not find duplicate records.\n"));
1323         }
1324       if (opt.warc_keep_log)
1325         {
1326           opt.progress_type = xstrdup ("dot");
1327         }
1328     }
1329
1330   if (opt.ask_passwd && opt.passwd)
1331     {
1332       fprintf (stderr,
1333                _("Cannot specify both --ask-password and --password.\n"));
1334       print_usage (1);
1335       exit (1);
1336     }
1337
1338   if (!nurl && !opt.input_filename)
1339     {
1340       /* No URL specified.  */
1341       fprintf (stderr, _("%s: missing URL\n"), exec_name);
1342       print_usage (1);
1343       fprintf (stderr, "\n");
1344       /* #### Something nicer should be printed here -- similar to the
1345          pre-1.5 `--help' page.  */
1346       fprintf (stderr, _("Try `%s --help' for more options.\n"), exec_name);
1347       exit (1);
1348     }
1349
1350   /* Compile the regular expressions.  */
1351   switch (opt.regex_type)
1352     {
1353 #ifdef HAVE_LIBPCRE
1354       case regex_type_pcre:
1355         opt.regex_compile_fun = compile_pcre_regex;
1356         opt.regex_match_fun = match_pcre_regex;
1357         break;
1358 #endif
1359
1360       case regex_type_posix:
1361       default:
1362         opt.regex_compile_fun = compile_posix_regex;
1363         opt.regex_match_fun = match_posix_regex;
1364         break;
1365     }
1366   if (opt.acceptregex_s)
1367     {
1368       opt.acceptregex = opt.regex_compile_fun (opt.acceptregex_s);
1369       if (!opt.acceptregex)
1370         exit (1);
1371     }
1372   if (opt.rejectregex_s)
1373     {
1374       opt.rejectregex = opt.regex_compile_fun (opt.rejectregex_s);
1375       if (!opt.rejectregex)
1376         exit (1);
1377     }
1378   if (opt.post_data || opt.post_file_name)
1379     {
1380       if (opt.post_data && opt.post_file_name)
1381         {
1382           fprintf (stderr, _("You cannot specify both --post-data and --post-file.\n"));
1383           exit (1);
1384         }
1385       else if (opt.method)
1386         {
1387           fprintf (stderr, _("You cannot use --post-data or --post-file along with --method. "
1388                              "--method expects data through --body-data and --body-file options"));
1389           exit (1);
1390         }
1391     }
1392   if (opt.body_data || opt.body_file)
1393     {
1394       if (!opt.method)
1395         {
1396           fprintf (stderr, _("You must specify a method through --method=HTTPMethod "
1397                               "to use with --body-data or --body-file.\n"));
1398           exit (1);
1399         }
1400       else if (opt.body_data && opt.body_file)
1401         {
1402           fprintf (stderr, _("You cannot specify both --body-data and --body-file.\n"));
1403           exit (1);
1404         }
1405     }
1406
1407   /* Set various options as required for opt.method.  */
1408
1409   /* When user specifies HEAD as the method, we do not wish to download any
1410      files. Hence, set wget to run in spider mode.  */
1411   if (opt.method && strcasecmp (opt.method, "HEAD") == 0)
1412     setoptval ("spider", "1", "spider");
1413
1414   /* Convert post_data to body-data and post_file_name to body-file options.
1415      This is required so as to remove redundant code later on in gethttp().
1416      The --post-data and --post-file options may also be removed in
1417      the future hence it makes sense to convert them to aliases for
1418      the more generic --method options.
1419      This MUST occur only after the sanity checks so as to prevent the
1420      user from setting both post and body options simultaneously.
1421   */
1422   if (opt.post_data || opt.post_file_name)
1423     {
1424         setoptval ("method", "POST", "method");
1425         if (opt.post_data)
1426           {
1427             setoptval ("bodydata", opt.post_data, "body-data");
1428             opt.post_data = NULL;
1429           }
1430         else
1431           {
1432             setoptval ("bodyfile", opt.post_file_name, "body-file");
1433             opt.post_file_name = NULL;
1434           }
1435     }
1436
1437 #ifdef ENABLE_IRI
1438   if (opt.enable_iri)
1439     {
1440       if (opt.locale && !check_encoding_name (opt.locale))
1441         opt.locale = NULL;
1442
1443       if (!opt.locale)
1444         opt.locale = find_locale ();
1445
1446       if (opt.encoding_remote && !check_encoding_name (opt.encoding_remote))
1447         opt.encoding_remote = NULL;
1448     }
1449 #else
1450   memset (&dummy_iri, 0, sizeof (dummy_iri));
1451   if (opt.enable_iri || opt.locale || opt.encoding_remote)
1452     {
1453       /* sXXXav : be more specific... */
1454       fprintf (stderr, _("This version does not have support for IRIs\n"));
1455       exit(1);
1456     }
1457 #endif
1458
1459   if (opt.ask_passwd)
1460     {
1461       opt.passwd = prompt_for_password ();
1462
1463       if (opt.passwd == NULL || opt.passwd[0] == '\0')
1464         exit (1);
1465     }
1466
1467 #ifdef USE_WATT32
1468   if (opt.wdebug)
1469      dbug_init();
1470   sock_init();
1471 #else
1472   if (opt.background)
1473     fork_to_background ();
1474 #endif
1475
1476   /* Initialize progress.  Have to do this after the options are
1477      processed so we know where the log file is.  */
1478   if (opt.verbose)
1479     set_progress_implementation (opt.progress_type);
1480
1481   /* Fill in the arguments.  */
1482   url = alloca_array (char *, nurl + 1);
1483   if (url == NULL)
1484     {
1485       fprintf (stderr, _("Memory allocation problem\n"));
1486       exit (2);
1487     }
1488   for (i = 0; i < nurl; i++, optind++)
1489     {
1490       char *rewritten = rewrite_shorthand_url (argv[optind]);
1491       if (rewritten)
1492         url[i] = rewritten;
1493       else
1494         url[i] = xstrdup (argv[optind]);
1495     }
1496   url[i] = NULL;
1497
1498   /* Initialize logging.  */
1499   log_init (opt.lfilename, append_to_log);
1500
1501   /* Open WARC file. */
1502   if (opt.warc_filename != 0)
1503     warc_init ();
1504
1505   DEBUGP (("DEBUG output created by Wget %s on %s.\n\n",
1506            version_string, OS_TYPE));
1507
1508   /* Open the output filename if necessary.  */
1509
1510 /* 2005-04-17 SMS.
1511    Note that having the output_stream ("-O") file opened here for an FTP
1512    URL rather than in getftp() (ftp.c) (and the http equivalent) rather
1513    limits the ability in VMS to open the file differently for ASCII
1514    versus binary FTP there.  (Of course, doing it here allows a open
1515    failure to be detected immediately, without first connecting to the
1516    server.)
1517 */
1518   if (opt.output_document)
1519     {
1520       if (HYPHENP (opt.output_document))
1521         {
1522 #ifdef WINDOWS
1523           _setmode (_fileno (stdout), _O_BINARY);
1524 #endif
1525           output_stream = stdout;
1526         }
1527       else
1528         {
1529           struct_fstat st;
1530
1531 #ifdef __VMS
1532 /* Common fopen() optional arguments:
1533    sequential access only, access callback function.
1534 */
1535 # define FOPEN_OPT_ARGS , "fop=sqo", "acc", acc_cb, &open_id
1536           int open_id = 7;
1537 #else /* def __VMS */
1538 # define FOPEN_OPT_ARGS
1539 #endif /* def __VMS [else] */
1540
1541           output_stream = fopen (opt.output_document,
1542                                  opt.always_rest ? "ab" : "wb"
1543                                  FOPEN_OPT_ARGS);
1544           if (output_stream == NULL)
1545             {
1546               perror (opt.output_document);
1547               exit (1);
1548             }
1549           if (fstat (fileno (output_stream), &st) == 0 && S_ISREG (st.st_mode))
1550             output_stream_regular = true;
1551         }
1552       if (!output_stream_regular && opt.convert_links)
1553         {
1554           fprintf (stderr, _("-k can be used together with -O only if \
1555 outputting to a regular file.\n"));
1556           print_usage (1);
1557           exit(1);
1558         }
1559     }
1560
1561 #ifdef __VMS
1562   /* Set global ODS5 flag according to the specified destination (if
1563      any), otherwise according to the current default device.
1564   */
1565   if (output_stream == NULL)
1566     set_ods5_dest( "SYS$DISK");
1567   else if (output_stream != stdout)
1568     set_ods5_dest( opt.output_document);
1569 #endif /* def __VMS */
1570
1571 #ifdef WINDOWS
1572   ws_startup ();
1573 #endif
1574
1575 #ifdef SIGHUP
1576   /* Setup the signal handler to redirect output when hangup is
1577      received.  */
1578   if (signal(SIGHUP, SIG_IGN) != SIG_IGN)
1579     signal(SIGHUP, redirect_output_signal);
1580 #endif
1581   /* ...and do the same for SIGUSR1.  */
1582 #ifdef SIGUSR1
1583   signal (SIGUSR1, redirect_output_signal);
1584 #endif
1585 #ifdef SIGPIPE
1586   /* Writing to a closed socket normally signals SIGPIPE, and the
1587      process exits.  What we want is to ignore SIGPIPE and just check
1588      for the return value of write().  */
1589   signal (SIGPIPE, SIG_IGN);
1590 #endif
1591 #ifdef SIGWINCH
1592   signal (SIGWINCH, progress_handle_sigwinch);
1593 #endif
1594
1595   /* Retrieve the URLs from argument list.  */
1596   for (t = url; *t; t++)
1597     {
1598       char *filename = NULL, *redirected_URL = NULL;
1599       int dt, url_err;
1600       /* Need to do a new struct iri every time, because
1601        * retrieve_url may modify it in some circumstances,
1602        * currently. */
1603       struct iri *iri = iri_new ();
1604       struct url *url_parsed;
1605
1606       set_uri_encoding (iri, opt.locale, true);
1607       url_parsed = url_parse (*t, &url_err, iri, true);
1608
1609       if (!url_parsed)
1610         {
1611           char *error = url_error (*t, url_err);
1612           logprintf (LOG_NOTQUIET, "%s: %s.\n",*t, error);
1613           xfree (error);
1614           inform_exit_status (URLERROR);
1615         }
1616       else
1617         {
1618           if ((opt.recursive || opt.page_requisites)
1619               && (url_scheme (*t) != SCHEME_FTP || url_uses_proxy (url_parsed)))
1620             {
1621               int old_follow_ftp = opt.follow_ftp;
1622
1623               /* Turn opt.follow_ftp on in case of recursive FTP retrieval */
1624               if (url_scheme (*t) == SCHEME_FTP)
1625                 opt.follow_ftp = 1;
1626
1627               retrieve_tree (url_parsed, NULL);
1628
1629               opt.follow_ftp = old_follow_ftp;
1630             }
1631           else
1632           {
1633             retrieve_url (url_parsed, *t, &filename, &redirected_URL, NULL,
1634                           &dt, opt.recursive, iri, true);
1635           }
1636
1637           if (opt.delete_after && filename != NULL && file_exists_p (filename))
1638             {
1639               DEBUGP (("Removing file due to --delete-after in main():\n"));
1640               logprintf (LOG_VERBOSE, _("Removing %s.\n"), filename);
1641               if (unlink (filename))
1642                 logprintf (LOG_NOTQUIET, "unlink: %s\n", strerror (errno));
1643             }
1644           xfree_null (redirected_URL);
1645           xfree_null (filename);
1646           url_free (url_parsed);
1647         }
1648       iri_free (iri);
1649     }
1650
1651   /* And then from the input file, if any.  */
1652   if (opt.input_filename)
1653     {
1654       int count;
1655       int status;
1656       status = retrieve_from_file (opt.input_filename, opt.force_html, &count);
1657       inform_exit_status (status);
1658       if (!count)
1659         logprintf (LOG_NOTQUIET, _("No URLs found in %s.\n"),
1660                    opt.input_filename);
1661     }
1662
1663   /* Print broken links. */
1664   if (opt.recursive && opt.spider)
1665     print_broken_links ();
1666
1667   /* Print the downloaded sum.  */
1668   if ((opt.recursive || opt.page_requisites
1669        || nurl > 1
1670        || (opt.input_filename && total_downloaded_bytes != 0))
1671       &&
1672       total_downloaded_bytes != 0)
1673     {
1674       double end_time = ptimer_measure (timer);
1675       ptimer_destroy (timer);
1676
1677       char *wall_time = xstrdup (secs_to_human_time (end_time - start_time));
1678       char *download_time = xstrdup (secs_to_human_time (total_download_time));
1679       logprintf (LOG_NOTQUIET,
1680                  _("FINISHED --%s--\nTotal wall clock time: %s\n"
1681                    "Downloaded: %d files, %s in %s (%s)\n"),
1682                  datetime_str (time (NULL)),
1683                  wall_time,
1684                  numurls,
1685                  human_readable (total_downloaded_bytes),
1686                  download_time,
1687                  retr_rate (total_downloaded_bytes, total_download_time));
1688       xfree (wall_time);
1689       xfree (download_time);
1690
1691       /* Print quota warning, if exceeded.  */
1692       if (opt.quota && total_downloaded_bytes > opt.quota)
1693         logprintf (LOG_NOTQUIET,
1694                    _("Download quota of %s EXCEEDED!\n"),
1695                    human_readable (opt.quota));
1696     }
1697
1698   if (opt.cookies_output)
1699     save_cookies ();
1700
1701   if (opt.convert_links && !opt.delete_after)
1702     convert_all_links ();
1703
1704   cleanup ();
1705
1706   exit (get_exit_status ());
1707 }
1708 #endif /* TESTING */
1709 \f
1710 #if defined(SIGHUP) || defined(SIGUSR1)
1711
1712 /* So the signal_name check doesn't blow when only one is available. */
1713 #ifndef SIGHUP
1714 # define SIGHUP -1
1715 #endif
1716 #ifndef SIGUSR1
1717 # define SIGUSR1 -1
1718 #endif
1719
1720 /* Hangup signal handler.  When wget receives SIGHUP or SIGUSR1, it
1721    will proceed operation as usual, trying to write into a log file.
1722    If that is impossible, the output will be turned off.  */
1723
1724 static void
1725 redirect_output_signal (int sig)
1726 {
1727   const char *signal_name = (sig == SIGHUP ? "SIGHUP" :
1728                              (sig == SIGUSR1 ? "SIGUSR1" :
1729                               "WTF?!"));
1730   log_request_redirect_output (signal_name);
1731   progress_schedule_redirect ();
1732   signal (sig, redirect_output_signal);
1733 }
1734 #endif
1735
1736 /*
1737  * vim: et ts=2 sw=2
1738  */