]> sjero.net Git - wget/blobdiff - src/iri.c
opt.remote_encoding should not override opt.locale, add a force arguments to set_uri_...
[wget] / src / iri.c
index 1f421d43f9cc3856cabb9ea944f05eb0f4112efc..3ee99871273ad76c4d115c015bcb751653e93ec3 100644 (file)
--- a/src/iri.c
+++ b/src/iri.c
@@ -41,19 +41,10 @@ as that of the covered work.  */
 #include "utils.h"
 #include "iri.h"
 
-/* Note: locale encoding is kept in options struct (opt.locale) */
-
-/* Hold the encoding used for the current fetch */
-char *remote;
-
-/* Hold the encoding for the future found links */
-char *current;
-
-/* Will/Is the current URL encoded in utf8 ? */
-bool utf8_encode;
+/* RFC3987 section 3.1 mandates STD3 ASCII RULES */
+#define IDNA_FLAGS  IDNA_USE_STD3_ASCII_RULES
 
-/* Force no utf8 encoding for url_parse () */
-bool ugly_no_encode;
+/* Note: locale encoding is kept in options struct (opt.locale) */
 
 static iconv_t locale2utf8;
 
@@ -236,15 +227,15 @@ do_conversion (iconv_t cd, char *in, size_t inlen, char **out)
 /* Try to "ASCII encode" UTF-8 host. Return the new domain on success or NULL
    on error. */
 char *
-idn_encode (char *host, bool utf8_encoded)
+idn_encode (struct iri *i, char *host)
 {
   char *new;
   int ret;
 
-  /* Encode to UTF-8 if not done using current remote */
-  if (!utf8_encoded)
+  /* Encode to UTF-8 if not done */
+  if (!i->utf8_encode)
     {
-      if (!remote_to_utf8 ((const char *) host, (const char **) &new))
+      if (!remote_to_utf8 (i, (const char *) host, (const char **) &new))
         {
           /* Nothing to encode or an error occured */
           return NULL;
@@ -254,7 +245,7 @@ idn_encode (char *host, bool utf8_encoded)
     }
 
   /* toASCII UTF-8 NULL terminated string */
-  ret = idna_to_ascii_8z (host, &new, 0);
+  ret = idna_to_ascii_8z (host, &new, IDNA_FLAGS);
   if (ret != IDNA_SUCCESS)
     {
       /* sXXXav : free new when needed ! */
@@ -274,7 +265,7 @@ idn_decode (char *host)
   char *new;
   int ret;
 
-  ret = idna_to_unicode_8zlz (host, &new, 0);
+  ret = idna_to_unicode_8zlz (host, &new, IDNA_FLAGS);
   if (ret != IDNA_SUCCESS)
     {
       logprintf (LOG_VERBOSE, "idn_decode failed (%d): %s\n", ret,
@@ -288,7 +279,7 @@ idn_decode (char *host)
 /* Try to transcode string str from remote encoding to UTF-8. On success, *new
    contains the transcoded string. *new content is unspecified otherwise. */
 bool
-remote_to_utf8 (const char *str, const char **new)
+remote_to_utf8 (struct iri *i, const char *str, const char **new)
 {
   char *r;
   iconv_t cd;
@@ -296,8 +287,8 @@ remote_to_utf8 (const char *str, const char **new)
 
   if (opt.encoding_remote)
     r = opt.encoding_remote;
-  else if (current)
-    r = current;
+  else if (i->uri_encoding)
+    r = i->uri_encoding;
   else
     return false;
 
@@ -320,72 +311,52 @@ remote_to_utf8 (const char *str, const char **new)
   return ret;
 }
 
-char *get_remote_charset (void)
-{
-  return remote;
-}
-
-char *get_current_charset (void)
+struct iri *
+iri_new (void)
 {
-  return current;
-}
-
-void set_current_charset (char *charset)
-{
-  /*printf("[ current = `%s'\n", charset);*/
-  if (current)
-    xfree (current);
-
-  current = charset ? xstrdup (charset) : NULL;
-}
-
-void set_current_as_locale (void)
-{
-  /*printf("[ current = locale = `%s'\n", opt.locale);*/
-  if (current)
-    xfree (current);
-
-  /* sXXXav : assert opt.locale NULL ? */
-  current = xstrdup (opt.locale);
+  struct iri *i = xmalloc (sizeof (struct iri));
+  i->uri_encoding = opt.encoding_remote ? xstrdup (opt.encoding_remote) : NULL;
+  i->content_encoding = NULL;
+  i->utf8_encode = opt.enable_iri;
 }
 
 void
-set_remote_charset (char *charset)
+iri_free (struct iri *i)
 {
-  /*printf("[ remote = `%s'\n", charset);*/
-  if (remote)
-    xfree (remote);
-
-  remote = charset ? xstrdup (charset) : NULL;
+  xfree_null (i->uri_encoding);
+  xfree_null (i->content_encoding);
+  xfree (i);
 }
 
 void
-set_remote_as_current (void)
+set_uri_encoding (struct iri *i, char *charset, bool force)
 {
-  /*printf("[ remote = current = `%s'\n", current);*/
-  if (remote)
-    xfree (remote);
-
-  remote = current ? xstrdup (current) : NULL;
-}
+  DEBUGP (("[IRI uri = `%s'\n", quote (charset)));
+  if (!force && opt.encoding_remote)
+    return;
+  if (i->uri_encoding)
+    {
+      if (!strcasecmp (i->uri_encoding, charset))
+        return;
+      xfree (i->uri_encoding);
+    }
 
-void reset_utf8_encode (void)
-{
-  set_utf8_encode (opt.enable_iri);
+  i->uri_encoding = charset ? xstrdup (charset) : NULL;
 }
 
-void set_utf8_encode (bool encode)
-{
-  utf8_encode = encode;
-}
-
-bool get_utf8_encode (void)
+void
+set_content_encoding (struct iri *i, char *charset)
 {
-  return (!ugly_no_encode && utf8_encode);
-}
+  DEBUGP (("[IRI content = %s\n", quote (charset)));
+  if (opt.encoding_remote)
+    return;
+  if (i->content_encoding)
+    {
+      if (!strcasecmp (i->content_encoding, charset))
+        return;
+      xfree (i->content_encoding);
+    }
 
-void set_ugly_no_encode (bool ugly)
-{
-  ugly_no_encode = ugly;
+  i->content_encoding = charset ? xstrdup (charset) : NULL;
 }