]> sjero.net Git - wget/blobdiff - src/ChangeLog
[svn] Don't descend into HTML that was downloaded by following <img src=...>
[wget] / src / ChangeLog
index 91905e6ea8f1adde30fcce967147b28f0740a8ec..a554f15070a62347411876fa61c8490fbf19f451 100644 (file)
@@ -1,3 +1,75 @@
+2003-10-10  Hrvoje Niksic  <hniksic@xemacs.org>
+
+       * recur.c (retrieve_tree): Don't descend into documents that are
+       not expected to contain HTML, regardless of their content-type.
+
+       * html-url.c (tag_url_attributes): Record which attributes are
+       supposed to yield HTML links that can be followed.
+       (tag_find_urls): Propagate that information to the caller through
+       struct urlpos.
+
+2003-10-10  Hrvoje Niksic  <hniksic@xemacs.org>
+
+       * hash.c (find_mapping): Return the next available mapping when
+       the key is not found, not NULL.
+       (hash_table_put): Use find_mapping to find the storage for the new
+       data.
+       (hash_table_put): Grow the table before exceeding maximum
+       fullness, not afterwards.
+
+2003-10-10  Hrvoje Niksic  <hniksic@xemacs.org>
+
+       * hash.c (hash_table_new): Slightly change the meaning of the
+       first parameter.  Instead of being the minimum initial size, it is
+       now the minimum number of items that the hash table can take
+       without needing to resize.
+
+2003-10-09  Hrvoje Niksic  <hniksic@xemacs.org>
+
+       * html-url.c (init_interesting): Initialize interesting_tags and
+       interesting_attributes as hash tables.  This simplifies the code
+       immensely because hash tables handle allocation and remove
+       duplicates automatically.
+       (find_tag): Removed.
+       (collect_tags_mapper): Instead of calling find_tag, simply get the
+       entry from interesting_tags hash table, which is both simpler and
+       faster.
+
+2003-10-09  Hrvoje Niksic  <hniksic@xemacs.org>
+
+       * hash.c (hash_table_get): Declare hash-table argument as const.
+       (find_mapping): Ditto.
+       (hash_table_get_pair): Ditto.
+       (hash_table_contains): Ditto.
+       (hash_table_count): Ditto.
+
+2003-10-08  Hrvoje Niksic  <hniksic@xemacs.org>
+
+       * html-url.c (get_urls_html): Parse the appropriate flags to
+       html-parse.c.
+
+       * html-parse.c (map_html_tags): Accept FLAGS from the caller
+       instead of examining OPT.
+
+2003-10-08  Hrvoje Niksic  <hniksic@xemacs.org>
+
+       * html-url.c (find_tag): Switch to binary search.
+
+2003-10-08  Hrvoje Niksic  <hniksic@xemacs.org>
+
+       * main.c (print_help): Fix typo; stured -> stored.
+
+2003-10-08  Hrvoje Niksic  <hniksic@xemacs.org>
+
+       * getopt.c: Add definitions of getopt_long and getopt_long_only.
+
+2003-10-08  Hrvoje Niksic  <hniksic@xemacs.org>
+
+       * config.h.in: Renamed DEBUG to ENABLE_DEBUG.  ENABLE_DEBUG is, I
+       think, a better name, because it implies that debugging output is
+       merely possible, not "on by default", as might be construed from
+       just DEBUG.
+
 2003-10-08  Hrvoje Niksic  <hniksic@xemacs.org>
 
        * ftp.c (has_insecure_name_p): Define it here.