Вверх ↑
Ответов: 176
Рейтинг: 12
#1: 2008-10-03 14:53:32 ЛС | профиль | цитата
Делаю качалку сайтов. Есть одна загвоздка. Нужно из html вытаскивать все ссылки. В том числе и ссылки на картинки фона. Вытащить теги href= и src= нет проблнм. Но есть и такие:
<li><a href=../ooo/index.html target=_blank>Ваш бесплатный блог </a></li>
<li><a href=../../ooo/index.html target=_blank>Ваш бесплатный блог </a></li>
Эти ссылки нужно приводить к виду с доменом на котором расположен сайт. Этого схемка не может.
В общем есть наброски схемки, но она не стопроцентно выдирает ссылки.

Может у кого есть соображения насчёт выдирания ссылок получше чем на моей схемке? Может лучше сделать с кодом delphi а не на стандартных компонентах? Задача такая, чтобы ссылки были бы как их видит EI загружая страничку. Поделитесь соображениями.
code_10172.txt
карма: 0
Время верстки: %cr_time% Текущее время: %time%
0
файлы: 1code_10172.txt [4.1KB] [193]