Делаю качалку сайтов. Есть одна загвоздка. Нужно из html вытаскивать все ссылки. В том числе и ссылки на картинки фона. Вытащить теги href= и src= нет проблнм. Но есть и такие:
<li><a href=../ooo/index.html target=_blank>Ваш бесплатный блог </a></li>
<li><a href=../../ooo/index.html target=_blank>Ваш бесплатный блог </a></li>
Эти ссылки нужно приводить к виду с доменом на котором расположен сайт. Этого схемка не может.
В общем есть наброски схемки, но она не стопроцентно выдирает ссылки.
Может у кого есть соображения насчёт выдирания ссылок получше чем на моей схемке? Может лучше сделать с кодом delphi а не на стандартных компонентах? Задача такая, чтобы ссылки были бы как их видит EI загружая страничку. Поделитесь соображениями.
code_10172.txt
Ответов: 176
Рейтинг: 12
|
|||
карма: 0 |
| ||
файлы: 1 | code_10172.txt [4.1KB] [193] |