Вверх ↑
Этот топик читают: Гость
Ответов: 94
Рейтинг: 1
#1: 2012-02-05 19:55:00 ЛС | профиль | цитата
Вобщем сижу пару часов вожусь, пытаюсь с сайта http://sater.ru/ircproxy.php сграбить прокси лист.

конечно можно сделать грабинг по блокам, но это получится тогда заточен чисто под один сайт, а хотелось бы по маске парсить.

Произвращался с масками долго (вроде таких - *:####, *:*, *.*.*.*:*) но парсит чуш, либо выдает весь код страници либо ничего не выдает.

Вобщем что я не так делаю?
карма: 0

0
Ответов: 3889
Рейтинг: 362
#2: 2012-02-05 20:05:15 ЛС | профиль | цитата
_SG_ писал(а):
что я не так делаю?

Не подтвердили заявленное схемой.
карма: 1

0
Гость
Ответов: 17029
Рейтинг: 0
#3: 2012-02-05 20:05:49 правка | ЛС | профиль | цитата


Редактировалось 2 раз(а), последний 2025-01-11 05:24:48
карма: 0

0
Ответов: 94
Рейтинг: 1
#4: 2012-02-05 20:16:55 ЛС | профиль | цитата
1nd1g0 писал(а):
Не подтвердили заявленное схемой.

code_26767.txt

Просто схема до боли проста, подумал что смысла нет выкладывать, вобщем ни черта не пойму почему не парсит
217.118.83.131 писал(а):
code_26766.txt


спасбо конечно, но я писал про блоки, блоками без проблем парсится, но хочется по маске так как под новый сайт придется писать новый парсер
карма: 0

0
файлы: 1code_26767.txt [726B] [125]
Ответов: 3889
Рейтинг: 362
#5: 2012-02-05 20:23:39 ЛС | профиль | цитата
_SG_ писал(а):
под новый сайт придется писать новый парсер

Достаточно предусмотреть гибкую систему настройки, Вам дали правильный пример, блоки в искалке выше, и TagList в MultiBlockFind прекрасно перезагружаются, сколько угодно "масок" составляйте.
карма: 1

0
Ответов: 3349
Рейтинг: 233
#6: 2012-02-05 20:29:31 ЛС | профиль | цитата
code_26768.txt
------------ Дoбавленo в 20.29:
217.118.83.131, Это я, не заметил
карма: 1

1
файлы: 1code_26768.txt [613B] [205]
Голосовали:_SG_
Ответов: 94
Рейтинг: 1
#7: 2012-02-05 20:32:10 ЛС | профиль | цитата
Ivann писал(а):
code_26768.txt

Большое спасибо, именно этого и добивался))
карма: 0

0
Ответов: 3349
Рейтинг: 233
#8: 2012-02-05 20:36:26 ЛС | профиль | цитата
_SG_, Я в регулярных выражениях не силен(первый раз попробовал), но ты смотри, оно тебе и 999.999.999.999:99999 найдет, поэтому проверяй адрес и порт(255, 65535)
карма: 1

0
Ответов: 94
Рейтинг: 1
#9: 2012-02-05 21:13:04 ЛС | профиль | цитата
Ivann писал(а):
_SG_, Я в регулярных выражениях не силен(первый раз попробовал), но ты смотри, оно тебе и 999.999.999.999:99999 найдет, поэтому проверяй адрес и порт(255, 65535)


Да впринципе самое оно, содержимое всеравно потом в проксичекеры идет, так что это не страшно)
карма: 0

0
9
Сообщение
...
Прикрепленные файлы
(файлы не залиты)