Вобщем сижу пару часов вожусь, пытаюсь с сайта http://sater.ru/ircproxy.php сграбить прокси лист.
конечно можно сделать грабинг по блокам, но это получится тогда заточен чисто под один сайт, а хотелось бы по маске парсить.
Произвращался с масками долго (вроде таких - *:####, *:*, *.*.*.*:*) но парсит чуш, либо выдает весь код страници либо ничего не выдает.
Вобщем что я не так делаю?
Этот топик читают: Гость
|
Ответов: 94
Рейтинг: 1
|
|||
| карма: 0 |
|
|
Ответов: 3889
Рейтинг: 362
|
|||
|
_SG_ писал(а): что я не так делаю?Не подтвердили заявленное схемой. |
|||
| карма: 1 |
|
|
Гость
Ответов: 17029
Рейтинг: 0
|
|||
|
Редактировалось 2 раз(а), последний 2025-01-11 05:24:48 |
|||
| карма: 0 |
|
|
Ответов: 94
Рейтинг: 1
|
|||
|
1nd1g0 писал(а): Не подтвердили заявленное схемой.code_26767.txt Просто схема до боли проста, подумал что смысла нет выкладывать, вобщем ни черта не пойму почему не парсит 217.118.83.131 писал(а): code_26766.txtспасбо конечно, но я писал про блоки, блоками без проблем парсится, но хочется по маске так как под новый сайт придется писать новый парсер |
|||
| карма: 0 |
| ||
| файлы: 1 | code_26767.txt [726B] [125] |
|
Ответов: 3889
Рейтинг: 362
|
|||
|
_SG_ писал(а): под новый сайт придется писать новый парсерДостаточно предусмотреть гибкую систему настройки, Вам дали правильный пример, блоки в искалке выше, и TagList в MultiBlockFind прекрасно перезагружаются, сколько угодно "масок" составляйте. |
|||
| карма: 1 |
|
|
Ответов: 3349
Рейтинг: 233
|
|||
| карма: 1 |
| ||
| файлы: 1 | code_26768.txt [613B] [205] | ||
| Голосовали: | _SG_ |
|
Ответов: 94
Рейтинг: 1
|
|||
|
Ivann писал(а): code_26768.txtБольшое спасибо, именно этого и добивался)) |
|||
| карма: 0 |
|
|
Ответов: 3349
Рейтинг: 233
|
|||
|
_SG_, Я в регулярных выражениях не силен(первый раз попробовал), но ты смотри, оно тебе и 999.999.999.999:99999 найдет, поэтому проверяй адрес и порт(255, 65535)
|
|||
| карма: 1 |
|
|
Ответов: 94
Рейтинг: 1
|
|||
|
Ivann писал(а): _SG_, Я в регулярных выражениях не силен(первый раз попробовал), но ты смотри, оно тебе и 999.999.999.999:99999 найдет, поэтому проверяй адрес и порт(255, 65535)Да впринципе самое оно, содержимое всеравно потом в проксичекеры идет, так что это не страшно) |
|||
| карма: 0 |
|
9




Поиск
Друзья
Администрация