Вверх ↑
Этот топик читают: Гость
Ответов: 17
Рейтинг: 1
#1: 2012-07-14 12:32:26 ЛС | профиль | цитата
Пожалуйста покажите не сложную схему пример парсинга сайта и ввывода на своей страницы результата парсинга...
очень хочется разобраться
карма: 0

0
vip
#1.1контекстная реклама от партнеров
Ответов: 4641
Рейтинг: 334
#2: 2012-07-16 22:23:59 ЛС | профиль | цитата
Example-PHP-curl_demo
карма: 1
Время верстки: %cr_time% Текущее время: %time%
3
Голосовали:sla8a, Ex_, Uzer_hiasm
Ответов: 17
Рейтинг: 1
#3: 2012-07-17 00:35:06 ЛС | профиль | цитата
да уж далеко не просто это все придется полностью изучить веcь Curl
карма: 0

0
Ответов: 1173
Рейтинг: 49
#4: 2012-07-17 01:03:51 ЛС | профиль | цитата
Uzer_hiasm, дык, это же вроде программа/библиотека, что там учить? Да и в интернетах есть инструкции парсинга на cURL.
карма: 0

0
Ответов: 5446
Рейтинг: 323
#5: 2012-07-17 01:09:36 ЛС | профиль | цитата
Ex_, парсинг? На cURL? Парсинг обычно делают на SAX/DOM (православно) или на регулярках (еретично)
карма: 1

0
Ответов: 1173
Рейтинг: 49
#6: 2012-07-17 01:14:15 ЛС | профиль | цитата
iarspider писал(а):
парсинг? На cURL?
Я в этом вопросе (парсинг) некомпетентен, но в Гугле много чего есть по запросу "парсинг сайт с curl".
карма: 0

0
Ответов: 5446
Рейтинг: 323
#7: 2012-07-17 02:18:45 ЛС | профиль | цитата
Ex_, cURL (точнее - libcurl) - это библиотека для скачивания (или загрузки) по ссылкам (URL):
http://curl.haxx.se/libcurl/ писал(а):
libcurl is a free and easy-to-use client-side URL transfer library


Те, кто пишут про парсинг сайта с cURL - даже не троечники, а двоечники. Вот первый пример из гугля:
$page=curl_get($url);
preg_match_all('#href="([A-z0-9.-]+)"#', $page, $matches);
cURL начинается и кончается в первой строке приведённого куска кода. Парсингом же занимается вторая строка - банальнейшее регулярное выражение.

ЗЫ. Я негодую
карма: 1

3
Голосовали:Cosinus, Tad, Ex_
Ответов: 1173
Рейтинг: 49
#8: 2012-07-17 15:11:28 ЛС | профиль | цитата
iarspider, извините.[flood]Гугл-дезинформатор попутал [/flood]
карма: 0

0
Ответов: 17
Рейтинг: 1
#9: 2012-07-17 19:09:21 ЛС | профиль | цитата
iarspider писал(а):
Парсинг обычно делают на SAX/DOM (православно) или на регулярках (еретично)

А можно примерчик с использованием этих самых SAX/DOM в hiAsm
пожалуйста
карма: 0

0
Ответов: 1731
Рейтинг: 68
#10: 2012-07-17 19:18:25 ЛС | профиль | цитата
Если мне не изменяет память, то у нас форум сделан с помощью DOM.
карма: 1

0
Ответов: 5446
Рейтинг: 323
#11: 2012-07-17 19:48:11 ЛС | профиль | цитата
Cosinus, ну как тебе сказать - DOM действительно активно используется (для превращения данных, присылаемых серверным скриптом, в HTML-страницы, отображаемые бразуером).
Uzer_hiasm, компонентов для этого в проекте PHP нет. Есть компоненты для пакета Javascript, но использовать их для этой цели не получится.
карма: 1

0
Ответов: 17
Рейтинг: 1
#12: 2012-07-17 20:24:01 ЛС | профиль | цитата
значит опять же не прибегая к стороним яп и т.д придется использовать cURL так ?
хоть есть задумка если с cURL будет слишком муторно, написать модуль на perl для своего сайта
карма: 0

0
Ответов: 5446
Рейтинг: 323
#13: 2012-07-17 20:40:40 ЛС | профиль | цитата
Uzer_hiasm, cURL - для получения текста страницы. DOM/SAX/RegEx для разбора и выделения нужной части. Регулярные выражения в пакете есть (правда, почему-то только замена)
карма: 1

0
13
Сообщение
...
Прикрепленные файлы
(файлы не залиты)