Вверх ↑
Этот топик читают: Гость
Ответов: 902
Рейтинг: 27
#1: 2014-01-03 07:02:49 ЛС | профиль | цитата
Здравствуйте. Подскажите пожалуйста. При получении ответа от сервера с помощью компонента: TCP_client, иногда в ответе появляется какой-то мусор, строка из нескольких символов. Из-за этого, найти нужный текст с помощью BlockFind иногда не удаётся. В браузере конечно всё отображается нормально и такого нет.
Небольшой пример:
code_32727.txt

В данном случае, появилась строка: 1afb
Может кто знает из-за чего это?
карма: 1
Время верстки: %cr_time% Текущее время: %time%
0
файлы: 1code_32727.txt [1.2KB] [127]
Гость
Ответов: 17029
Рейтинг: 0
#2: 2014-01-03 11:24:42 правка | ЛС | профиль | цитата


Редактировалось 1 раз(а), последний 2017-03-05 15:34:43
карма: 0

0
Ответов: 902
Рейтинг: 27
#3: 2014-01-03 11:56:59 ЛС | профиль | цитата
isg-brass5-213-242-9-232., Это появляется не каждый раз, и на многих сайтах. Я думаю, может кто-то с таким встречался?
Просто добавляется короткая строка в исходный код страницы. Содержание ее может быть разным.
карма: 1
Время верстки: %cr_time% Текущее время: %time%
0
Ответов: 4630
Рейтинг: 749
#4: 2014-01-03 13:27:34 ЛС | профиль | цитата
Мусор появляется внутри текста или в конце?
Какой TCP_Client используется (проверить на другом)?
Обратить внимание на кодировки страницы (UTF-8, koi8-r ...)

Упрощённую схемку - желательно.
карма: 26

0
Ответов: 902
Рейтинг: 27
#5: 2014-01-03 14:02:44 ЛС | профиль | цитата
Netspirit, Внутри, а вообще, может появится в любом месте спонтанно. Появляется как на стандартном, так и нестандартном компоненте. Схема самая обычная, отправка запроса и получение ответа. Я думаю, может всё дело в самом сайте? Я уже думал про кодировку, но, вроде она непричём.
------------ Дoбавленo в 14.00:
Вот например, часть исходного кода:
<a rel="nofollow" href="http://www.webmoney.ru/" target="_blank">

a20
<img src="images/88x31_wm_blue_on_white_ru.png" alt="www.webmoney.ru" /></a>

Строки: a20 быть не должно, а она присутствует.
------------ Дoбавленo в 14.02:
И так по всему тексту.

HTTP/1.1 200 OK
Server: nginx
Date: Fri, 03 Jan 2014 05:42:58 GMT
Content-Type: text/html; charset=WINDOWS-1251
Transfer-Encoding: chunked
X-Powered-By: PHP/5.3.27
Expires: Thu, 19 Nov 1981 08:52:00 GMT
Cache-Control: no-store, no-cache, must-revalidate, post-check=0, pre-check=0
Pragma: no-cache
Proxy-Connection: Close


1ea6

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"
"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" lang="en" xml:lang="ru">
<head>

Типа этого: 1ea6 Присутствует на странице.
карма: 1
Время верстки: %cr_time% Текущее время: %time%
0
Гость
Ответов: 17029
Рейтинг: 0
#6: 2014-01-03 14:05:04 правка | ЛС | профиль | цитата


Редактировалось 1 раз(а), последний 2017-03-05 15:34:43
карма: 0

0
Разработчик
Ответов: 26158
Рейтинг: 2127
#7: 2014-01-03 14:12:14 ЛС | профиль | цитата
А это не чанк-контент, по крайней мере, этот мусор очень сильно на это намекает Ответ сервера смотреть надо, там должен быть указатель на тип контента
карма: 22

0
Ответов: 902
Рейтинг: 27
#8: 2014-01-03 14:21:22 ЛС | профиль | цитата
tom-it, Ок. Буду ждать в скайпе. Я так и думал примерно, что именно при "склейке" это получается. Но вот как этого избежать? Поэтому и хотел изначально компонент: TCP_Client, заменить на НТТР_GET. Да и через прокси в нём вроде легче программу пустить.
------------ Дoбавленo в 14.18:
Может можно какойто фильтр придумать, например, если строка меньше 4 символов, то сделать так, чтоб она не добавлялась?
------------ Дoбавленo в 14.21:
nesco, Transfer-Encoding: chunked - Это? А что это? И как побороть?
карма: 1
Время верстки: %cr_time% Текущее время: %time%
0
Гость
Ответов: 17029
Рейтинг: 0
#9: 2014-01-03 14:22:25 правка | ЛС | профиль | цитата


Редактировалось 1 раз(а), последний 2017-03-05 15:34:44
карма: 0

0
Ответов: 902
Рейтинг: 27
#10: 2014-01-03 14:29:08 ЛС | профиль | цитата
nesco, Похоже оно и есть: http://ru.wikipedia.org/wiki/Chunked_transfer_encoding
------------ Дoбавленo в 14.29:
tom-it, Я уже перевёл всю схему через прокси. Только думаю, а если сменить прокси на другой, не нужно ли снова будет переделывать всю схему?
карма: 1
Время верстки: %cr_time% Текущее время: %time%
0
Гость
Ответов: 17029
Рейтинг: 0
#11: 2014-01-03 14:30:11 правка | ЛС | профиль | цитата


Редактировалось 1 раз(а), последний 2017-03-05 15:34:44
карма: 0

0
Гость
Ответов: 17029
Рейтинг: 0
#12: 2014-01-03 14:35:00 правка | ЛС | профиль | цитата


Редактировалось 1 раз(а), последний 2017-03-05 15:34:44
карма: 0

0
Ответов: 902
Рейтинг: 27
#13: 2014-01-03 14:37:52 ЛС | профиль | цитата
tom-it писал(а):
только авторизацию прокси

Так это и есть почти всю схему.
------------ Дoбавленo в 14.37:
tom-it писал(а):
Это и есть указанный Вами мусор

Я уже понял, а вот как его исключить?
карма: 1
Время верстки: %cr_time% Текущее время: %time%
0
Гость
Ответов: 17029
Рейтинг: 0
#14: 2014-01-03 14:45:11 правка | ЛС | профиль | цитата


Редактировалось 1 раз(а), последний 2017-03-05 15:34:44
карма: 0

0
Ответов: 902
Рейтинг: 27
#15: 2014-01-03 15:23:09 ЛС | профиль | цитата
tom-it, А в хиасме это как сделать?
------------ Дoбавленo в 15.23:
Вроде удалось победить, указывая при составлении запроса вместо: HTTP/1.1 - HTTP/1.0
Незнаю правильно ли это? Или без разници?
карма: 1
Время верстки: %cr_time% Текущее время: %time%
0
Сообщение
...
Прикрепленные файлы
(файлы не залиты)