Здравствуйте. Подскажите пожалуйста. При получении ответа от сервера с помощью компонента: TCP_client, иногда в ответе появляется какой-то мусор, строка из нескольких символов. Из-за этого, найти нужный текст с помощью BlockFind иногда не удаётся. В браузере конечно всё отображается нормально и такого нет.
Небольшой пример:
code_32727.txt
В данном случае, появилась строка: 1afb
Может кто знает из-за чего это?
Этот топик читают: Гость
Ответов: 902
Рейтинг: 27
|
|||
карма: 1 |
| ||
файлы: 1 | code_32727.txt [1.2KB] [127] |
Гость
Ответов: 17029
Рейтинг: 0
|
|||
Редактировалось 1 раз(а), последний 2017-03-05 15:34:43 |
|||
карма: 0 |
|
Ответов: 902
Рейтинг: 27
|
|||
isg-brass5-213-242-9-232., Это появляется не каждый раз, и на многих сайтах. Я думаю, может кто-то с таким встречался?
Просто добавляется короткая строка в исходный код страницы. Содержание ее может быть разным. |
|||
карма: 1 |
|
Ответов: 4630
Рейтинг: 749
|
|||
Мусор появляется внутри текста или в конце?
Какой TCP_Client используется (проверить на другом)? Обратить внимание на кодировки страницы (UTF-8, koi8-r ...) Упрощённую схемку - желательно. |
|||
карма: 26 |
|
Ответов: 902
Рейтинг: 27
|
|||
Netspirit, Внутри, а вообще, может появится в любом месте спонтанно. Появляется как на стандартном, так и нестандартном компоненте. Схема самая обычная, отправка запроса и получение ответа. Я думаю, может всё дело в самом сайте? Я уже думал про кодировку, но, вроде она непричём.
------------ Дoбавленo в 14.00: Вот например, часть исходного кода: <a rel="nofollow" href="http://www.webmoney.ru/" target="_blank"> a20 <img src="images/88x31_wm_blue_on_white_ru.png" alt="www.webmoney.ru" /></a> Строки: a20 быть не должно, а она присутствует. ------------ Дoбавленo в 14.02: И так по всему тексту.
Типа этого: 1ea6 Присутствует на странице. |
|||
карма: 1 |
|
Гость
Ответов: 17029
Рейтинг: 0
|
|||
Редактировалось 1 раз(а), последний 2017-03-05 15:34:43 |
|||
карма: 0 |
|
Разработчик
Ответов: 26158
Рейтинг: 2127
|
|||
А это не чанк-контент, по крайней мере, этот мусор очень сильно на это намекает Ответ сервера смотреть надо, там должен быть указатель на тип контента
|
|||
карма: 22 |
|
Ответов: 902
Рейтинг: 27
|
|||
tom-it, Ок. Буду ждать в скайпе. Я так и думал примерно, что именно при "склейке" это получается. Но вот как этого избежать? Поэтому и хотел изначально компонент: TCP_Client, заменить на НТТР_GET. Да и через прокси в нём вроде легче программу пустить.
------------ Дoбавленo в 14.18: Может можно какойто фильтр придумать, например, если строка меньше 4 символов, то сделать так, чтоб она не добавлялась? ------------ Дoбавленo в 14.21: nesco, Transfer-Encoding: chunked - Это? А что это? И как побороть? |
|||
карма: 1 |
|
Гость
Ответов: 17029
Рейтинг: 0
|
|||
Редактировалось 1 раз(а), последний 2017-03-05 15:34:44 |
|||
карма: 0 |
|
Ответов: 902
Рейтинг: 27
|
|||
nesco, Похоже оно и есть: http://ru.wikipedia.org/wiki/Chunked_transfer_encoding
------------ Дoбавленo в 14.29: tom-it, Я уже перевёл всю схему через прокси. Только думаю, а если сменить прокси на другой, не нужно ли снова будет переделывать всю схему? |
|||
карма: 1 |
|
Гость
Ответов: 17029
Рейтинг: 0
|
|||
Редактировалось 1 раз(а), последний 2017-03-05 15:34:44 |
|||
карма: 0 |
|
Гость
Ответов: 17029
Рейтинг: 0
|
|||
Редактировалось 1 раз(а), последний 2017-03-05 15:34:44 |
|||
карма: 0 |
|
Ответов: 902
Рейтинг: 27
|
|||
tom-it писал(а): только авторизацию проксиТак это и есть почти всю схему. ------------ Дoбавленo в 14.37: tom-it писал(а): Это и есть указанный Вами мусорЯ уже понял, а вот как его исключить? |
|||
карма: 1 |
|
Гость
Ответов: 17029
Рейтинг: 0
|
|||
Редактировалось 1 раз(а), последний 2017-03-05 15:34:44 |
|||
карма: 0 |
|
Ответов: 902
Рейтинг: 27
|
|||
tom-it, А в хиасме это как сделать?
------------ Дoбавленo в 15.23: Вроде удалось победить, указывая при составлении запроса вместо: HTTP/1.1 - HTTP/1.0 Незнаю правильно ли это? Или без разници? |
|||
карма: 1 |
|