Вверх ↑
Этот топик читают: Гость
Ответов: 19
Рейтинг: 0
#1: 2014-02-01 10:19:34 ЛС | профиль | цитата
Скачиваю компонентом HTTP_Get веб-страницу http://is.gd/RxDE3f.
Компонентом Convertor преобразую в строку (StreamToStr).
Компонентом BlockFind вырезаю блок, относящийся к полю ввода.
Помещаю результат в компонент Memo. Получаю: http://tinyurl.com/qhn5ry9
Что нужно сделать, чтобы было по-русски?
карма: 0

0
Ответов: 5446
Рейтинг: 323
#2: 2014-02-01 10:56:17 ЛС | профиль | цитата
VadimM, пакет Windows не умеет обрабатывать строки в UTF-8, ему нужна кодировка ANSI. Поставь после Convert компонент Charset.
карма: 1

0
Ответов: 19
Рейтинг: 0
#3: 2014-02-01 11:51:20 ЛС | профиль | цитата
ANSI не подходит — текст в дореформенной орфографии.
А в файл получится utf-8 написать?

карма: 0

0
Ответов: 1343
Рейтинг: 31
#4: 2014-02-01 12:27:33 ЛС | профиль | цитата
по моему всё идеально работает...

code_32962.txt
------------ Дoбавленo в 12.27:
вот подкоректил с блоками

Add(MainForm,2953706,42,7)
{
link(onCreate,3777229:doDownload,[])
}
Add(HTTP_Get,3777229,98,21)
{
URL="https://ru.wikisource.org/w/index.php?title=%D0%A1%D1%82%D1%80%D0%B0%D0%BD%D0%B8%D1%86%D0%B0:%D0%9F%D1%83%D1%82%D0%B5%D1%88%D0%B5%D1%81%D1%82%D0%B2%D0%B8%D0%B5_%D0%B2%D0%BE%D0%BA%D1%80%D1%83%D0%B3_%D1%81%D0%B2%D0%B5%D1%82%D0%B0_%D0%B2_1804,_5,_%D0%B8_1806_%D0%B3%D0%BE%D0%B4%D0%B0%D1%85._%D0%A7%D0%B0%D1%81%D1%82%D1%8C_1_%28%D0%9A%D1%80%D1%83%D0%B7%D0%B5%D0%BD%D1%88%D1%82%D0%B5%D1%80%D0%BD_1809%29.djvu/132&action=edit"
UserAgent="Mozilla/5.0"
link(onDownload,5694212:doConvert,[])
}
Add(StreamConvertor,5694212,147,28)
{
Mode=6
link(onResult,12270531:doCharset,[])
}
Add(Charset,12270531,189,28)
{
Type=7
link(onCharset,3161447:doSearch,[])
}
Add(Memo,13955763,308,28)
{
Left=290
Top=110
Align=5
ScrollBars=2
}
Add(BlockFind,3161447,252,28)
{
IncludeBlock=1
StartBlock="name="wpTextbox1">"
EndBlock="
</textarea>"
link(onSearch,13955763:doAdd,[])
}
карма: 2

0
файлы: 1code_32962.txt [831B] [187]
Ответов: 19
Рейтинг: 0
#5: 2014-02-01 15:37:35 ЛС | профиль | цитата
Rysik, к сожалению, в коде не разбираюсь. Кое-что тут, конечно, понятно, но не всё. Не могли бы словами пояснить?
Когда вставляю компонент Charset, у меня получается такой результат: http://i59.fastpic.ru/big/2014/0201/dd/2d6113f2abc19998d4bb7fc97c1d0ddd.png
Буква ѣ (ять) не отображается.
------------ Дoбавленo в 15.37:
Сделал сохранение в файл. Всё хорошо, сохраняет в кодировке utf-8.
Спасибо.

карма: 0

0
5
Сообщение
...
Прикрепленные файлы
(файлы не залиты)