Вверх ↑
Этот топик читают: Гость
Ответов: 537
Рейтинг: 14
#1: 2017-06-24 15:08:07 ЛС | профиль | цитата
Делаю программу по поиску, нужно определить, есть на сайте ключевое слово или нет. Никак немогу разобратся с кодировкой сайтов, есть сайты в кодировке "utf-8", а есть "windows-1251" и нужно определить и если "utf-8", то перекодировать, чтобы отображался русский язык. Сделал по схеме ниже, но работает не всегда. Неполучается составить регулярку, бывает в тексте (charset=windows-1251), а бывает (charset="windows-1251"). Вобщем нужно опеделить кодировку веб станицы. Пробовал RE_Check с регуляркой "(?i).*charset=?windows-1251.*" и не как.
Add(MainForm,2953706,21,105)
{
WindowsState=2
}
Add(HTTPClient,8478886,196,112)
{
link(URL,11267446:Text,[])
link(onFinish,5433136:doCompare,[])
}
Add(Thread,11215581,147,112)
{
Delay=100
FastStop=0
Point(doStopFlag)
link(onExec,8478886:doLoadString,[])
}
Add(Charset,6357833,287,119)
{
Type=7
link(onCharset,5641829:doEvent1,[])
}
Add(Hub,5641829,336,119)
{
InCount=2
OutCount=1
link(onEvent1,4921271:doAdd,[])
}
Add(StrMask,5433136,245,119)
{
Mask="*charset=?windows-1251*"
link(onFalse,6357833:doCharset,[])
link(onTrue,5641829:doEvent2,[])
}
Add(RE_Check,16037478,196,168)
{
Expression="(?i).*charset=?windows-1251.*"
}
Add(Memo,4921271,371,119)
{
Left=370
Top=140
Align=5
ScrollBars=2
}
Add(Edit,11267446,196,63)
{
Left=195
Top=70
Align=2
Text="http://ivona.bigmir.net/cooking/413883-Olad-i-iz-kabachkov--TOP-5-letnih-receptov"
}
Add(Button,9293884,91,112)
{
Top=20
Width=65
Caption="Загрузить"
link(onClick,11215581:doStart,[])
}
Add(InfoTip,12946996,21,231)
{
Info=#173:Эта страница определяется правильно, там "charset="windows-1251", а эта http://russianfood.com/recipes/recipe.php?rid=128510 не правильно, там без лапок charset=windows-1251|
Font=[MS Sans Serif,15,1,0,1]
Width=533
Height=95
}
Чето сегодня бошка не варит

Редактировалось 1 раз(а), последний 2017-06-24 15:10:07
карма: 4

0
vip
#1.1контекстная реклама от партнеров
Ответов: 824
Рейтинг: 138
#2: 2017-06-24 16:17:31 ЛС | профиль | цитата
Попробуй...


Add(MainForm,8340442,154,161)
{
WindowsState=2
}
Add(HTTPClient,8478886,329,168)
{
link(URL,11267446:Text,[])
link(onFinish,16254781:doCheck,[])
}
Add(Thread,11215581,280,168)
{
Delay=100
FastStop=0
Point(doStopFlag)
link(onExec,8478886:doLoadString,[])
}
Add(Charset,6357833,427,175)
{
Type=7
link(onCharset,5641829:doEvent1,[])
}
Add(Hub,5641829,476,175)
{
InCount=2
OutCount=1
link(onEvent1,4921271:doText,[])
}
Add(Memo,4921271,511,154)
{
Left=370
Top=140
Align=5
ScrollBars=2
}
Add(Edit,11267446,329,119)
{
Left=195
Top=70
Align=2
Text="http://ivona.bigmir.net/cooking/413883-Olad-i-iz-kabachkov--TOP-5-letnih-receptov"
}
Add(Button,9293884,224,168)
{
Top=20
Width=65
Caption="Загрузить"
link(onClick,11215581:doStart,[])
}
Add(RE_Check,16254781,378,175)
{
Expression="(charset=)("*)(UTF-8)"
FullStrCheck=1
link(onMatch,6357833:doCharset,[])
link(onDismatch,5641829:doEvent2,[])
}
карма: 1

0
Ответов: 537
Рейтинг: 14
#3: 2017-06-25 04:08:02 ЛС | профиль | цитата
Не, проверено электронной ещё хуже.
карма: 4

0
Ответов: 824
Рейтинг: 138
#4: 2017-06-25 09:52:00 ЛС | профиль | цитата
Sersey писал(а):
Не, проверено электронной ещё хуже.
Это о чем?
карма: 1

0
4
Сообщение
...
Прикрепленные файлы
(файлы не залиты)