Вверх ↑
Этот топик читают: Гость
Ответов: 5227
Рейтинг: 587
#16: 2009-04-01 12:08:56 ЛС | профиль | цитата
Ну и что работает у кого это или нет? или на частотном методе делать?
карма: 4
Мой форум - http://hiasm.bbtalk.me/ схемы, компоненты...
0
Ответов: 3514
Рейтинг: 184
#17: 2009-04-01 15:59:29 ЛС | профиль | цитата
Заявленные - определяет
карма: 0
0
Ответов: 5227
Рейтинг: 587
#18: 2009-04-01 16:32:10 ЛС | профиль | цитата
Астрамак писал(а):
Заявленные - определяет


Так кто может предоставить список ключевых слов для проверки кодировок (чем больше тем лучше) тот сразу получает улучшеную версию где сняты ограничения на входной обьём слов и словосочетаний.

Меня интересует вот такие строки (распространнёных слов)


#bas
Case "да","нет","как","что","чем","Вы","Вас","для","все"

можно применять и одиночные и тройные и четвертные (только очень внимательно следить за DOS кодировкой, одиночный символ должен обезательно быть печатаемым, т.е видимым) и все строки вместе с Case должны иметь одинаковую длинну.


карма: 4
Мой форум - http://hiasm.bbtalk.me/ схемы, компоненты...
0
Ответов: 215
Рейтинг: 45
#19: 2009-04-01 16:37:12 ЛС | профиль | цитата
1) Набор слов не очень удачный, я для теста дополнил набор однобуквенными предлогами/союзами "а","в","и","к","о","с","у" - распознавание улучшилось, если добавить двух-трёхбуквенные ("по","на", "над", "при" и т.п.), думаю оно ещё сильнее возрастёт
2) строка для кодировки intCp866 ("¤ ","­Ґв","Є Є","зв®","祬","‚л","‚ б","¤«п","ўбҐ","ў","Є","®","б") имхо неудачна, т.к. образцы содержат пробелы, а мы делаем массив по сплиттеру "пробел", и соответственно заведомо не получим совпадений этих слов.
------
пока печатал, ты уже ответил в ту же тему
имхо одинаковость длин строк Case не обязательна, пусть себе растут счётчики неравномерно, не думаю, что это сильно скажется
карма: 0

0
Ответов: 5227
Рейтинг: 587
#20: 2009-04-01 17:00:13 ЛС | профиль | цитата
lev, согласен стобой полностью, но
lev писал(а):
одинаковость длин строк Case не обязательна
я наверно имел больше ввиду того что кол-во сравниваемых символов и слов должно быть одинаковыми что бы обеспечить равноправные условия.

как и обещал улучшеный вариант
карма: 4
Мой форум - http://hiasm.bbtalk.me/ схемы, компоненты...
1
файлы: 1autocodepage.sha [2.4KB] [229]
Голосовали:MAV
Ответов: 1304
Рейтинг: 405
#21: 2009-04-01 21:37:45 ЛС | профиль | цитата
andrestudio, прописанные кодировки определяет в пределах размера текста ~1кб. Надо думаю заменить сообщение c.p.1251 на c.p.-не определена, если длина текста мала или не прописана определяемая страница.
------------ Дoбавленo:
andrestudio, а вобще скоро путём ненавязчивого воздействия заставишь всех разбираться в VBScript .
------------ Дoбавленo:
Просматривал кто автоматом определит c.p. , победителем оказался AkelPad, определял по одной букве , если нужен для опытов могу выложить 54кб.
карма: 3

0
Ответов: 5227
Рейтинг: 587
#22: 2009-04-02 07:45:48 ЛС | профиль | цитата
MAV писал(а):
Надо думаю заменить сообщение c.p.1251 на c.p.-не определена, если длина текста мала или не прописана определяемая страница.

я бы лучше ручной метод добавил и достаточно.

MAV, естественно что с таким маленьким набором ключевых слов на лучший результат расчитывать не стоит, мне кажется уж список пополнить сможет любой желающий. Так же предлагал частотный метод, молчок
Насчёт скрипта то что сдесь плохого никак не пойму, одни плюсы с моей точки зрения, допустим если расмотреть его возможности то он с лихвой может заменить все компоненты из вкладки "Строки" большинство компонентов "Файлы", "Система", "Логика", "Массивы", "Базы данных". Так же без проблем может работать с сом обьектами ворда экселя и акцесса. Любой желающий может освоить практически за месяц. (что не скажешь про Delphi + KOL)

Ещё пример Вам lev приводил, пакет на VBScript (для WSO), у этой библиотеки довольно приличные возможности.
карма: 4
Мой форум - http://hiasm.bbtalk.me/ схемы, компоненты...
0
Разработчик
Ответов: 26303
Рейтинг: 2146
#23: 2009-04-02 08:52:10 ЛС | профиль | цитата
andrestudio писал(а):
Насчёт скрипта то что сдесь плохого никак не пойму

Быстродействие страдает, и очень сильно, в сравнении, с тем же Delphi.
карма: 22

0
Ответов: 5227
Рейтинг: 587
#24: 2009-04-02 09:28:55 ЛС | профиль | цитата
nesco, интепритаторы всегда этим отличаются. Не сказать что в ряде случаев это столь важно или необходимо. Этот скриптовый движок создавался в первую очередь для системного администрирования и считаю это вполне удачной реализацией.
карма: 4
Мой форум - http://hiasm.bbtalk.me/ схемы, компоненты...
0
Ответов: 3514
Рейтинг: 184
#25: 2009-04-02 10:33:15 ЛС | профиль | цитата
Мне совершенно не нравится технология, по которой определяется кодировка.
Она может определить лишь то, что задано.
карма: 0
0
Ответов: 5227
Рейтинг: 587
#26: 2009-04-02 10:50:39 ЛС | профиль | цитата
Астрамак, предлагай что хотелось бы.
карма: 4
Мой форум - http://hiasm.bbtalk.me/ схемы, компоненты...
0
Ответов: 16884
Рейтинг: 1239
#27: 2009-04-02 10:52:08 ЛС | профиль | цитата
nesco писал(а):
Быстродействие страдает, и очень сильно, в сравнении, с тем же Delphi.
У тебя есть хорошее выражение - "Не смешите мои тапочки"
Оно тебе это быстродействие нужно ?
Грубо говоря - только при динамической графике при создании игр. Так там и Delphi нико не применяет.
И прав andrestudio, когда говорит, что
andrestudio писал(а):
Не сказать что в ряде случаев это столь важно или необходимо
Я бы даже сказал, что в большинстве случаев быстродействие совершенно не важно и совсем не необходимо.
карма: 25
Немного терпения! Дежурный экстрасенс скоро свяжется с Вами!
0
Ответов: 3514
Рейтинг: 184
#28: 2009-04-02 11:31:52 ЛС | профиль | цитата
http://www.mozilla.org/projects/intl/UniversalCharsetDetection.html
карма: 0
0
Ответов: 1304
Рейтинг: 405
#29: 2009-04-02 19:24:57 ЛС | профиль | цитата
andrestudio, может я не совсем явно выразился, но хотел сказать имея под рукой достаточно хороших примеров и задачу легко решаемую с помощью VBScript, можно разобраться что к чему, или хотябы переделать пример под свои нужды. И видел только плюсы .
карма: 3

0
Ответов: 5227
Рейтинг: 587
#30: 2009-04-02 19:35:25 ЛС | профиль | цитата
MAV, у тебя мышка конкретно изношена
(пора уже защиту на сайте делать от дублей)
карма: 4
Мой форум - http://hiasm.bbtalk.me/ схемы, компоненты...
0
Сообщение
...
Прикрепленные файлы
(файлы не залиты)