Ну и что работает у кого это или нет? или на частотном методе делать?
Этот топик читают: Гость
|
Ответов: 5227
Рейтинг: 587
|
|||
| карма: 4 |
|
|
Ответов: 3514
Рейтинг: 184
|
|||
|
Заявленные - определяет
|
|||
| карма: 0 |
|
|
Ответов: 5227
Рейтинг: 587
|
|||
|
Астрамак писал(а): Заявленные - определяетТак кто может предоставить список ключевых слов для проверки кодировок (чем больше тем лучше) тот сразу получает улучшеную версию где сняты ограничения на входной обьём слов и словосочетаний. Меня интересует вот такие строки (распространнёных слов) можно применять и одиночные и тройные и четвертные (только очень внимательно следить за DOS кодировкой, одиночный символ должен обезательно быть печатаемым, т.е видимым) и все строки вместе с Case должны иметь одинаковую длинну. |
|||
| карма: 4 |
|
|
Ответов: 215
Рейтинг: 45
|
|||
|
1) Набор слов не очень удачный, я для теста дополнил набор однобуквенными предлогами/союзами "а","в","и","к","о","с","у" - распознавание улучшилось, если добавить двух-трёхбуквенные ("по","на", "над", "при" и т.п.), думаю оно ещё сильнее возрастёт
2) строка для кодировки intCp866 ("¤ ","Ґв","Є Є","зв®","祬","‚л","‚ б","¤«п","ўбҐ","ў","Є","®","б") имхо неудачна, т.к. образцы содержат пробелы, а мы делаем массив по сплиттеру "пробел", и соответственно заведомо не получим совпадений этих слов. ------ пока печатал, ты уже ответил в ту же тему имхо одинаковость длин строк Case не обязательна, пусть себе растут счётчики неравномерно, не думаю, что это сильно скажется |
|||
| карма: 0 |
|
|
Ответов: 5227
Рейтинг: 587
|
|||
|
lev, согласен стобой полностью, но
lev писал(а): одинаковость длин строк Case не обязательнакак и обещал улучшеный вариант |
|||
| карма: 4 |
| ||
| файлы: 1 | autocodepage.sha [2.4KB] [252] | ||
| Голосовали: | MAV |
|
Ответов: 1304
Рейтинг: 405
|
|||
|
andrestudio, прописанные кодировки определяет в пределах размера текста ~1кб. Надо думаю заменить сообщение c.p.1251 на c.p.-не определена, если длина текста мала или не прописана определяемая страница.
------------ Дoбавленo: andrestudio, а вобще скоро путём ненавязчивого воздействия заставишь всех разбираться в VBScript ------------ Дoбавленo: Просматривал кто автоматом определит c.p. , победителем оказался AkelPad, определял по одной букве |
|||
| карма: 3 |
|
|
Ответов: 5227
Рейтинг: 587
|
|||
|
MAV писал(а): Надо думаю заменить сообщение c.p.1251 на c.p.-не определена, если длина текста мала или не прописана определяемая страница.я бы лучше ручной метод добавил и достаточно. MAV, естественно что с таким маленьким набором ключевых слов на лучший результат расчитывать не стоит, мне кажется уж список пополнить сможет любой желающий. Так же предлагал частотный метод, молчок Насчёт скрипта то что сдесь плохого никак не пойму, одни плюсы с моей точки зрения, допустим если расмотреть его возможности то он с лихвой может заменить все компоненты из вкладки "Строки" большинство компонентов "Файлы", "Система", "Логика", "Массивы", "Базы данных". Так же без проблем может работать с сом обьектами ворда экселя и акцесса. Любой желающий может освоить практически за месяц. (что не скажешь про Delphi + KOL) Ещё пример Вам lev приводил, пакет на VBScript (для WSO), у этой библиотеки довольно приличные возможности. |
|||
| карма: 4 |
|
|
Разработчик
Ответов: 26322
Рейтинг: 2147
|
|||
|
andrestudio писал(а): Насчёт скрипта то что сдесь плохого никак не поймуБыстродействие страдает, и очень сильно, в сравнении, с тем же Delphi. |
|||
| карма: 22 |
|
|
Ответов: 5227
Рейтинг: 587
|
|||
|
nesco, интепритаторы всегда этим отличаются. Не сказать что в ряде случаев это столь важно или необходимо. Этот скриптовый движок создавался в первую очередь для системного администрирования и считаю это вполне удачной реализацией.
|
|||
| карма: 4 |
|
|
Ответов: 3514
Рейтинг: 184
|
|||
|
Мне совершенно не нравится технология, по которой определяется кодировка.
Она может определить лишь то, что задано. |
|||
| карма: 0 |
|
|
Ответов: 5227
Рейтинг: 587
|
|||
|
Астрамак, предлагай что хотелось бы.
|
|||
| карма: 4 |
|
|
Ответов: 16884
Рейтинг: 1239
|
|||
|
nesco писал(а): Быстродействие страдает, и очень сильно, в сравнении, с тем же Delphi.Оно тебе это быстродействие нужно ? Грубо говоря - только при динамической графике при создании игр. Так там и Delphi нико не применяет. И прав andrestudio, когда говорит, что andrestudio писал(а): Не сказать что в ряде случаев это столь важно или необходимо |
|||
| карма: 25 |
|
|
Ответов: 3514
Рейтинг: 184
|
|||
|
http://www.mozilla.org/projects/intl/UniversalCharsetDetection.html
|
|||
| карма: 0 |
|
|
Ответов: 1304
Рейтинг: 405
|
|||
|
andrestudio, может я не совсем явно выразился, но хотел сказать имея под рукой достаточно хороших примеров и задачу легко решаемую с помощью VBScript, можно разобраться что к чему, или хотябы переделать пример под свои нужды. И видел только плюсы
|
|||
| карма: 3 |
|
|
Ответов: 5227
Рейтинг: 587
|
|||
|
MAV, у тебя мышка конкретно изношена
(пора уже защиту на сайте делать от дублей) |
|||
| карма: 4 |
|



Поиск
Друзья
Администрация