Ну и что работает у кого это или нет? или на частотном методе делать?
Этот топик читают: Гость
Ответов: 5227
Рейтинг: 587
|
|||
карма: 4 |
|
Ответов: 3514
Рейтинг: 184
|
|||
Заявленные - определяет
|
|||
карма: 0 |
|
Ответов: 5227
Рейтинг: 587
|
|||
Астрамак писал(а): Заявленные - определяетТак кто может предоставить список ключевых слов для проверки кодировок (чем больше тем лучше) тот сразу получает улучшеную версию где сняты ограничения на входной обьём слов и словосочетаний. Меня интересует вот такие строки (распространнёных слов)
можно применять и одиночные и тройные и четвертные (только очень внимательно следить за DOS кодировкой, одиночный символ должен обезательно быть печатаемым, т.е видимым) и все строки вместе с Case должны иметь одинаковую длинну. |
|||
карма: 4 |
|
Ответов: 215
Рейтинг: 45
|
|||
1) Набор слов не очень удачный, я для теста дополнил набор однобуквенными предлогами/союзами "а","в","и","к","о","с","у" - распознавание улучшилось, если добавить двух-трёхбуквенные ("по","на", "над", "при" и т.п.), думаю оно ещё сильнее возрастёт
2) строка для кодировки intCp866 ("¤ ","Ґв","Є Є","зв®","祬","‚л","‚ б","¤«п","ўбҐ","ў","Є","®","б") имхо неудачна, т.к. образцы содержат пробелы, а мы делаем массив по сплиттеру "пробел", и соответственно заведомо не получим совпадений этих слов. ------ пока печатал, ты уже ответил в ту же тему ![]() имхо одинаковость длин строк Case не обязательна, пусть себе растут счётчики неравномерно, не думаю, что это сильно скажется |
|||
карма: 0 |
|
Ответов: 5227
Рейтинг: 587
|
|||
lev, согласен стобой полностью, но
lev писал(а): одинаковость длин строк Case не обязательнакак и обещал улучшеный вариант |
|||
карма: 4 |
| ||
файлы: 1 | autocodepage.sha [2.4KB] [229] | ||
Голосовали: | MAV |
Ответов: 1304
Рейтинг: 405
|
|||
andrestudio, прописанные кодировки определяет в пределах размера текста ~1кб. Надо думаю заменить сообщение c.p.1251 на c.p.-не определена, если длина текста мала или не прописана определяемая страница.
------------ Дoбавленo: andrestudio, а вобще скоро путём ненавязчивого воздействия заставишь всех разбираться в VBScript ![]() ------------ Дoбавленo: Просматривал кто автоматом определит c.p. , победителем оказался AkelPad, определял по одной букве ![]() |
|||
карма: 3 |
|
Ответов: 5227
Рейтинг: 587
|
|||
MAV писал(а): Надо думаю заменить сообщение c.p.1251 на c.p.-не определена, если длина текста мала или не прописана определяемая страница.я бы лучше ручной метод добавил и достаточно. MAV, естественно что с таким маленьким набором ключевых слов на лучший результат расчитывать не стоит, мне кажется уж список пополнить сможет любой желающий. Так же предлагал частотный метод, молчок ![]() Насчёт скрипта то что сдесь плохого никак не пойму, одни плюсы с моей точки зрения, допустим если расмотреть его возможности то он с лихвой может заменить все компоненты из вкладки "Строки" большинство компонентов "Файлы", "Система", "Логика", "Массивы", "Базы данных". Так же без проблем может работать с сом обьектами ворда экселя и акцесса. Любой желающий может освоить практически за месяц. (что не скажешь про Delphi + KOL) Ещё пример Вам lev приводил, пакет на VBScript (для WSO), у этой библиотеки довольно приличные возможности. |
|||
карма: 4 |
|
Разработчик
Ответов: 26303
Рейтинг: 2146
|
|||
andrestudio писал(а): Насчёт скрипта то что сдесь плохого никак не поймуБыстродействие страдает, и очень сильно, в сравнении, с тем же Delphi. |
|||
карма: 22 |
|
Ответов: 5227
Рейтинг: 587
|
|||
nesco, интепритаторы всегда этим отличаются. Не сказать что в ряде случаев это столь важно или необходимо. Этот скриптовый движок создавался в первую очередь для системного администрирования и считаю это вполне удачной реализацией.
|
|||
карма: 4 |
|
Ответов: 3514
Рейтинг: 184
|
|||
Мне совершенно не нравится технология, по которой определяется кодировка.
Она может определить лишь то, что задано. |
|||
карма: 0 |
|
Ответов: 5227
Рейтинг: 587
|
|||
Астрамак, предлагай что хотелось бы.
|
|||
карма: 4 |
|
Ответов: 16884
Рейтинг: 1239
|
|||
nesco писал(а): Быстродействие страдает, и очень сильно, в сравнении, с тем же Delphi.![]() Оно тебе это быстродействие нужно ? Грубо говоря - только при динамической графике при создании игр. Так там и Delphi нико не применяет. И прав andrestudio, когда говорит, что andrestudio писал(а): Не сказать что в ряде случаев это столь важно или необходимо |
|||
карма: 25 |
|
Ответов: 3514
Рейтинг: 184
|
|||
http://www.mozilla.org/projects/intl/UniversalCharsetDetection.html
|
|||
карма: 0 |
|
Ответов: 1304
Рейтинг: 405
|
|||
andrestudio, может я не совсем явно выразился, но хотел сказать имея под рукой достаточно хороших примеров и задачу легко решаемую с помощью VBScript, можно разобраться что к чему, или хотябы переделать пример под свои нужды. И видел только плюсы
![]() |
|||
карма: 3 |
|
Ответов: 5227
Рейтинг: 587
|
|||
MAV, у тебя мышка конкретно изношена
![]() (пора уже защиту на сайте делать от дублей) |
|||
карма: 4 |
|