Вверх ↑
Этот топик читают: Гость
Ответов: 16884
Рейтинг: 1239
#76: 2012-03-10 22:52:17 ЛС | профиль | цитата
nesco писал(а):
для английчского языка
чумачедчая весна
карма: 25
Немного терпения! Дежурный экстрасенс скоро свяжется с Вами!
0
Ответов: 3889
Рейтинг: 362
#77: 2012-03-10 22:54:29 ЛС | профиль | цитата
nesco писал(а):
чем может помочь таблица, когда там кириллица, она для RU -> EN пойдет
nesco, 31.162.65.11, ребята, что-то Вы запраздновались. Частота встречаемости сочетаний из ТРАНСЛИТНОГО "английского" равна частоте встречаемости букв оригинала, из которого он получался, то есть - русского
карма: 1

1
Голосовали:Tad
Разработчик
Ответов: 26163
Рейтинг: 2127
#78: 2012-03-10 23:21:31 ЛС | профиль | цитата
1nd1g0 писал(а):
Частота встречаемости сочетаний из ТРАНСЛИТНОГО "английского" равна частоте встречаемости букв оригинала, из которого он получался, то есть - русского

Разумничались тут, пнимаешь, может и ошибся где Я уже отписал, что алгоритму пофиг, он все замены сканирует, сколько бы их не было, и как бы они не встречались. Если вы мне докажете обратное, то я с радостью приму уточнения. Лучше бы сказали, чем вопросы заменить
карма: 22

0
Ответов: 3889
Рейтинг: 362
#79: 2012-03-10 23:37:42 ЛС | профиль | цитата
nesco писал(а):
Лучше бы сказали, чем вопросы заменить

ju = жу\ю;
ji = жи;
У него специфический транслит.
Кстати, про сортировку. Общий принцип "самые длинные цепочки - первыми" в примере - правильный. Списков условно можно разделить на несколько последовательных: список четырёхбуквенных сочетаний, список трёхбуквенных, двух и однобуквенный список. Каждый отсортирован по Tad'у. Делать это нужно из-за того, что сочетания содержаться друг в друге и длинные будут повреждены при бездумной замене составляющих их букв. Это на всякий случай, если кому-то придёт в голову реализовывать алгоритм со всеми оптимизациями.
карма: 1

0
Разработчик
Ответов: 26163
Рейтинг: 2127
#80: 2012-03-10 23:49:10 ЛС | профиль | цитата
1nd1g0 писал(а):
Общий принцип "самые длинные цепочки - первыми" в примере - правильный

Так это и есть одна из особенностей MultiReplac-a
карма: 22

0
80
Сообщение
...
Прикрепленные файлы
(файлы не залиты)