Транслит в кодировку

Вверх ↑

Форумы Новые компонентыТранслит в кодировку ← Ctrl1 2 3 4 56Ctrl →

Этот топик читают: Гость

Ответов: 16884

Рейтинг: 1240

#76: 2012-03-10 22:52:17 ЛС | профиль | цитата

nesco писал(а):

для английчского языка

чумачедчая весна

карма: 25

Немного терпения! Дежурный экстрасенс скоро свяжется с Вами!

Ответов: 3889

Рейтинг: 362

#77: 2012-03-10 22:54:29 ЛС | профиль | цитата

nesco писал(а):

чем может помочь таблица, когда там кириллица, она для RU -> EN пойдет

nesco, 31.162.65.11, ребята, что-то Вы запраздновались. Частота встречаемости сочетаний из ТРАНСЛИТНОГО "английского" равна частоте встречаемости букв оригинала, из которого он получался, то есть - русского

карма: 1

Голосовали:

Tad

Разработчик

Ответов: 26355

Рейтинг: 2151

#78: 2012-03-10 23:21:31 ЛС | профиль | цитата

1nd1g0 писал(а):

Частота встречаемости сочетаний из ТРАНСЛИТНОГО "английского" равна частоте встречаемости букв оригинала, из которого он получался, то есть - русского

Разумничались тут, пнимаешь, может и ошибся где

Я уже отписал, что алгоритму пофиг, он все замены сканирует, сколько бы их не было, и как бы они не встречались. Если вы мне докажете обратное, то я с радостью приму уточнения. Лучше бы сказали, чем вопросы заменить

карма: 23

Ответов: 3889

Рейтинг: 362

#79: 2012-03-10 23:37:42 ЛС | профиль | цитата

nesco писал(а):

Лучше бы сказали, чем вопросы заменить

ju = жу\ю;
ji = жи;

У него специфический транслит.
Кстати, про сортировку. Общий принцип "самые длинные цепочки - первыми" в примере - правильный. Списков условно можно разделить на несколько последовательных: список четырёхбуквенных сочетаний, список трёхбуквенных, двух и однобуквенный список. Каждый отсортирован по Tad'у. Делать это нужно из-за того, что сочетания содержаться друг в друге и длинные будут повреждены при бездумной замене составляющих их букв. Это на всякий случай, если кому-то придёт в голову реализовывать алгоритм со всеми оптимизациями.

карма: 1

Разработчик

Ответов: 26355

Рейтинг: 2151

#80: 2012-03-10 23:49:10 ЛС | профиль | цитата

1nd1g0 писал(а):

Общий принцип "самые длинные цепочки - первыми" в примере - правильный

Так это и есть одна из особенностей MultiReplac-a

карма: 23

Форумы Новые компонентыТранслит в кодировку ← Ctrl1 2 3 4 56Ctrl →


Сообщение ...
Прикрепленные файлы (файлы не залиты)