Вверх ↑
Ответов: 2059
Рейтинг: 132
#1: 2019-02-25 11:14:20 ЛС | профиль | цитата
И неужели 400 тыс слов требуют огромного быстродействия?

Да критично!
По тому, что ты будешь применять словарь 400 тыс слов к каждому слову текста, который ты собрался кодировать.
Попробуй, и у тебя среднестатистический текст в 400-500 кило будет обрабатываться 15-25 минут.
Уже проходили. Если это 10 строчек то не критично.
Всё элементарно делается:
Берётся такой компонент http://forum.hiasm.com/getfile/38613 (в архиве HashTableStringEx - он не нужен для этой задачи, просто до кучи)
Берёшь словарь Зализняка и переделываешь в такой вид.
словарь=1234
переделываешь=2135
...
и так все слова. Словарь должен получится, где-то 10-11 Мб, если меньше, то не все слова учёл.
Должно получится что-то типа этого https://yadi.sk/d/CAWdFZ2L6XldgA но без "звёздочек" и в одно слово, правая часть будет число.
Загружаешь словарь в HashTableString и подаёшь каждое слово твоего текста на doKey.
На точке onString получаешь код цвета, думаю понятно, что это строка и как чего надо переделать...
Для получения слова из цвета будет нужен обратный словарь.
1234=словарь
2135=переделываешь
...
Aziz писал(а):
Кстати, ты подсказал другую идею, уже веб-программы - сайта - видеть по цвету однокоренные слова.

flint2 писал(а):
Может он хочет представить текст книжки в цветных пятнах.
Однокоренные слова будут иметь определённый оттенок.

Для этого может пригодится второй компонент, но долго всё рассказывать...

На всякий случай, словари в архиве сделаны для компонента HashTableStringEx и не применимы для HashTableString!!! Тебе-же нужен HashTableString.
карма: 6

0
Редактировалось 3 раз(а), последний 2019-02-25 11:41:40