Sersey писал(а):
У гугла и яндекса есть API для Word2vec, буду разбиратьсяНе стоит тратить времени.
Скачать и посмотреть, что это такое, можно здесь: https://nlpub.ru/Russian_Distributional_Thesaurus - делал базу на SQLite, чтобы такую картинку сделать.
А какая задача?
Морфологический и синтаксический анализ - это одно, а тезаурус и семантический анализ совсем другое.
https://www.labinform.ru/pub/ruthes/te/16/010/188565.htm https://labinform.ru/pub/ruwordnet/index.htm - есть в наличие.
Смысл<=>Текст тоже есть(нигде не
Есть Томита-парсер https://yandex.ru/dev/tomita/
Есть различные сетки заточенные под это дело от FANN до самоорганизующихся карт Кохонена и сети Хопфилда.
https://sbercloud.ru/ru/datahub/rugpt3family/demo-ru-gpt3-xl
https://disk.yandex.ru/d/gh_X68tAJlfKsg
https://disk.yandex.ru/d/oq0ARaw8NK9-qQ
Чего нужно выложу.
а мне иврит нужен
Сумниваюсь я, что такое существует в природе!
Трудозатраты не менее десятка лет!
P.S.
Кто этим занимается, все друг друга по именам знают во всех странах. (и меня тоже).
Нет у меня таких знакомых.