Вверх ↑
Ответов: 2059
Рейтинг: 132
#1: 2022-09-28 22:54:34 ЛС | профиль | цитата
Sersey писал(а):
У гугла и яндекса есть API для Word2vec, буду разбираться

Не стоит тратить времени.
Скачать и посмотреть, что это такое, можно здесь: https://nlpub.ru/Russian_Distributional_Thesaurus - делал базу на SQLite, чтобы такую картинку сделать.
А какая задача?
Морфологический и синтаксический анализ - это одно, а тезаурус и семантический анализ совсем другое.
https://www.labinform.ru/pub/ruthes/te/16/010/188565.htm https://labinform.ru/pub/ruwordnet/index.htm - есть в наличие.
Смысл<=>Текст тоже есть(нигде не купишь достанешь.)
Есть Томита-парсер https://yandex.ru/dev/tomita/
Есть различные сетки заточенные под это дело от FANN до самоорганизующихся карт Кохонена и сети Хопфилда.
https://sbercloud.ru/ru/datahub/rugpt3family/demo-ru-gpt3-xl
https://disk.yandex.ru/d/gh_X68tAJlfKsg
https://disk.yandex.ru/d/oq0ARaw8NK9-qQ
Чего нужно выложу.
а мне иврит нужен

Сумниваюсь я, что такое существует в природе!
Трудозатраты не менее десятка лет!
P.S.
Кто этим занимается, все друг друга по именам знают во всех странах. (и меня тоже).
Нет у меня таких знакомых.
карма: 6

0
Редактировалось 6 раз(а), последний 2022-09-28 23:25:18