HiAsm

Форумы Новые компоненты Лингвистические программы и компоненты к ним. ← Ctrl12 3 4Ctrl →

Ответов: 2059

Рейтинг: 132

#1: 2022-09-28 22:54:34 ЛС | профиль | цитата

Sersey писал(а):

У гугла и яндекса есть API для Word2vec, буду разбираться

Не стоит тратить времени.
Скачать и посмотреть, что это такое, можно здесь: https://nlpub.ru/Russian_Distributional_Thesaurus - делал базу на SQLite, чтобы такую картинку сделать.
А какая задача?
Морфологический и синтаксический анализ - это одно, а тезаурус и семантический анализ совсем другое.
https://www.labinform.ru/pub/ruthes/te/16/010/188565.htm https://labinform.ru/pub/ruwordnet/index.htm - есть в наличие.
Смысл<=>Текст тоже есть(нигде не ~~купишь~~ достанешь.)
Есть Томита-парсер https://yandex.ru/dev/tomita/
Есть различные сетки заточенные под это дело от FANN до самоорганизующихся карт Кохонена и сети Хопфилда.
https://sbercloud.ru/ru/datahub/rugpt3family/demo-ru-gpt3-xl
https://disk.yandex.ru/d/gh_X68tAJlfKsg
https://disk.yandex.ru/d/oq0ARaw8NK9-qQ
Чего нужно выложу.

а мне иврит нужен

Сумниваюсь я, что такое существует в природе!
Трудозатраты не менее десятка лет!
P.S.
Кто этим занимается, все друг друга по именам знают во всех странах. (и меня тоже).
Нет у меня таких знакомых.

карма: 6

Редактировалось 6 раз(а), последний 2022-09-28 23:25:18

Форумы Новые компоненты Лингвистические программы и компоненты к ним. ← Ctrl12 3 4Ctrl →