Вверх ↑
Этот топик читают: Гость
Ответов: 2059
Рейтинг: 131
#31: 2020-08-04 19:27:32 ЛС | профиль | цитата
Tad, твоими молитвам попарился -нет штоли?
И так:
XakTalisman вы очень попали, когда не очень болит!
Шучу, всё нормалёк.
XakTalisman всё будет не, как доктор прописал, а по божески!!!
Здоровья и удачи в в начинаниях!

Не вру!
Плохо. Уже сыновья и жена звонят.
Мне надо полежать.


Завтра, завтра, не сегодня - так лентяи говорят!

Редактировалось 1 раз(а), последний 2020-08-04 19:49:41
карма: 6

0
Ответов: 2059
Рейтинг: 131
#32: 2020-08-05 13:43:58 ЛС | профиль | цитата
Прошу извинить.
Вчера был в эмоциональном состоянии и не разобрался, что не ту страницу открыл.
Попал в месиловку десантников, когда за сигаретами в магазин ходил.
карма: 6

0
Ответов: 16884
Рейтинг: 1239
#33: 2020-08-05 15:54:03 ЛС | профиль | цитата
flint2, https://www.youtube.com/watch?v=MN5ktloP_H0&feature=youtu.be
карма: 25
Немного терпения! Дежурный экстрасенс скоро свяжется с Вами!
0
Ответов: 2059
Рейтинг: 131
#34: 2020-10-20 14:36:17 ЛС | профиль | цитата
Склонение\спряжение. https://yadi.sk/d/bZ2CR-aw6vjOBQ на IC.
Переработан официальный словарь odict.csv.
Исправлены ошибки, добавлены недостающие формы, убраны дубли омонимов... убраны служебные маркеры.
В общем проведена большая работа.
Числительных, местоимений нет в словаре.
Наречия могут быть, как образованные от глагола:
облить = облитее, облитей (4 45) сравнительная степень
и прилагательного:
ясный = ясно (4), яснее(4-45) сравнительная степень,
так и отдельным пунктом, когда простая форма несклоняема:
ясно = ясно, понятно = понятно.
Где: 4 наречие, 45 сравнительная степень.
Буковку ё ставить обязательно!
Зашиты от "дурака" нет!
По этому если нет такой формы склонения\спряжения, например 44 краткая форма (пойман, красив),
то ничего выводится не будет, или будет выводится форма с теми атрибутами, которые есть у слова присутствующие в запросе.
Например у слова "боднуть", или "вбухаться" краткой формы нет.
Если существительное имеет омоним в другой части речи, например: знать - существительное и знать - глагол, то существительное в запросе надо писать с большой буквы (Знать)
Чтобы легче было въехать вот вам в помощь: https://yadi.sk/d/-Kata3SrBgw_2Q Morphology.exe
Копипастим предложение и двигая ползунок получаем атрибуты слова и простую форму.
Копипастим оттуда морф атрибуты и простую форму без пробела перед словом.

В следующий раз выложу процессор смыслов по модели «Смысл <=> Текст», который строит предложения по заданной формуле смысла
(Х = OPER1(S0(X)) + S0(X) = OPER2(S0(X)) + S0(X) и тому подобным формулам)
и системе понятий тезауруса https://yadi.sk/d/gVQ8IkVMofU9Gg
виды смыслов

....
Иван читает только журналы. = Иван не читает ничего, кроме журналов.

(1) ‘Тот факт, что температура атмосферного воздуха внезапно стала намного меньше, был причиной того, что молодые растения, предназначенные для пересадки в другое место или недавно в него пересаженные, перестали существовать’.
(1а) Резкое похолодание вызвало гибель саженцев.
(3а) Резкое похолодание было причиной гибели саженцев,
(3б) Гибель саженцев была следствием резкого похолодания,
(3в) Резкое похолодание погубило саженцы,
(3г) Саженцы погибли из-за резкого похолодания,
(3д) Гибель саженцев была вызвана резким похолоданием,
(3е) Резкое похолодание привело к гибели саженцев,
(3ж)Гибель саженцев проистекла из-за резкого похолодания и т.п.

S0 – отглагольное существительное, сохраняющее лексическое значение исходного глагола: S0 (атаковать) = атака, S0 (контролировать) = контроль, S0 (стыдиться) = стыд и т.п.
(6а) А1 контролирует [X] А2,
(6б) А1 осуществляет [OPER1] контроль [S0(X)] А2,
(6в) А2 подвергается [OPER2] контролю [S0(X)] (со стороны) А1.

Ситуации:
Слово кровь связано со следующими ситуациями:
кровообращение, кровотечение, пачканте кровью, донорство.
А-кто продаёт В-кому С-что за 10 Д-стоимость.
или A - кто В - кого C -куда D - откуда, Е - на какой срок и F - с какой целью.
Возможны ситуации из одного слова: дождь, морозит.

Полагать=по мнению, как полагает.
Активация правых сил сопровождало усиление репрессий=Вместе с активацией правых сил усиливаоись репрессии.
Он был преступником=Он совершал преступления.
Докладывать=читать доклад, отчаяться=быь в отчаяньии, пажнет=тянет запахом.
....

Редактировалось 11 раз(а), последний 2020-10-21 09:28:42
карма: 6

0
Ответов: 2059
Рейтинг: 131
#35: 2020-10-21 09:31:02 ЛС | профиль | цитата
Внёс изменения для совместимости с остальными компонентами морфологии.
Словарь поправил тоже.
карма: 6

0
Ответов: 2059
Рейтинг: 131
#36: 2022-01-30 01:32:27 ЛС | профиль | цитата
Продолжаю заниматься фигнёй процедурной генерацией рассказов, сюжетов, сценариев и квестов для игр.
Для этого всего нужен хороший тезаурус. Перепробовал много готовых...
Пробовал делать так: https://disk.yandex.ru/d/HKbWMsyH1AuI_A но у меня не получилось сделать связанные двунаправленные деревья на штатных компонентах. Т.е. у дерева каждый лист может иметь множество родителей.
По этому выкладываю в таком виде: https://disk.yandex.ru/d/8elinvznyZF42g и https://disk.yandex.ru/d/zpvPgvDik5_-9w
Первый сделан по понятиям(ведь мы в душе остаёмся пацанами), второй типа WordNet. Там есть описания.
Надеюсь кому то пригодится, такого не найдёшь. Можно решать сложные смысловые задачи в текстовой области.
Например получать краткую выжимку из книг - сюжет\сценарий, или наоборот процедурно их генерировать.

P.S.
Например всё это дело будет цепляться сюда: https://disk.yandex.ru/d/lJq2cy3kc3NyLg
Это по замыслу будет инструмент для писателей и сценаристов.
Пока это набросок, но можно попробовать позагружать разные файлы - для каждой вкладки свой файл.
Дело идёт туго, сплошные согласования с писателями и сценаристами.
Да и компоненты некоторые надо делать, но это легче - потом выложу, если будет интересно.
Это я удочку закинул - развивать тему, или нет.

Редактировалось 4 раз(а), последний 2022-01-30 02:48:44
карма: 6

0
Ответов: 537
Рейтинг: 14
#37: 2022-09-28 19:03:24 ЛС | профиль | цитата
Ссылки с первого поста не работают, можете прислать компоненты и примеры лингвистических программ?
карма: 4

0
Ответов: 5227
Рейтинг: 586
#38: 2022-09-28 19:48:53 ЛС | профиль | цитата
Sersey писал(а):
Ссылки с первого поста не работают, можете прислать компоненты и примеры лингвистических программ?

flint2,
Вот истинное восприятие труда человека. (а ну быстро дай и всё, не зрасте не пожалуйста)
И говна дай и ложку принеси

Редактировалось 1 раз(а), последний 2022-09-28 20:03:59
карма: 4
Мой форум - http://hiasm.bbtalk.me/ схемы, компоненты...
0
Ответов: 537
Рейтинг: 14
#39: 2022-09-28 20:05:22 ЛС | профиль | цитата
Ага, сам уже нашел и не нужны мне эти компоненты, почитал справку, а там только русский и английский языки, а мне иврит нужен, чтобы на иврите тоже работало, значит буду пробовать Word2vec

Редактировалось 1 раз(а), последний 2022-09-28 20:08:47
карма: 4

0
Ответов: 5227
Рейтинг: 586
#40: 2022-09-28 20:08:55 ЛС | профиль | цитата
Sersey, сам бы сделал и с другими поделился вот это было бы шагом вперёд. Разницу то хоть ощущаешь
карма: 4
Мой форум - http://hiasm.bbtalk.me/ схемы, компоненты...
0
Ответов: 537
Рейтинг: 14
#41: 2022-09-28 20:10:14 ЛС | профиль | цитата
У гугла и яндекса есть API для Word2vec, буду разбираться
карма: 4

0
Ответов: 2059
Рейтинг: 131
#42: 2022-09-28 22:54:34 ЛС | профиль | цитата
Sersey писал(а):
У гугла и яндекса есть API для Word2vec, буду разбираться

Не стоит тратить времени.
Скачать и посмотреть, что это такое, можно здесь: https://nlpub.ru/Russian_Distributional_Thesaurus - делал базу на SQLite, чтобы такую картинку сделать.
А какая задача?
Морфологический и синтаксический анализ - это одно, а тезаурус и семантический анализ совсем другое.
https://www.labinform.ru/pub/ruthes/te/16/010/188565.htm https://labinform.ru/pub/ruwordnet/index.htm - есть в наличие.
Смысл<=>Текст тоже есть(нигде не купишь достанешь.)
Есть Томита-парсер https://yandex.ru/dev/tomita/
Есть различные сетки заточенные под это дело от FANN до самоорганизующихся карт Кохонена и сети Хопфилда.
https://sbercloud.ru/ru/datahub/rugpt3family/demo-ru-gpt3-xl
https://disk.yandex.ru/d/gh_X68tAJlfKsg
https://disk.yandex.ru/d/oq0ARaw8NK9-qQ
Чего нужно выложу.
а мне иврит нужен

Сумниваюсь я, что такое существует в природе!
Трудозатраты не менее десятка лет!
P.S.
Кто этим занимается, все друг друга по именам знают во всех странах. (и меня тоже).
Нет у меня таких знакомых.

Редактировалось 6 раз(а), последний 2022-09-28 23:25:18
карма: 6

0
Ответов: 537
Рейтинг: 14
#43: 2022-09-29 13:16:05 ЛС | профиль | цитата
Задача очень простая, нужно из текста узнать главные слова, о чем написан текст, это нужно для SEO
карма: 4

0
Ответов: 2059
Рейтинг: 131
#44: 2022-09-29 14:48:05 ЛС | профиль | цитата
Sersey писал(а):
Задача очень простая,

Задача очень не простая, если прикинуть хрен к носу.
С кондачка, только по API не решается!!!
Похоже кого то хотел удивить?
Попробуй через веб ресурсы, но там тоже не дураки сидят. - ктож тебе даст то(а я дам, только не оценишь), - только замануха.
Вообще, авотарка, это же не сарказм, как я понял. Не ты ли говорил, что игрушки пустое дело?
Конечно всё дам, но осмыслить сможешь, периварить всё?
Или со своей колокольни будешь судить?

Вот дядя Лёня! - уважаю!!!
Р-вняйсь!
Ирно!
Разойдись!
Можно перекурить и оправится.

https://disk.yandex.ru/d/jcTkc21peGIfFw
Но ведь опять жо - то того нет, то этого.
И снова здорово.
Наверное ресурсы нужны, где это хранить?
На github - это одно, а HiAsm - Эдакое.
Надо думать, что ресурсы иногда перемахивают за Гиг.

Ну ты не парся, не получится у тебя.
Вот и дело с концом.

Редактировалось 2 раз(а), последний 2022-09-29 17:29:38
карма: 6

0
Ответов: 5227
Рейтинг: 586
#45: 2022-09-30 08:34:13 ЛС | профиль | цитата
flint2 писал(а):
Ну ты не парся, не получится у тебя.
Вот и дело с концом.

Папа у Васи силён в математике, учится Папа за Васю весь год.
Где это видано, где это слыханно, Папа решает а Вася сдаёт
карма: 4
Мой форум - http://hiasm.bbtalk.me/ схемы, компоненты...
0
Сообщение
...
Прикрепленные файлы
(файлы не залиты)