HiAsm

Форумы Компоненты Компонент для программ в области лингвистики. ← Ctrl1 234Ctrl →

Ответов: 2059

Рейтинг: 133

#1: 2013-10-28 19:26:27 ЛС | профиль | цитата

Мне вот нужно выделять именительный падеж слова, например во фразе: окраска корпуса, нужно выделить слово "корпус", или: замена правого уха - чтоб выдавал - правое ухо

В отношении поиска примерно так.
Только это упрощённо. На самом деле в поисковиках делается целая надстройка для понимания текста.
Это конкорданс-список слов какого-л. текста с указанием контекстов их употребления, тезаурус-множество смысловыражающих единиц некоторого языка с заданной на нём системой семантических отношений и много чего ещё. Этим и отличаются поисковики друг от друга, и держится это всё в секрете.
Один вывалит тысячи ссылок, но бестолковых, а другой две-три, но то, что доктор прописал.

где это можно в реальной жизни использовать,

Этот компонент - элементарный "кирпичик" для программ обработки текста.
Можно делать поиск по тексту не по совпадению строк, а по смыслу.
"Мне заменили в поликлинике левое ухо, а надо было на машине - правое."
Запрос - "замена правого уха".
Определение принадлежности текста к тому, или иному автору.
У меня есть даже такая программка на Си, использующая эти dll.
Я приводил ссылки выше, где можно использовать. Набери в поисковике "Лингвистические технологии". Всё что вывалится, нельзя реализовать без главного элемента.
Я использую так:
Качаю кучу книг и слушаю с помощью TTS движка. Как известно, все голосовые движки не дружат с ударениями, а тем более с омографами.
Например: погру`зите-погрузи`те, вы`сыпалась-высыпа`лась, за`мок-замо`к, верте`ла -вертела` и т.д. Так при помощи программы, за минуту, ставлю ударения в десятке книг.
Я пробую, какие темы интересны. В стволе ещё две темы:- dll внутри кода программы и компонент Speech надо бы переделать, Не работает ни шута

карма: 6

Форумы Компоненты Компонент для программ в области лингвистики. ← Ctrl1 234Ctrl →