Вверх ↑
Ответов: 2059
Рейтинг: 132
#1: 2013-10-28 19:26:27 ЛС | профиль | цитата
Мне вот нужно выделять именительный падеж слова, например во фразе: окраска корпуса, нужно выделить слово "корпус", или: замена правого уха - чтоб выдавал - правое ухо

В отношении поиска примерно так.
Только это упрощённо. На самом деле в поисковиках делается целая надстройка для понимания текста.
Это конкорданс-список слов какого-л. текста с указанием контекстов их употребления, тезаурус-множество смысловыражающих единиц некоторого языка с заданной на нём системой семантических отношений и много чего ещё. Этим и отличаются поисковики друг от друга, и держится это всё в секрете.
Один вывалит тысячи ссылок, но бестолковых, а другой две-три, но то, что доктор прописал.
где это можно в реальной жизни использовать,

Этот компонент - элементарный "кирпичик" для программ обработки текста.
Можно делать поиск по тексту не по совпадению строк, а по смыслу.
"Мне заменили в поликлинике левое ухо, а надо было на машине - правое."
Запрос - "замена правого уха".
Определение принадлежности текста к тому, или иному автору.
У меня есть даже такая программка на Си, использующая эти dll.
Я приводил ссылки выше, где можно использовать. Набери в поисковике "Лингвистические технологии". Всё что вывалится, нельзя реализовать без главного элемента.
Я использую так:
Качаю кучу книг и слушаю с помощью TTS движка. Как известно, все голосовые движки не дружат с ударениями, а тем более с омографами.
Например: погру`зите-погрузи`те, вы`сыпалась-высыпа`лась, за`мок-замо`к, верте`ла -вертела` и т.д. Так при помощи программы, за минуту, ставлю ударения в десятке книг.
Я пробую, какие темы интересны. В стволе ещё две темы:- dll внутри кода программы и компонент Speech надо бы переделать, Не работает ни шута
карма: 6

0