Вверх ↑
Ответов: 2059
Рейтинг: 131
#1: 2019-07-01 01:47:32 ЛС | профиль | цитата
В заголовке темы помещён архив программы для лингвистического поиска.
Описание

Лигвистический поиск это поиск всех словоформ слова и слов, которые с ним связаны зависимостями по простой форме слова - лемме, по морфологическим атрибутам и словоформе.
1. При поиске по лемме надо задать простую форму слова, например "туннель", по этой маске будут найдены все формы этого слова в тексте во всех родах, склонениях, падежах и числе.
Пример выводимого результата:
в 12 28 30
туннеле 30 22 19 1 35
коротком 30 22 19 3 35
-----------------------
конец 25 22 19 1 35
туннеля 26 22 19 1 35
-----------------------
в 12 28 30
туннель 28 22 19 1 35
большой 28 22 19 3 35
поперечный 28 22 19 3 35
-----------------------
по 12 27
туннелю 27 22 19 1 35
-----------------------
Принадлежность к одному предложению обозначена чертой.
Первым, если оно есть, идёт сочинённое слово.
Два и больше слов в одной строке означает, что они равнозначны.
-----------------------
туннелем 29 22 19 1 35 потолком 29 22 19 1 35
и 11
в 12 28 30
-----------------------
Ниже искомого слова расположены подчинённые слова.
2. Поиск по форме, это как обычный поиск, только результат будет со связанными словами.
3. Поиск по морф. атрибутам, это поиск, где маска задаётся в таком виде: 40 36 31 20 2 21 33 41
Это морфологические атрибуты слова. Они есть в справке. Кнопочка с "?".
Очерёдность написания не имеет значения.
То-есть по этой маске будут найдены все:
глаголы прошедшего времени, финитивной формы, множественного числа, изъявительного наклонения, мужского рода, первого лица, активного залога.
При маске "2" - будут найдены все глаголы.

Остальное, думаю, и так всё понятно.
Гораздо фукциональней и наглядней можно сделать на компоненте Scintilla, особенно с методом вставки аннотаций между строк и выделением цветами слов, но не стал усложнять.
Компоненты я выкладывал уже не один раз. Если надо, выложу ещё.
Хочу добавить компонент для склонения-спряжения, но не то, что делают для склонения имён, фамилий и отчеств.
P.S.
Файлы форматов: AZW, AZW3, CHM, DOC, DOCX, EPUB, FB2, HTML, MHT, MOBI, ODT, PDF, PRC, RTF, TXT перетащить на форму.
карма: 6

0
Редактировалось 9 раз(а), последний 2019-07-01 02:26:14