Вверх ↑
Ответов: 2059
Рейтинг: 132
#1: 2019-08-27 14:16:29 ЛС | профиль | цитата
Разделитель должен быть? "'"

Не совсем понимаю.
Если строка:
абзац#абза'ц,абза'цы,абза'ца,абза'цев,абза'цу,...

то разделитель запятая.
"'" - это ударение.
Если хочешь убрать его, то в любом текстовом редакторе заменить "'" на пустую строку.
Осталось только придумать, как перебирать "All_Forms.txt", что бы найти по морфологическому анализу такое же слова.

Тоже не понимаю.
Надо перевести слова исходного текста в простую форму.
Add(MorphOn,1291859,364,322)
{
Mode=1
Point(Mode)
}
А уже по ней найти все формы по схеме, что была выше.
На самом деле мы обсуждаем отдельные куски.
Надо сначала представить себе общую конструкцию и принцип действия.
Я думаю, что должно быть так:
Исходный текст приводится к виду Лексико-семантическая информация + простая форма, или морфологическеские атрибуты. (Разделяй и властвуй!)
По ним каким-то образом обрабатывается логика вопроса, строится скелет ответа, а потом он обрастает мясом вплоть до склонений.
Если ты хчешь искать по таким словам "бежавшего", "Егорыча" - т.е. в склонении и спряжении, то придётся делать такой словарь:
яркость=r:abstr
яркости=r:abstr
яркости=r:abstr
яркостей=r:abstr
яркости=r:abstr
яркостям=r:abstr
яркость=r:abstr
яркости=r:abstr
яркостью=r:abstr
яркостями=r:abstr
яркости=r:abstr
Это хрен чего получится, даже если делать базу.
Не легче-ли так? яркость#r:abstr,яркость,яркости,яркости,яркостей,яркости,яркостям,...
В общем нужна продуманная концепция, а это всё мелочёвка.

--- Добавлено в 2019-08-27 14:46:39

что бы найти по морфологическому анализу такое же слова.

Понял. Вот справка:
1 существительное
2 глагол
3 прилагательное
4 наречие
5 числительное
6 местоимение
9 междометие
10 частица
11 союз
12 предлог
13 вводное слово (по счастью, конечно, впрочем)
14 неизменяемое слово
15 предикатив (можно, пора)
16 слово из другого языка
18 слово, состоящее из цифр
17 знак пунктуации
7 причастие (блестящее, читающий)
8 деепричастие (бегая, сидя)
19 единственное число
20 множественное число
21 женский род
22 мужской род
23 средний род
24 одушевленное
25 именительный падеж (кто, что)
26 родительный падеж (кого, чего)
27 дательный падеж (кому, чему)
28 винительный падеж (винительный падеж склонен обозначать меру или количество: кого, чего или с предлогом в)
29 творительный падеж (кем, чем)
30 предложный падеж (о ком, о чём)
31 финитная форма (казаться, слыть, стать, становиться)
32 инфинитив (бежать, смотреть)
36 прошедшее время
37 настоящее время
33 первое лицо
34 второе лицо
35 третье лицо
45 сравнительная степень (светлее, слабее)
38 повелительное наклонение (Принеси мне )
40 изъявительное наклонение (поеду, я работал)
41 активный залог (обозначающий, что подлежащее совершает действие)
42 пассивный залог (что подлежащее испытывает действие)
44 краткая форма (пойман, красив)
46 слово написано с большой буквы
47 неизвестное слово - нормализовано эвристически
Получаем:
яркость 25 19
яркости 25 20
яркости 26 19
яркостей 26 20
яркости 27 19
яркостям 27 20
яркость 28 19
яркости 28 20
яркостью 29 19
яркостями 29 20
яркости 30 19
Аналогично с другими частями речи.
Каждая строка соответствует падежу\спряжению, числу, роду и времени.

Не надо пихать несколько больших кубиков hiMorphology, для этого есть мелкие.
Все они работают по номеру слова в предложении.
Нижние точки дают номер предложения, номер слова в предложении и номера зависимых слов.
Но это уже отдельная история.
карма: 6

1
Голосовали:Vadimluk1
Редактировалось 5 раз(а), последний 2019-08-27 15:05:26