Это другой разговор.
Дам некоторые комментарии по пунктам:
aot.ru
Это Питерский сайт.
Существует две школы - Московская и Питерская.
Отличаются не принципиальными нюансами в плане построения синтаксического дерева.
Свои arm.dll и dwf.dll я делал с ребятами из МГУ.
Отсюда и различия в дереве, если поместить текст примера в мой синтаксический анализатор.
Запятые, в моём варианте, тут заменили на AND - не суть. Нюансы проявляются в другом.
Не факт, что надо простые предложения одного сложного присоединять к главному слову первого предложения, тогда уж к абстрактному ROOT. Главным словом может быть и не сказуемое.
И может быть:
— сказуемое может быть как простым, так и сложным;
— сложное сказуемое состоит из двух и более сказуемых, имеющих одно и то же число и время;
В природе существует всего четыре программы построения синтаксического дерева, включая мою.
Самая лучшая, это у моего знакомого, про которого писал постом выше. Но она очень "тормозная".
Постараюсь найти ссылки. Очень интересно почитать про разбор редких форм предложения. По моему в Facebook-е писал.
На самом деле это всё картинки и не более. На практике важны зависимые пары слов.
Всё необходимое делает компонент hiTracerouter.
Существует две школы - Московская и Питерская.
Отличаются не принципиальными нюансами в плане построения синтаксического дерева.
Свои arm.dll и dwf.dll я делал с ребятами из МГУ.
Отсюда и различия в дереве, если поместить текст примера в мой синтаксический анализатор.
Запятые, в моём варианте, тут заменили на AND - не суть. Нюансы проявляются в другом.
Не факт, что надо простые предложения одного сложного присоединять к главному слову первого предложения, тогда уж к абстрактному ROOT. Главным словом может быть и не сказуемое.
И может быть:
— сказуемое может быть как простым, так и сложным;
— сложное сказуемое состоит из двух и более сказуемых, имеющих одно и то же число и время;
В природе существует всего четыре программы построения синтаксического дерева, включая мою.
Самая лучшая, это у моего знакомого, про которого писал постом выше. Но она очень "тормозная".
Постараюсь найти ссылки. Очень интересно почитать про разбор редких форм предложения. По моему в Facebook-е писал.
На самом деле это всё картинки и не более. На практике важны зависимые пары слов.
Всё необходимое делает компонент hiTracerouter.
tinlib.ru
Библиотеки для компонентов тоже написаны на прологе.
Я-же предлагаю оперировать абстракциями на уровне семантики и более высших порядков тоже на прологе.
На нейронных сетях у меня отрицательный опыт. Справедливей сказать, что они заточены на уровень похожести чего-то на что-то и малоуправляемы без переучивания.
Я-же предлагаю оперировать абстракциями на уровне семантики и более высших порядков тоже на прологе.
На нейронных сетях у меня отрицательный опыт. Справедливей сказать, что они заточены на уровень похожести чего-то на что-то и малоуправляемы без переучивания.
it-claim.ru
Здесь быстро не разобраться.
Ничего там сложного нет, просто корявым языком написано в стиле восьмидесятых.
Просто я намекаю, что по образу и подобию, надо попробовать автоматизировать процесс подбора слов для категорий(разбиение словаря на категории).
И делается это по текстам, а не по словарю. Например вот это я тоже не вручную делал. https://yadi.sk/d/ovVh1jXbAGfT0A
Я тоже в процессе эксперимента с категориями(понятиями).
http://www.machinelearning.ru/wiki/images/b/b3/Word2Vec.pdf - у меня не открывается.
Скачать не пробовал? habr.com (word2vec)
Вектор характеризуется величиной и направлением - направленный отрезок прямой.
Это значит, что множество векторов находящихся близко в пространстве будут понятиями.
Конц вектора - это слово. Суммарное действие правил определяют направление вектора, а частотность длину. (упрощёно)
Слова(вектора) находящиеся на границах этих областей могут принадлежать нескольким категориям(понятиям).
Таким образом мы можем с большой точностью выбирать слова лежащие на поверхности векторного поля.
Это значит, что множество векторов находящихся близко в пространстве будут понятиями.
Конц вектора - это слово. Суммарное действие правил определяют направление вектора, а частотность длину. (упрощёно)
Слова(вектора) находящиеся на границах этих областей могут принадлежать нескольким категориям(понятиям).
Таким образом мы можем с большой точностью выбирать слова лежащие на поверхности векторного поля.