Вверх ↑
Ответов: 2059
Рейтинг: 131
#1: 2016-02-06 16:31:02 ЛС | профиль | цитата
tom-it,
Вопрос философический... , но тема интересная. ( Я бы её выделил в отдельный пост, а не DB).
База данных не поможет - этот не паспортный стол. Можно прилепить конечно к автору биографию, что о нем люди говорят, даже аннотации на книги.
Кстати это можно и нужно, можно пофилосовствовать на эту тему...
Столкнулся с подобной проблемой, но забросил. Вернее затянула задача лингвистического поиска.
Ведь поиск в интернете не то-же самое, что по книгам или интересующей тематике (в абстрактном понятии). Поисковики обучаются "ассоциативности" на частоте запросов. Например Томита-парсер - Яндекса, или Word2Vec.
В примере можно найти ссылки по этой тематике. Конечно, кроме интернет ссылок ничего не будет работать, потому что у тебя нет этого на компьютере.
https://yadi.sk/d/egXAbmhlhv2df - ногами не бить! Для себя делал макет. Для пробы надо начать новое дерево. А базу с таблицами даже не знаю куда всунуть.
1. Представление информации в виде дерева удобней и наглядней чем таблица.
Беда в том, что в KOL не списки = деревья, а массивы, со всеми вытекающими.
(по этой причине для себя делаю компоненты на библиотеках delphi4 и переделываю существующие компоненты. Временно можно паралельно SYSUTILS.PAS, CLASSES.PAS...)
2. Нужен лингвистический поиск. Для этого нужен синтаксический парсер, а для этого нужен морфологический анализатор, а для этого ...
Примерно так: http://kelijah.livejournal.com/107478.html
Графика не обязательна, достаточно дерева в памяти (есть рабочие схемы).
Кое что выкладывал, доработал, есть в стволе.
3. Что касается библиотеки - то мне кажется лучше всего делать реферат по книге.
Но не такой как здесь http://www.analyst.ru/index.php?lang=rus&dir=content/downloads/ по частотности од. сущ. + ( два а-три слова в предложении вместе с ним),
а по синтаксическим связям (даже и через абзацы - проверено, строится дерево) + Тезаурус + Word2Vec утилиты.
Пробные макеты работают 30сек. - 2мин. Не от объёма, а от сложности. Чем больше объём, тем "понятней" смысл.
Делал так:
1. Делаю список книг со словом "пещеры" приводя к простой форме "пещера", т.е. пещерой=пещера. Поиск пещеры.
2. По этому списку отсеиваю книги со словом "внеземной" = внеземная, внеземным и т.д. Ищу внеземной, приводя слова к простой форме.
3. Можно ещё сократить по какому-то слову.
4. Делаю реферат-аннотацию 30сек. - 2мин на книгу.
карма: 6

0