Список сначала напугал
фрагмент
деривационные (словообразовательные) характеристики (например, «диминутив», «отадъективное наречие»).
Лексико-семантическая информация имеет различную структуру для разных частей речи. Кроме того, каждый из разрядов существительных - имена предметные, непредметные и собственные - имеет свою структуру помет.
Собственно лексико-семантические пометы сгруппированы по следующим полям:
таксономия (тематический класс лексемы) — для имен существительных, прилагательных, глаголов и наречий;
мереология (указание на отношения «часть — целое», «элемент — множество») — для предметных и непредметных имен;
топология (топологический статус обозначаемого объекта) — для предметных имен;
каузация — для глаголов;
служебный статус — для глаголов;
оценка — для предметных и не предметных имен, прилагательных и наречий.
Остается решить, как сделать всё и в какое время все делать.
--- Добавлено в 2019-08-23 00:10:41
В интернете пока нашел словарь Зализняка, но он не совсем по формату, наверно нужно будет его подредактировать программой.
Фрагмент словаря
а
ба
аба
кааба
баба
бой-баба
даба
жаба
раба
полнеба
треба
потреба
амёба
учёба
божба
ворожба
служба
метеослужба
дружба
тяжба
изба
триба
диатриба
лайба
шайба
планшайба
ройба
надолба
колба
ба
аба
кааба
баба
бой-баба
даба
жаба
раба
полнеба
треба
потреба
амёба
учёба
божба
ворожба
служба
метеослужба
дружба
тяжба
изба
триба
диатриба
лайба
шайба
планшайба
ройба
надолба
колба