Вверх ↑
Администрация
Ответов: 15294
Рейтинг: 1518
#1: 2008-10-20 22:24:03 ЛС | профиль | цитата
temp писал(а):
Может кто нить представит примеры

ExampleMediaBASSRecordStream.sha единственный на сегодня пример

temp писал(а):
поподробнее о нем рассказать?

этот элемент не стоит воспринимать очень серьезно. Его я делал только с одной единственной целью - попробовать составить на абум алгоритм распознавания голоса. С предварительным обучением естественно. Тетод прост до безобразия - если в пример выше на каждом этапе поставить вывод данных на график то можно увидеть, что там происходит:
1) детектор улавливает превышение уровня звука на 2000 единиц на протяжении не меньше чем 12000 семплов
2) полученный кусок усредняется на каждые 10 семплов(т.е. берутся первые 10 семплов и от них получается среднее арифметическое, затем следующие 10 и т.д.)
3) затем получаем примерную огибающую звукового потока(т.е. максимальную амплитуду на каждые 10 семплов)
4) два раза проводим процедуру сграживания огибающее и усреднения(для устранения высокочастотной составляющей)
5) и вот на вход VolumeComparator как раз и подается такая почти идеально гладкая(но не близкая к истине) огибающая, параметры которой и сравниет данный элемент с уже имеющимися у него в памяти

элемент выдает три параметра, по которым делается вывод о совпадении:
- "OK" - именно столько значений огибающей совпало с заданным сигналом(разница менее 10%)
- "fail" - именно столько значений огибающей не совпало с заданным сигналом(разница более 10%)
- "br" - именно столько значений огибающей не совпало по наклону кривой

на практике элемент можно обучить десятку фраз, которые при должном выговаривании впринципе достаточно неплохо распознаются.
карма: 26
0