HiAsm

Вверх ↑

Форумы Помощь по среде VolumeComparator ← Ctrl1Ctrl →

Администрация

Ответов: 15295

Рейтинг: 1519

#1: 2008-10-20 22:24:03 ЛС | профиль | цитата

temp писал(а):

Может кто нить представит примеры

ExampleMediaBASSRecordStream.sha единственный на сегодня пример

temp писал(а):

поподробнее о нем рассказать?

этот элемент не стоит воспринимать очень серьезно. Его я делал только с одной единственной целью - попробовать составить на абум алгоритм распознавания голоса. С предварительным обучением естественно. Тетод прост до безобразия - если в пример выше на каждом этапе поставить вывод данных на график то можно увидеть, что там происходит:
1) детектор улавливает превышение уровня звука на 2000 единиц на протяжении не меньше чем 12000 семплов
2) полученный кусок усредняется на каждые 10 семплов(т.е. берутся первые 10 семплов и от них получается среднее арифметическое, затем следующие 10 и т.д.)
3) затем получаем примерную огибающую звукового потока(т.е. максимальную амплитуду на каждые 10 семплов)
4) два раза проводим процедуру сграживания огибающее и усреднения(для устранения высокочастотной составляющей)
5) и вот на вход VolumeComparator как раз и подается такая почти идеально гладкая(но не близкая к истине) огибающая, параметры которой и сравниет данный элемент с уже имеющимися у него в памяти

элемент выдает три параметра, по которым делается вывод о совпадении:
- "OK" - именно столько значений огибающей совпало с заданным сигналом(разница менее 10%)
- "fail" - именно столько значений огибающей не совпало с заданным сигналом(разница более 10%)
- "br" - именно столько значений огибающей не совпало по наклону кривой

на практике элемент можно обучить десятку фраз, которые при должном выговаривании впринципе достаточно неплохо распознаются.

карма: 26

https://hiasm.com

Форумы Помощь по среде VolumeComparator ← Ctrl1Ctrl →