Модули за препознавање гласа: радни поступак и примене

Испробајте Наш Инструмент За Елиминисање Проблема





Напредак технологије развио је интелигентну технику интерфејса човек-машина која олакшава управљање рачунарима или машинама или роботима помоћу гласовних команди човека без употребе било каквих система уноса, као што су тастатуре или миш. Овај интерфејс човек-машина (ХМИ) може се постићи коришћењем препознавање гласа модула. У овом чланку ћемо размотрити модуле препознавања гласа заједно са њиховим радним поступком и апликацијама.

Гласовни модул

Гласовни модул



Модул за препознавање гласа

Препознавање гласа је техника која омогућава природно и погодно коришћење интерфејс човек-машина помоћу модула за препознавање гласа. Издваја и анализира гласовне особине човека испоручене на машину или рачунар путем микрофона. Техника препознавања гласа класификује се у многе типове на основу различитих критеријума, попут опсега корисника, броја речи коришћених за препознавање, природности говора. Ако је ниво препознавања гласа већи од 95%, тада се практично користи само препознавање гласа.


Принцип рада модула за препознавање гласа

ХМ2007 је један чип ЦМОС модул за препознавање гласа. То је интегрисани круг великих димензија, интегрисани аналогни чип са аналогном анализом гласа, препознавањем говора и процесима управљања препознавањем гласа. ХМ2007 може се управљати у два начина: ручном режиму и режиму управљања процесором.



ХМ2007

ХМ2007 дијаграм пин

У ручном режиму рада, модул за препознавање гласа ХМ2007 користи се за изградњу једноставног система препознавања повезивањем компонената као што су тастатура, СРАМ од 8 КБ бајта и друге компоненте. Ако је напајање укључено, тада ХМ2007 започиње процес иницијализације и, ако је ВАИТ пин Л, тада ХМ2007 проверава спољну меморију: 8Кбите СРАМ - да ли је савршена или не. Али, ако је ВАИТ Х, тада ће поступак провере меморије прескочити ХМ2007. Након овог процеса иницијализације, ХМ2007 прелази у режим препознавања. У режиму препознавања, ако је ВАИТ пин Х, тада је ХМ2007 спреман да прихвати глас и започиње поступак препознавања. Ако је ВАИТ пин Л, онда ХМ2007 не прихвата глас који треба препознати. Две операције које се изводе помоћу функцијских тастера су ТРН и ЦЛР. Сви обрасци у ХМ2007 могу се обрисати уносом нумеричког тастера 99 и притиском на ЦЛР.

У режиму рада ЦПУ контроле, у овом режиму је обезбеђено неколико функција као што су РЕЦОГ, ТРАИН, РЕСУЛТ, УПЛОАД, ДОВНЛОАД, РЕСЕТ функције модула за препознавање гласа ХМ2007. Слично ручном режиму рада, у овом режиму се такође укључују, препознавање, обука, резултујуће, отпремање, преузимање и ресетовање на основу различитих критеријума.

Примене модула за препознавање гласа

Роботско возило са гласовним управљањем

Комплет за управљање роботским возилима са гласовним управљањем

Комплет за управљање роботским возилима са гласовним управљањем

Гласовно контролисано роботско возило са системом за препознавање говора на велике удаљености дизајнирано је да се њиме управља помоћу интерфејса човек-машина и гласовним командама за даљинско управљање роботским возилом. Ан 8051 микроконтролер користи се заједно са модулом за препознавање гласа или модулом за препознавање говора за постизање жељене операције. Смер кретања роботског возила може се контролисати помоћу гласовних команди или тастера. Гласовне команде РФ шаље са краја преноса ка крају пријема. Дакле, роботско возило се креће у правцу напред, назад, лево или десно на основу команди примљених од пријемника.


Блок дијаграм предајника роботског возила којим се управља гласом

Блок дијаграм предајника роботског возила којим се управља гласом

Овај покрет роботско возило у одређеном смеру може се контролисати помоћу два мотора који су повезани са микроконтролером серије 8051. РФ предајник претвара команде помоћу прекидача или гласовних команди које се претварају у кодиране дигиталне податке ради прихватљивог домета (до 200 метара) од роботског возила. Кодирани подаци примљени у кругу пријемника декодирају се да се шаљу другом микроконтролеру за погон једносмерних мотора помоћу ИЦ управљачког програма мотора за контролу смера и кретања мотора користећи декодиране податке гласовних команди.

Блок дијаграм пријемника роботског возила којим се управља гласом

Блок дијаграм пријемника роботског возила којим се управља гласом

Ово роботско возило којим се управља гласом са пројектима препознавања говора на велике даљине може се интегрисати са системом ДТМФ технологија што олакшава контролу роботског возила помоћу мобилног телефона. Ова ДТМФ технологија пружа врло велику комуникацију у поређењу са РФ технологијом - тако се роботским возилима може даљински управљати са веома велике даљине.

Круг за снимање и репродукцију гласа

АПР 9301 ИЦ

АПР 9301 ИЦ

АПР 9301 ИЦ

АПР 9301 ИЦ се састоји од 28 пинова и неотпорне флеш меморије. Омогућава снимање 100К циклуса и складиштење меморије око 100 година. За нормалан рад интегрисаног кола АПР 9301 потребни су само нисконапонски напони од 5 В и 25 мА.

Рад круга за снимање и репродукцију гласа

АПР 9301 ИЦ обавља снимање и репродукција гласа операцијама. Операција снимања се може изводити примањем гласовних сигнала помоћу доброг квалитета (било које врсте) кондензаторског микрофона повезаног на 17 и 18 пинова интегрисаног кола. Ако затворимо прекидач С1, тада се може покренути режим снимања за лако снимање гласовне поруке у трајању од 20-30 секунди. Као индикација снимања ЛЕД диода повезана на пин 25 АПР 9301 ИЦ ће трептати све док је Л пин 27 уземљен.

Круг за снимање и репродукцију гласа

Круг за снимање и репродукцију гласа

Након завршетка 20 циклуса са последњом меморијом, процес снимања се аутоматски завршава променом вредности отпорника Р1 повезаног на пинове 6 и 7 АПР 9301 ИЦ. Максимално трајање времена снимања од 20 секунди, 24 секунде и 30 секунди може се добити променом вредности отпорника Р1 на 52К, 67К и 89К, респективно.

Одељак за унос аутоматски се утишава током режима репродукције. Ако је прекидач С2 затворен, тада ће из звучника стићи порука са почетка снимљених порука. Ако су функције снимања или репродукције завршене, АПР 9301 ИЦ ће прећи у режим приправности.

Ово коло се може акумулирати на заједничкој ПЦБ. Пажљиво залемите базу АПР 9301 ИЦ тако да не дође до кратког споја између пинова интегрисаног кола. Проверите струјни круг након што га склопите на ПЦБ, а затим спојите ИЦ у базу ИЦ. Пре него што напајате круг, пажљиво проверите пин везе. 5-волтни регулатор Напајање засновано на ИЦ користи се за напајање круга. Да би се добио чист звук користи се звучник доброг квалитета од 2 инча од 8 ома. Снимање се може извршити притиском на прекидач С1. Звучне сигнале (говор или музику) микрофон преузима и прослеђује на ИЦ, при чему се гласови чувају у меморијским ћелијама. Ако затворимо прекидач С2, започиње репродукција и снимљену поруку можемо чути кроз звучник.

Модул за препознавање гласа може се користити у многим апликацијама, на пример за контролу система ваздухоплова помоћу гласовних команди пилота, за управљање моторним возилом са точковима помоћу гласовно активираног вишепроцесора, итд. Ако сте заинтересовани да сазнате више о електрични и електронски пројекти на основу модула за препознавање гласа, тада нам се можете обратити објављивањем својих коментара у одељку за коментаре испод.

Фото кредити: