Математическую модель распознавания речи, превосходящую аналоги в несколько раз, создали ученые Томского государственного университета систем управления и радиоэлектроники (ТОСУР). Разработка может стать основой комплексной системы цифровой идентификации личности, а также позволит управлять техникой с помощью голоса.
«Наш математический аппарат отличается от аналогов детальным соответствием устройству внутреннего уха человека. Вероятностные механизмы, на которых построены существующие системы распознавания речи, у нас играют только вспомогательную роль», — рассказал Антон Конев, заместитель директора ЦК НТИ «Технологии доверенного взаимодействия» ТУСУР
Погрешность при распознавании основного тона речи у новой системы в четыре раза меньше, чем у лучших мировых аналогов. Это позволяет разработке намного лучше справляться с распознаванием обычной спонтанной речи или даже пения.
В дальнейшем научный коллектив намерен разработать комплексное программное решение, которое позволит контролировать присутствие конкретного абонента в чате, веб-конференции или переписке в электронной почте, а также отличать бота от реального человека.
По материалам «РИА Новости».