стань автором. присоединяйся к сообществу!
Лого Сделано у нас
56

«ЦРТ-инновации» научила нейронные сети отличать речь от шума

Следи за успехами России в Телеграм @sdelanounas_ru

Резидент кластера информационных технологий Фонда «Сколково» компания «ЦРТ-инновации» (входит в группа компаний ЦРТ) разработала технологию автоматического распознавания речевых команд для робототехники в промышленности. Технология использует метод распознавания команд по грамматикам с использованием акустических моделей на основе глубоких нейронных сетей (Deep neural networks, DNN).

Одним из наиболее актуальных применений нейронных сетей сегодня, когда потребность в диалоге «человек-машина» стала очевидной, является распознавание естественной звучащей речи. Голосовое управление в промышленных условиях предполагает повышенную зашумленность, поэтому требовалось создать технологию, которая сумела бы отличать речь от шума и адаптироваться к конкретному человеку. Технология группы компаний ЦРТ решает эту задачу за счет алгоритма определения речевой активности диктора на основе нейросетевого классификатора и нового метода адаптации к голосу и каналу.

Новая технология может использоваться для голосового управления станками в шумных заводских цехах, грузовыми автомобилями и другой техникой, работающей на стройках, разработках и в карьерах, для распознавания команд в шумных многолюдных помещениях.

Кирилл Левин, директор научно-исследовательского департамента ЦРТ:

«Последние значительные успехи в распознавании речи связаны с применением в акустических моделях глубоких нейронных сетей вместо смесей гауссовых распределений. Результаты проведенных компанией исследований показывают значительное преимущество распознавания речи на базе глубоких нейронных сетей. Это преимущество наиболее ярко проявляется в условиях увеличения шума».

Продукты и решения на основе технологии распознавания речи — одно из основных направлений работы группы компаний ЦРТ. В их числе сиcтема голосового взаимодействия VoiceNavigator, система речевой аналитики на основе машинного обучения Smart Logger II и другие.

Сергей Ходаков, руководитель направления «Безопасные информационные технологии» ИТ-кластера Фонда «Сколково»:

"Участник IT-кластера «Сколково» «ЦРТ-инновации» имеет серьезный опыт в сфере технологий распознавания речи и голосового анализа. Решения компании уже успешно применяются в банковской области, в телекоме. Развитие робототехнических промышленных решений является одним из наиболее интересных направлений для появления стартапов в области человеко-компьютерного взаимодействия, поэтому я уверен, что решение такой критической задачи, как распознавание речи в условиях высокого уровня шума, позволит ЦРТ найти клиентов в промышленной сфере и значительно расширить свое присутствие на рынке".

Справочная информация

ЦРТ-Инновации — российская компания, разработчик инновационных систем в сфере технологий синтеза и распознавания речи, анализа аудио- и видеоинформации, мультимодальной биометрии. За 25 лет работы из небольшого коллектива ученых-единомышленников ЦРТ превратился в международную компанию, реализующую проекты национального масштаба. Многие разработки и решения нашей компании не имеют аналогов и используются по всему миру, включая США, Латинскую Америку, Ближний Восток, Европу. Масштаб внедрений позволяет говорить о реальном технологическом лидерстве в области речевых технологий и бимодальной биометрии. Сайт: www.speechpro.ru.

Виталий Шустиков

Кстати, а вы знали, что на «Сделано у нас» статьи публикуют посетители, такие же как и вы? И никакой премодерации, согласований и разрешений! Любой может добавить новость. А лучшие попадут в телеграмм @sdelanounas_ru. Подробнее о том как работает наш сайт здесь👈

  • 1
    Нет аватара hvt
    26.05.1607:35:39

              Скажите, а у Вас есть в планах сделать, что-то похожее на «Лекси»?

    Отредактировано: hvt~09:44 26.05.16
Написать комментарий
Отмена
Для комментирования вам необходимо зарегистрироваться и войти на сайт,