MAX
Подпишись
стань автором. присоединяйся к сообществу!
Есть метка на карте 14 мая 12
27

Запущен облачный сервис распознавания речи A.I.Kid Speereo

Российская компания Speereo (Спирио), уже 15 лет работающая в области систем распознавания и синтеза речи, запустила облачный сервис распознавания на базе собственных технологий.

Сервис доступен на русском и английском языках.

На этот шаг компанию подвигли результаты сравнительного тестирования технологии с решениями Google и Nuance, которые показали ощутимое  преимущество российской технологии  в своей нише. Кроме того, к этому подтолкнули компании-партнеры, которые разочарованы облачными решениями других поставщиков.

[читать статью полностью...]

Кстати, а вы знали, что на «Сделано у нас» статьи публикуют посетители, такие же как и вы? И никакой премодерации, согласований и разрешений! Любой может добавить новость. А лучшие попадут в наш Телеграм @sdelanounas_ru. Подробнее о том как работает наш сайт здесь👈

Источник: community.sk.ru

Комментарии 0

Для комментирования необходимо войти на сайт

  • 0
    Нет аватара MsDemonId30.05.15 10:49:46

    Дело в том, что нейропроцессорам в мобильниках нет места, а в облаке запросто.
    Блиииин, ну нельзя же быть таким бестолковым. Нахрена в данной задаче нейропроцессор? Здесь объемы обрабатываемых данных смешные, а алгоритмы хоть и сложные, но все же линейные, так что вполне справится простой. Не нужно по воробьям стрелять из пушки.

    кроме того локальное приложение кушает ресурсы,

    энергию, память, занимает процессор, а облачное требует только

    связь. Понимаете?

    В отличии от Вас я добрый десяток лет занимался написанием и реверсом программ. Так что не надо мне тут вешать ерунду про ресурсы и память.

    Что касается энергопотребления. Довольно весомый аргумент для мобилы. Только не в пользу облака. Дело в том, что энергопотребление процессора на порядок меньше потребления приемопередатчика смарта, так как дальность посылки радиоволн прямо пропорциональна мощности передатчика. В итоге, выполняя программу энергию потребляет только процессор. В режиме «только связь" помимо процессора (а он все равно потребляет, так как программа связи то выполняется) начинает кушать еще и приемопередатчик. Вот еще один аргумент в пользу локализации программы    

    • 0
      RadiantConfessor RadiantConfessor30.05.15 11:19:23

      А вы почему понять не можете, что энергоёмкие системы всегда будут лучше себя чувствовать вне локального приложения.

      Просто ответьте, почему ни гугл ни эпл ни майкрософт не стали делать локальных распознователей речи?

      • 0
        Нет аватара MsDemonId30.05.15 23:11:08

        А вы почему понять не можете, что энергоёмкие системы всегда будут

        лучше себя чувствовать вне локального приложения.

        С какого перепуга? Еще раз повторю, если прошлый раз объяснил недоходчиво. В случае с программой энергию кушает только процессор. В случае с сетью энергию будет кушать тот же процессор + передатчик (кушающий в несколько раз больше процессора). И как в таком случае локальное приложение будет кушать больше облачного?

        Просто ответьте, почему ни гугл ни эпл ни майкрософт не стали

        делать локальных распознователей речи?

        Уже отвечал. Ну да ладно, вкратце.

        1. Гугл по определению сетевой ресурс. Все его сервисы так или иначе завязаны вокруг инет-поисковика, который по определению не может быть локальным.

        2. Эпл тоже переключился исключительно сетевое направление, так как это позволяет собирать кучу денег.

        3. Микрософт тоже стал засматриваться в сторону привязки пользователей к инету, разумеется строго к своим сервисам. Их первая попытка была еще в начале 2000-х, но слава богу тогда нетбуки с треском провалились. Сейчас, благодаря прогрессу, идет более удачная экспансия и народ все больше и больше подсаживается на интернет.

        ----------------------

        Ну и чтобы закрыть тему с якобы большой ресурсо- и энергоемкостью, приведу простой пример.

        Есть движок распознавания речи с открытым исходным кодом: Pocketsphinx. Замечателен тем, что написан на чистом C, благодаря чему легко портируется на любые платформы. Что касается мобил, то есть порты под iOS, WindowsPhone и Java. Так вот, приложение легко и просто запускается прямо на смарте. Достоинство — гибкая настройка распознавания. Можно задать либо свободное распознавание речи, либо четко заданный набор слов (комманд). Последнее — то что доктор прописал, т.к. в этот режим наиболее удобен для создания систем голосового управления чем-либо и ресурсов практически не потребляет.

        При создании, например, умного дома я лично отдам предпочтение этому приложению, так как оно не зависит от наличия интернета и работает не в пример быстрее. Быстрее потому, что приложению для распознания не требуется связываться с серверами.

        Можете убедиться: Видео

        На видео Java-вариант. C-вариант работает в добрый десяток раз быстрее.

        Вопрос исчерпан?

        • 0
          RadiantConfessor RadiantConfessor30.05.15 23:30:19

          Вы хотя бы видели на чём у гугл его распознаватель речи работает? )))

          • 0
            Нет аватара MsDemonId30.05.15 23:53:06

            На керосине. Ну что же, я так понял, что остальные вопросы закрыты? Подведем итог?

            1. Скорость - локальное быстрее, т.к. не зависит от качества связи, скорости инета и загруженности серверов. Даже на джаве работает вполне сносно, что расширяет диапазон применяемых аппаратов (например старички на симбиане).

            2. Точность - локальное может быть заточено под небольшой словарь, что положительно сказывается на качестве распознавания. Облачные всегда универсальны и пока еще подвержены ложным срабатываниям.

            3. Стоимость - локальное вообще бесплатно!

            4. Универсальность - тут облака рулят и позволяют более качественно вводить общий текст голосом.

            По трем из четырех критериев локальное приложение однозначно рулит. Да и по четвертому не все однозначно, с теми же СМС вполне справится.

            • 0
              RadiantConfessor RadiantConfessor31.05.15 00:51:23

              Просто запускать на мобильнике распознавание речи с таким уровнем интеллекта ка в гугл у вас не получится. Тут нужен целый минисуперкомпьютер и много-много энергии. Но вы не хотите это признавать. Даже после того как такие фирмы как гугл, эпл и майкрософт опровергли ваши доводы.

              • 0
                Нет аватара MsDemonId31.05.15 17:47:51

                Вот ведь упорный    

                Я дал конкретную ссылку на конкретный бесплатный продукт, ни в чем не уступающий ни гуглу, ни яндексу, ни эплу ни кому другому, так как принципы распознавания у всех одинаковы, разница только в реализации. Более того, подкрепил это видосом с демой конкретного устройства. Причем продукт очень гибкий в настройке под конкретные нужды и под любую платформу. Нужно распознавание всего текста? Там есть словарь на 500000 русских слов, подключайте и будет Вам счастье. Более-менее современные смарты легко справятся с таким словарем.

                Вы же не привели ни одного довода в пользу облачных решений. Ни одного, кроме святой веры в святую троицу — гугла, огрызка и мелкософта. Неужели трудно понять, что ими движет исключительно жажда наживы? Как заметил один из авторов A.I.Kid Speereo, в споре со мной, если программу локализовать, то неизбежно появятся пиратки и они не дополучат часть потенциальной прибыли. Привязав программу к облаку они избавляются от проблемы с пиратками, а значит мимо их кармана не уйдет ни одна копейка. По его же словам это и стало одной из основных причин в пользу выбора облака, а вовсе не ресурсоемкость программы (хотя бы мое с ним обсуждение почитайте). Собственно вот его коментарий:

                Cопрут. Так понятно? Зачем бесплатно работать?

                В случае отдельного приложения — это неизбежно. Взлом, варезы, торренты. Миллионы юзеров, благодарящих засранцев «за полезную прогу» на варезном форуме.

                Сопрут сами разработчики ОС — при «подписывании» получают возможность обратного инжиниринга на своей же ОС и со своего же компилятора.

                Точно такой же логикой руководствуются и гуглы с эплами, а вовсе не мифической сложностью и ресурсоемкостью программы.

                Ну и последний раз, надоело уже:

                Тут нужен целый минисуперкомпьютер и много-много энергии.
                То есть один из авторов A.I.Kid Speereo врет, утверждая, что:

                Мы можем и на клиенте!

                И даже на 100 MIPS!

                100 MIPS — Это Pentium-60 МГц! Еще раз, чтобы дошло — данная программа может пойти на процессоре с частотой в 60 МГц! Даже древний смарт Nokia N73 имеет процессор в 300 МГц, причем более производительной архитектуры.

                Если есть обоснованные контраргументы, то отвечу. Доводы, типа «Тут нужен целый минисуперкомпьютер и много-много энергии. Но вы не хотите это признавать.» не принимаются, так как попахивают, точнее даже пованивают, натуральным тролизмом.

                • 0
                  RadiantConfessor RadiantConfessor31.05.15 18:02:34

                  Дело в том, что речь идёт об интеллектуальном опознавании речи, а оно невозможно без больших объёмов данных. По этому все мобильные приложения будут уступать облачным.