стань автором. присоединяйся к сообществу!
Лого Сделано у нас
27

Запущен облачный сервис распознавания речи A.I.Kid Speereo

Следи за успехами России в Телеграм @sdelanounas_ru

Российская компания Speereo (Спирио), уже 15 лет работающая в области систем распознавания и синтеза речи, запустила облачный сервис распознавания на базе собственных технологий.

Сервис доступен на русском и английском языках.

На этот шаг компанию подвигли результаты сравнительного тестирования технологии с решениями Google и Nuance, которые показали ощутимое  преимущество российской технологии  в своей нише. Кроме того, к этому подтолкнули компании-партнеры, которые разочарованы облачными решениями других поставщиков.

 

Технология Speereo, в отличие от аналогов, оптимизирована для задач управления. В то время как решение Google оптимизировано под задачи поиска, а решение Nuance - под задачи диктовки.

Что это обозначает на практике?

Если заставить каждую из систем выполнять не свойственную ей задачу - получим провал в точности.

Система Speereo предназначена для диалогов человека с устройствами, программами и системами. Причем ответы людей и их командные фразы и главное, реакции на них, должны попасть в заранее составленный список.  Ваоиантов ответа на каждом шаге может быть больше 10 000, но это должен быть закрытый список. Кроме того, этот список можно менять хоть несколько раз в секунду. Общий словарь системы неограничен и пополняется автоматически при необходимости без участия разработчика.

Для выбора контента из каталога видео на сайте больше и не требуется. В этом случае не нужна диктовка или поиск по всем сайтам в Интернете. Как и в миллионах других ситуаций.

В этом классе задач система Speereo  выдает 99% вероятность правильного распознавания, а

другие системы - 80-85%.

Почему облако?

Такой подход позволяет не тратить ресурсы на поддержку "зоопарка" операционных систем, избавиться от искусственных ограничений этих операционных систем, усложнить нелегальное копирование решения. Да и разработчикам - пользователям облака использовать такую технологию будет проще и привычней.

Ознакомительный доступ предоставляется совершенно бесплатно. Он ограничен только по количеству одновременных подключений.

Для коммерческого использования существует ряд тарифных планов, но низкая ресурсоемкость технологии  позволяет держать сравнительно низкие цены.

Несколько компаний уже приступили к  тестированию решения для своих нужд.

Ожидаем в ближайшее время появление сайтов и мобильных приложений, управляемых голосом точно и быстро.

Кстати, а вы знали, что на «Сделано у нас» статьи публикуют посетители, такие же как и вы? И никакой премодерации, согласований и разрешений! Любой может добавить новость. А лучшие попадут в телеграмм @sdelanounas_ru. Подробнее о том как работает наш сайт здесь👈

  • 0
    Нет аватара MsDemonId
    14.05.1313:50:03
    Поясните пжалста, что значит облачный? Во что и кого облачили? Когда научатся давать людские названия, а не выпендриваться козыряя никому не понятной терминологией.
    • 0
      Нет аватара sneider
      14.05.1313:53:22
       http://ru.wikipedia.org/w...ые_вычисления 
      почитайте, все вопросы отпадут.
      • 0
        Нет аватара MsDemonId
        14.05.1314:04:12
        Что такое распределенные вычисления я знаю. Но там нет ответа на вопрос - что значит "облачный"? Откуда взялся такой странный термин?
          • 0
            Нет аватара MsDemonId
            14.05.1314:36:55
            Тоже сплошная вода, без ответа - откуда взялся этот термин "облако". Почему "облако"? Почему не "селёдка"?
            Из статьи только одно понятно, что термин - дословный перевод аглицкого термина, не имеющий никакого смысла    
            • 0
              d-tatarinov.livejournal.com d-tatarinov
              14.05.1314:45:18
              дословный перевод аглицкого термин

              Вот потому и не селёдка    
              Вот почему компьютерную сеть не редко называют паутиной (World Wide Web). Какое отношение она имеет к насекомым? ;)
              • 0
                Нет аватара MsDemonId
                14.05.1314:49:20
                Какое отношение она имеет к насекомым?
                Точно такое же, какое отношение к насекомым имеет рыболовная сеть     Сеть - это переплетающиеся нити, а не обязательно паутина. Отсюда и термин. А вот облака - это ... что?
                • 0
                  d-tatarinov.livejournal.com d-tatarinov
                  14.05.1314:57:20
                  web - веб, интернет, сеть, паутина
                  (network, cobweb)
                  web beacon — веб-маяк
                  web portal — интернет-портал
                  semantic web — семантическая сеть
                  tangled web — запутанная паутина

                  Где нашли рыболовную сеть? Где вообще переплетающиеся нити? Не выдумывайте
                  То, что Вы имеете в виду - net. Так тоже компьютерные сети называют. При чем это общее название. Сеть, работающая по протоколу WWW (World Wide Web) - именно паутина ;)
                  Отредактировано: d-tatarinov.livejournal.com~15:01 14.05.13
                  • 1
                    Нет аватара MsDemonId
                    14.05.1315:23:52
                    Сеть в русском языке означает что-либо перекрещивающееся, клетчатое, ячеистое. Поэтому это название подходит и под рыболовецкую сеть и под паутину и под сети птицеловов и еще кучу вещей. И под комп. сети тоже, если представить связи между компьютерами в виде нитей, а компы - узлы этой сети. Так что назвать связи компов сетью - это очень удачная мысль, довольно точно описывающая принцип этих связей. А вот назвать технологию облаками - непонятно с чего ради?
                    Сеть, работающая по протоколу
                    WWW (World Wide Web) - именно паутина
                    Паутина - это не сеть?    
                • 0
                  Нет аватара sneider
                  14.05.1315:05:37
                  почитайте на английской википедии, там написано, откуда такое название. Вот цитата "The name comes from the common use of a cloud-shaped symbol as an abstraction for the complex infrastructure it contains in system diagrams"
                  • 0
                    Нет аватара MsDemonId
                    14.05.1315:25:12
                    А по русски? Я в школе немецкий учил, так что шпрехен зи дойч    
                    • 1
                      Нет аватара sneider
                      14.05.1315:54:05
                      Примерно переведу, смысл от этого не поменяется. "Название происходит от общеиспользуемого символа в форме облака, как абстракции для сложной инфраструктуры в системных диаграммах.
                      • 0
                        Нет аватара MsDemonId
                        14.05.1315:59:57
                        Хоть ничего и не понял, но спасибо.
            • 0
              Нет аватара guest
              14.05.1318:31:19
              Ну, кто то придумал изобразить вот так:

              и назвали cloud.
              Не думаю, что тот кто придумал название будут рассказывать как сидели днями и ночами придумывая название...
              П.С. Хотя... в общем лень искать.   
              • 0
                Нет аватара MsDemonId
                14.05.1319:41:01
                Напомнило амёбу, из учебника биологии    
        • 0
          Нет аватара alattar
          14.05.1315:08:38
          Облако - это, грубо говоря, система, когда мощности могут легко и гибко выделяться пользователю по необходимости "налету". К примеру, несколько проектов пользуются услугами одного и того же компьютерного сервиса. Один требует больших вычислительных мощностей, но мало места на диске, а второй наоборот. В облаке это можно легко настроить, пользователи не будут переплачивать за ненужные им ресурсы. И наоборот, необходимые ресурсы будут выделены тем пользователям, которым они нужны.

          В будущем, возможно, первому пользователю понадобится больше ресурсов. Например, больше места на диске. Облако позволяет легко "откусить" часть ресурсов от своих свободных запасов и предоставить их в распоряжение пользователя.

          Подробней: http://ru.wikipedia.org/w...B%D0%B5%D0%BD%D0%B8%D1%8F 
          Отредактировано: alattar~15:18 14.05.13
          • 0
            Нет аватара MsDemonId
            14.05.1315:58:38
            Не знаю кто минусанул, но по моему это было лишне    
            Эта ссылка уже была чуть выше. Она не дает ответа на вопрос - почему эту технологию назвали "облачной". А меня именно это и интересует, а не распределение мощностей (что в общем то является очень старой идеей, едва ли не 70-х годов).
            • 0
              tm tm
              14.05.1318:38:53
              почему эту технологию назвали "облачной"


              Облако здесь - это аллегория для некоторой части системы, про которую мы точно знаем, что она делает, но можем не знать (или игнорировать) то, как именно она это делает. Условно: вы просите удаленный компьютер подсчитать для вас sin(42), при этом вас совершенно не волнует, как именно будет делаться этот расчет - по таблицам ли, через приближение ли, а может как-то ли еще. Даже если на том конце будет сидеть двадцать китайцев со счетами и щелкать костяшками, вам это будет совершенно безразлично - лишь бы в нужное время получился правильный результат. Аналогично и для этих китайцев будет без разницы, откуда вы взяли число 42 и что собираетесь делать с полученным результатом. Образно это можно представить, как если бы некто невидимый, находящийся "за облаком" отправлял бы задания другому такому же "заоблачному" невидимке. При этом оба они совершенно точно знали бы суть этих заданий, но были бы совершенно без понятия о том, что именно с ними на соседнем облаке происходит.
              • 0
                Нет аватара MsDemonId
                14.05.1319:39:37
                Да, некоторых не корми, дай им только аллегорию    
                Условно:
                вы просите удаленный компьютер подсчитать для вас sin(42), при этом
                вас совершенно не волнует, как именно будет делаться этот расчет -
                по таблицам ли, через приближение ли, а может как-то ли еще.
                Ваш браузер запрашивает на сервере страницу. При этом ему пофиг, как сервер ее будет создавать, его интересует только конечный результат.
                Аналогично и для
                этих китайцев будет без разницы, откуда вы взяли число 42 и что
                собираетесь делать с полученным результатом.
                Совершенно верно, серверу без разницы, откуда вы взяли номер и параметры запрашиваемой страницы, и что вы собираетесь делать с полученным результатом. Он только умеет по запросу составить страницу и передать ее заказчику.
                Образно это можно
                представить, как если бы некто невидимый, находящийся "за облаком"
                отправлял бы задания другому такому же "заоблачному" невидимке. При
                этом оба они совершенно точно знали бы суть этих заданий, но были
                бы совершенно без понятия о том, что именно с ними на соседнем
                облаке происходит.
                Ну да, обычная модель клиент-сервер, когда оба точно знают свою задачу, но совершенно не знают, что с ними происходит на "соседнем облаке".
                Мне кажется, это мы уже проходили    
                • 1
                  tm tm
                  14.05.1320:25:15
                  Ну да, обычная модель клиент-сервер


                  В целом да, только "вывернутая наизнанку". В обычном клиент-сервере множество клиентов запрашивают сервисы какого-то конкретного сервера, здесь же с точностью до наоборот - один "клиент" распределяет сложные вычисления на множество "серверов".
        • Комментарий удален
    • 1
      Нет аватара lamin
      14.05.1317:31:11
      Облачный - это устоявшийся IT термин. Он обозначает, что основные вычисления происходят где-то на интернет сервере (у пользователя только простенькая программка ввода-вывода). Никого не колышит где именно этот сервер, и один это сервер или, положим, сотни. Достаточно знать его адрес в сети. На схемах обозначается в виде облачка -отсюда и название вестимо. В нашем случае позволяет предлагать распознавание речи как внешний сервис, оптимально распределять нагрузку на каналы связи и процессоры. Еще один несомненный плюс облачных вычислений и облачных сервисов - это бизнес-модель. Не продается отдельная пользовательская программа, которая завтра распространится в инете бесплатно. Есть оплата -есть сервис. Контролировать проще не выпуская из рук. Ну и популярные ныне планшеты и смартфоны проще поддерживать, не полагаться на их невеликие ресурсы и не вкладывать сотни тысяч долларов в поддержку новой ОС каждые полгода.
      • 0
        Нет аватара MsDemonId
        14.05.1318:23:06
        Видел я эти схемы. Вместо "облачка" можно нарисовать что угодно, хоть череп с костями или звезду Давида. Собственно что и требовалось доказать - название чисто пиар-ход, никак не отражающее суть технологии. Просто слово красивое, как бы намекает на возвышенное и хорошо прикрывает развод на бабки    

        Вопрос по теме. Как понимать:
        В нашем случае позволяет
        предлагать распознавание речи как внешний сервис, оптимально
        распределять нагрузку на каналы связи и процессоры.
        Рискую показаться нудным, но по моему нагрузка на каналы связи в такой технологии будет гораздо больше, чем нагрузка на процессор в оффлайновой версии. Несравненно больше, на порядки! И в чем здесь преимущество? Мне кажется разрабы просто лукавят. Цель этой "технологии" - сбор денег. Никаких других преимуществ она не дает. Скорее наоборот, вносит неудобства для пользователей, главное из которых - иметь постоянный доступ в интернет. И в этом случае все "преимущества" технологии будут гаситься ограниченной скоростью связи и ограниченными вычислительными возможносстями серверов. Я не прав? Или я вообще не так все понял?
        Напомнило рекламу МТС, где молодежь лихо смотрела футбольные матчи по инету. У меня МТС на сотике как раз для инета используется. Даже в местах с 3G связь гораздо медленнее чем у меня было на диалапе! Вот вам и высокие технологии    
        • 0
          tm tm
          14.05.1321:05:27
          Вместо "облачка" можно нарисовать что угодно, хоть череп с костями или звезду Давида.


          Речь ведь не об абстрактной живописи идет, а о диаграммах. Их принято рисовать так, чтобы человеку, читающему эту диаграмму, изображенные на ней символы были понятны после минимального количества объяснений.

          Рискую показаться нудным, но по моему нагрузка на каналы связи в такой
          технологии будет гораздо больше, чем нагрузка на процессор в
          оффлайновой версии.


          На самом деле и то, и другое будет копеечным. Для внятной и узнаваемой передачи голоса достаточно ширины канала примерно в шесть с небольшим кбит/с - по сравнению со всякими ютубами и торрентами это такая мелочь, что участники облака ничего даже не почувствуют. Другой вопрос насколько хорошо будет сделано само распознавание и что там будут использованы за алгоритмы. Как-то слабо верится, что никому не известная фирмочка внезапно выдаст продукт, готовый на равных бороться с присутствующими на рынке "монстрами".

          Цель этой "технологии" - сбор денег. Никаких других преимуществ она не дает.


          Цель любой технологии в конечном итоге - сбор денег, вопрос лишь в том, как их собрать. Даже "бесплатный" поиск в гугле приносит заинтересованным людям миллиарды. Если разработчики этой технологии сумеют заинтересовать ей потребителей настолько, что смогут зарабатывать серьезные деньги - то и слава богу, значит она оказалась действительно полезной большому числу людей.
          • 2
            Нет аватара lamin
            14.05.1322:28:30
            Вообще-то мы уже у этих монстров тендеры выигрываем,
            Например сделали для Intel распознавание в новейшем автокомпе Russian Hill.
            По сравнению с конкурентами ошибок было в разы меньше...
        • 0
          Нет аватара lamin
          14.05.1322:25:19
          Мы можем и на клиенте!
          И даже на 100 MIPS!
          НО! Это дорого, перенос на мобильную ОС стоит сотни тысяч долларов, а после этого переноса птичку в клетке уже не удержишь. Тот же Apple скажет спасибо несмотря на патенты.
          Цель любого бизнеса - сбор денег, мне не стыдно.
          Про канал связи, цель данного сервиса - предоставление распознавания речи для интернет-сайтов и мобильных приложений. Google Voice и Siri как-то не напрягает никого в плане трафика даже на 3G. А c домашним шпд - тем более.
          Клиентов на этих услугах связи в РФ более 30 млн., в США - более 90 млн. Нам хватит.
          Читайте внимательно, преимущество технологии не в облачности, а в точности.
          Если MS, Intel или Nokia проспонсирует перенос на мобильную ОС - тогда перенесем, опыт есть.
          • 0
            Нет аватара MsDemonId
            14.05.1323:27:42
            НО! Это дорого, перенос на мобильную ОС стоит сотни тысяч долларов
            Что-то очень дорого. Вы код на ассемблере что ли писали?    
            а после этого переноса птичку в клетке уже не удержишь. Тот же
            Apple скажет спасибо несмотря на патенты.
            Помимо патентов есть куча способов защитить код. Его конечно один черт взломают, но это уже вопрос времени и цены, могут посчитать нерентабельным.
            Цель любого бизнеса - сбор денег, мне не стыдно.
            Никто и не стыдит. Я лишь хотел сказать, что всех денег не заработаешь. На мой взгляд привязывать программу к инету - нежелательно, но Вам виднее, я просто со своей колокольни не все вижу. Так что извиняюсь, если что не так поняли.
            Про канал связи, цель данного сервиса - предоставление
            распознавания речи для интернет-сайтов и мобильных приложений.
            Google Voice и Siri как-то не напрягает никого в плане трафика даже
            на 3G.
            Не напрягает тех, у кого связь нормальная и деньги лишние есть. Я наверное живу в неправильном городе    
            Читайте внимательно, преимущество технологии не в облачности, а в
            точности.
            За точность никто ничего не говорил, вопрос в целесообразности именно "облачности". Не хочу за примерами далеко ходить. Я бы хотел использовать нормальное голосовое управление. На писюке и на смарте. На писи нормальный инет, за который плачу 500 рэ в месяц. На смарте, за ненадобностью, подключаю изредка, когда уезжаю надолго. В итоге получается, что для использования на смарте мне придется подключить инет и платить оператору от 100 до 400 рэ в месяц! И это только за возможность использования услуги! Может в Москве это и смешные суммы, но я к таким переплатам не готов. Да и не только я, а большинство моих знакомых, у кого семья заставляет экономить каждую копейку. Правда это все гипотетически, при условии, что наладят нормальную связь (на что надежды мало). Собственно и все проблемы.
            Удачи! Надеюсь потесните конкурентов, не зря же наши программисты самые программисткие программисты в мире    
            • 0
              Нет аватара lamin
              15.05.1310:13:14
              таки кое-что и на асме
                 
              • 0
                Нет аватара MsDemonId
                15.05.1311:09:35
                Ну, если с этим трудности, то могу помочь. Реверсил и выдирал код под arm, z80 и 8086 камни, так что опыт есть. Немного под микроконтроллеры писал.
                В общем помог бы чем мог, в свободное время разумеется.
          • 0
            Нет аватара MsDemonId
            14.05.1323:39:37
            Нам хватит.
            Напомнило случай пару лет назад. Выбирал для одной конторы САПР. Попросили по дружбе. После тестирования пробной версии "Компас 3Д" в общем то остался доволен. Неудобство вызвала организация распечатки чертежей. Обратился на форум поддержки, с вопросом, не планируют ли изменить/подправить интерфейс. На что мне какая-то девица объяснила, что не мое дело как и что планируют, что нас таких "просильщиков" много и на всех не угодишь. Дошла до того, что заявила, мол им виднее как пользователям удобнее работать и что у них есть клиентура, что нам хватит! На замечание, что я мол не просто так обратился, меня чуть ли не открытым текстом послали и забанили, как злостного троля     Пришлось Автокад покупать, там хотя бы внимательно выслушивают и посылают очень вежливо и тактично    
            Тогда обидно было, а сейчас смешно вспомнить     Дааа, умение доставать людей у меня не отнимишь.
            • 0
              Нет аватара lamin
              15.05.1310:17:57
              дык мы же не отказываемся и на клиенте делать за счет заказчика. Просто делать это на свои считаем пока нецелесообразно. Это решение для тех, кому нужен именно облачный сервис, их много. Есть задача к примеру, управлять видео сервисом на множестве платформ. Облаком - дешевле выходит.А для видео у пользователей и так и так инет хороший.
          • 0
            Нет аватара airaleais
            15.05.1308:55:37
            Перенос любого ПО между платформами плевое дело. Про сотни тысяч долларов - ложь и чушь. Портируют даже бинарники между платформами, а с исходными кодами какие проблемы? давным давно существуют ИДЕ способные один код компилить под любые мобильные и не мобильные, серверные платформы практически без ввода изменений в код. Более того современные мобильники давно 32 битные, про компы я уж не говорю.

            Если ваш софт написан на си/си++, то откомпилить под другую платформу, проект лобых размеров, работа для одного чела на несколько дней максимум(хотя чаще всего на пару часов).
            • 0
              Нет аватара lamin
              15.05.1310:19:34
              Это не так. К сожалению. Это же сложный код, оптимизированный, лезет к оборудованию, обходит косяки ОС. Не перенести это дешево, уж поверьте.
              • 1
                Нет аватара airaleais
                19.05.1320:34:47
                Дружище это не правда ведь. Синтез и распознавание речи, куда зачем вам лезть в железо или в систему?? Вам надо получить цифру с микрофона и послать данные в динамик, т.е. разница в интерфейсах драйверов работы со звуком и все!
        • Комментарий удален
        • 0
          Нет аватара pontika
          15.05.1307:15:59
          Ну зря Вы так въелись. Каналы связи сейчас очень неплохи. Мы еще, пока, догоняющие. Но уже скорости передачи данных впечатляют.
          Например мне нужно посчитать какой - нибудь полином 30 порядка. Я даю 30 коээфициентов этого полинома и написание самого полинома или его тип. Все это будет отправлено в "облако" одним TCP-пакетом. Ответ так вообще будет одно число. Т.е. вся нагрузка на канал сводится к отправке и приему одного пакета. А вычисление полинома на своем, например, планшетнике требует программы, да еще под андроид или ios или windows. Т.е. первый минус, для оффлайнового приложения требуется мультиплатформенный софт. Второй минус оффлайнового приложения, затраты на отправку пары пакетов TCP и приема столько же пакетов совершенно не требуют большой вычислительной мощности от компьютера. А вот посчитать полином 30 порядка - процессор-то желательно иметь очень неслабый, а в идеале многоядерный, да с поддержкой DSP.
          Теперь конкретно по теме.
          Программа ввода/вывода может быть, вообще, примитивной, опять же под любой замызганый нетбук или планшетник. Что напишу сейчас ниже - мое имхо, и не в коем случае не говрит, что именно так сделано. Но как из вариантов - подойдет. Оцифровываем звук с микрофона и в формат WAV гоним его в облако распознования речи. Оцифровка канала идет на частоте 44КГц с разрядностью 16 бит. Т.е. 2 байта * 44000=88000 байт в секунду. Вы всерьез считаете, что такой поток забьет существующие каналы провайдеров Интернета? У меня сейчас инетнет канал 24Мбит или 4 мегабайта в секунду. Дальше, всякие алгоритмы распознования выполняются не в моем слабеньком ноутбуке, а на каком-то распределенном сервере и мне даже это не интересно, как это обрабатывается. Мне в ответ приходит текст или команды, соответсвующие моим голосовым командам. Опять же, текст канал вообще ни как посадить не сможет. Т.е. нагрузка на канал связи минимальная. Нагрузка на вычислительные мощности моего ноутбука минимальная, а серьезная вычислительная задача выполнена. Поэтому, "облака" вполне себе отличная вещь. НУ а что платить приходится, сейчас не социализм, все кушать хотят.
          • 0
            Нет аватара lamin
            15.05.1310:28:16
            не забудем еще, что тяжелые вычисления нехило кушают батарейку
          • 0
            Нет аватара MsDemonId
            15.05.1310:54:37
            Ну зря Вы так въелись. Каналы связи сейчас очень неплохи. Мы еще,
            пока, догоняющие. Но уже скорости передачи данных впечатляют.
            Правда? Я не могу судить, догоняем или нет. Мне просто не с чем сравнивать. Я одно знаю, даже в городе скорость инета часто ниже плинтуса. За городом и говорить нечего, до меня часто даже не дозваниваются, хотя я всего в 30 км от города-полумилионника. Просто разъезжая по области я вижу, что проще перечислить места с нормальной связью, чем "мертвые зоны". Это личный опыт, ничего более.
            НУ а что платить приходится,
            сейчас не социализм, все кушать хотят.
            Платить и переплачивать - разные вещи. Я просто сильно сомневаюсь, что данную приблуду нельзя портировать как обычное приложение под ПК и смарты.
            Про качество связи - я дам пост ниже, а то как то слишком много веток получилось.
  • 1
    Нет аватара MsDemonId
    14.05.1313:51:25
    А вообще с ужасом жду тот день, когда получат распространение голосовые системы. Я наверное старомодный    
    • 2
      Нет аватара guest
      14.05.1315:56:46
      Ну, поскольку программа - наша, надеюсь, что
      распознавание голоса хозяина "после вчерашнего" в ней заложена по умолчанию.    
      Отредактировано: Igor Bulytchev~15:57 14.05.13
      • 0
        Нет аватара MsDemonId
        14.05.1316:03:16
        Приятно, когда понимают подтекст     +1
  • 0
    Нет аватара lamin
    14.05.1317:23:21
    И после и во время    
    Особенность системы - устойчивость к акцентам и шумам.
    Английская, например, понимает шотландцев и кокни.
    Русская - наши гОворы, оканья и аканья. И даже Х вместо г.
    Неправильные ударения (особенно актуально для улиц и весей).
    Но в целом речь должна быть правильная.
    • 0
      Нет аватара sneider
      14.05.1320:41:10
      ну вы сравнили. оканья и говоры не идут ни в какое сравнение с кокни или же с шотландским акцентом. кокни - все равно что раньше популярный олбанский, падонковский язык. Кокни по сути также коверкает английский.
      • 1
        Нет аватара lamin
        14.05.1322:26:26
        тем не менее распознает
    • 0
      Нет аватара MsDemonId
      15.05.1311:19:44
      Главно, чтобы пьяный базар игнорировала    
      Кстати, а можно ведь написать распознавание пьяных "ноток" в говоре? Вам бы гаишники спасибо сказали. Да и все нормальные автолюбители тоже.
      • 0
        Нет аватара lamin
        18.05.1313:10:32
        точность определения физиологического состояния по голосу невелика, проверяли.
  • Комментарий удален
  • 0
    Нет аватара MsDemonId
    15.05.1311:16:34
    К преимуществам и недостаткам облачной архитектуры:

    Сейчас пишу с МТС, на окраине Пензы. Скорость скачет от 0.5 до 12 кб/с. Так что технология, во всяком случае пока, подходит не всем желающим    
    • 0
      Нет аватара lamin
      18.05.1313:06:06
      Нет смысла работать на рынке, который скоро схлопнется (медленный интернет). Есть смысл работать на рынке, который активно растет (ШПД и быстрый мобильный). В РФ ШПД уже имеют 25 млн пользователей, и эта цифра активно растет.
      Если бы мы делали мобильную ОС -тогда сделали бы распознавание на клиенте. А так - смысла нет.
      пишу вам с 97 Mb/c   
      Отредактировано: lamin~13:09 18.05.13
      • 0
        Нет аватара MsDemonId
        19.05.1319:01:42
        Нет смысла работать на рынке, который скоро схлопнется (медленный
        интернет).
        Хотелось бы верить. Только разъезды по области не дают для этого повода.
        В РФ ШПД уже имеют 25 млн пользователей, и эта цифра активно растет.
        Не густо. А если учесть тех, у кого декларируемая высокоскоростная 3G работает как черепаха, то получится и того меньше. Еще раз напомню, у меня 3G было и на мегафоне и на мтс. В обоих случаях даже близко не обеспечивает заявленных скоростей не только по 3G, но и по EDGE-GPRS. Кто-нибудь проводил исследования по России, на предмет качества и доступности мобильного интернета?
        пишу вам с 97 Mb/c    
        Поздравляю. Теперь знаю по крайней мере одного пользователя с нормальным инетом    

        Если бы мы делали мобильную ОС -тогда сделали бы распознавание на
        клиенте. А так - смысла нет.
        Но почему же смысла нет? Стреляйте, не понимаю почему нельзя сделать в виде обычного приложения. Почему обязательно встраивать в ОС? Религия что-ли не позволяет?
        Не судите строго за въедливость. Просто мне действительно было бы неприятно пользоваться постоянно отказывающей программой, стоит только чуть-чуть отдалиться от города, или зайти в подвал с метровыми стенами, или зайти в цех металлообработки. Потому и пытаюсь узнать причины отказа переноса программы на мобилы.
        • 0
          Нет аватара lamin
          19.05.1320:46:53
          Cопрут. Так понятно? Зачем бесплатно работать?
          В случае отдельного приложения - это неизбежно. Взлом, варезы, торренты. Миллионы юзеров, благодарящих засранцев "за полезную прогу" на варезном форуме.
          Сопрут сами разработчики ОС - при "подписывании" получают возможность обратного инжиниринга на своей же ОС и со своего же компилятора.
          Оставшиеся честные юзеры (несколько тысяч) привыкли к цене в 1$.
          Раз в полгода надо тратить дополнительные десятки тысяч на поддержку очередного творения гугля или эпла. В итоге имеем минус. Проходили уже.
          Так что продаем только вместе с железом или в виде оем или как сервис.
          Несколько фактов:
          Средний годовой заработок программы AppleStore - менее 500 $.
          На Андроиде - и того меньше.
          Чуть повыше цифры у игр.
          Если и после этого не понятно, то я уж и не знаю...
          Отредактировано: lamin~20:55 19.05.13
          • 0
            Нет аватара MsDemonId
            19.05.1321:39:28
            Да мне-то изначально было понятно - обычная жадность, просто хотел, чтобы Вы сами это сказали     А то вешали нам тут про "сотни тысяч долларей на портирование", про "сопрут создатели ОС"     Сказочники...
            Отредактировано: MsDemonId~21:40 19.05.13
            • 0
              Нет аватара lamin
              21.05.1319:50:12
              Ничего я не вешал.
              Всё правда и про "сотни тысяч" и про "сопрут".
              А если я не буду думать о прибыли компании - то гнать надо меня с моей работы. В чем жадность -то?
              Отредактировано: lamin~19:50 21.05.13
              • 0
                Нет аватара MsDemonId
                22.05.1302:48:37
                Вы можете убедить простого юзера в "сотнях тысяч", но не меня, портировавшего код на несколько платформ. Это же Ваши слова:
                Мы можем и на клиенте!
                И даже на 100 MIPS!
                100 MIPS - это примерно Pentium 66MHz, даже чуть меньше. Говоря по русски, вычисления не очень сложные и с большой вероятностью код не большой. Ни о каких сотнях тысяч для таких объемов и речи быть не может, даже если бы весь код был написан на ассемблере    

                Жадность в том, что вы без нужды привязываете своих пользователей к интернету и отказываетесь от значительной потенциальной клиентуры (не имеющей нормального интернета, или денег на него) из-за боязни, что часть этих "потенциалов" будет пользоваться пиратскими копиями. Это и называется - "жаба душит"    
                Я же не зря написал:
                Мне кажется разрабы просто лукавят. Цель этой "технологии" - сбор денег. Никаких других преимуществ она не дает. Скорее наоборот, вносит неудобства для пользователей, главное из которых - иметь постоянный доступ в интернет. И в этом случае все "преимущества" технологии будут гаситься ограниченной скоростью связи и ограниченными вычислительными возможносстями серверов.
                Вы сами подтвердили, что высокая производительность не нужна, достаточно 100 MIPS. Значит "облачная" технология выбрана не по соображениям производительности, а исключительно из соображений сбора денег. Третьего просто не дано.
                В то же время немало фирм производят ПО зная о быстром появлении пиратских копий. Но это их не останавливает, хотя бы по той причине, что привязывает пользователей к их программе, сегодня пиратской, а завтра может и лицензионной. Денежки же соберут с тех, кто не пользуется пиратками из принципа или из боязни, таких не так уж и мало.
                Всех денег не заработаешь (ц).
                • 0
                  Нет аватара lamin
                  29.05.1313:01:43
                  третье дано. Достаточно 100 MIPS - это не значит простой код, это значит очень надо попариться чтобы впихнуть сложный код в такую производительность. Переносить всякую чепуху типа игрушек и переносить тяжелый код - это очень разные вещи.
                  Работать на пиратские копии мы не будем, плавали -знаем. Уровень пиратства очень высокий, запредельный. 99%. Модель платного ПО уже умерла и смердит. Компании закрываются. Все успешные проекты построены по другим моделям. Рекламную функцию наш софт для мобильников уже выполнил, хватит.
                  И да - МЫ ХОТИМ ЗАРАБАТЫВАТЬ С ПОМОЩЬЮ СВОЕГО ТРУДА.
                  Любители халявы могут написать такую программу сами и раздавать ее бесплатно. Вы к примеру ;) Вы ж такой умный. Только что-то за 15 лет таких не нашлось писателей.
                  Отредактировано: lamin~13:04 29.05.13
                  • 0
                    Нет аватара MsDemonId
                    29.05.1319:19:10
                    третье дано. Достаточно 100 MIPS - это не значит простой код, это
                    значит очень надо попариться чтобы впихнуть сложный код в такую
                    производительность.
                    Гнилые отмазы     Не нужно париться, даже в стареньких смартах шли процессоры от 300 МГц, что явно больше ста мипсового пня-66. Сейчас и 1ГГц никого не удивишь.
                    Работать на пиратские копии мы не будем, плавали -знаем. Уровень
                    пиратства очень высокий, запредельный. 99%.
                    Стесняюсь спросить, а в чем мерили уровень пиратства? В штуках пиратов на квадратный метр? В толщине? Или в сапогах? Что за термин такой - уровень пиратства? Есть общедоступные данные по предполагаемым потерям барыша от пиратства. Но, во первых, это все догадки, так как не факт, что при отсутствии пиратки пользователь купит лицензию, а не подберет бесплатный аналог. Во вторых, никто точно не скажет, сколько экземпляров пиратки находится в употреблении, что еще больше отдаляет предположения от реального положения вещей. И в третьих, немало тех, кто купив раз, будет использовать программу до конца дней, не покупая обновлений. Я вот как купил офис 2000, так и пользуюсь им до сих пор. В сочетании с конвертерами мне хватает.
                    Модель платного ПО уже умерла и смердит.
                    Это Вы так думаете и это Ваше право. Только не нужно безапелляционных заявлений, на самом деле ситуация с пиратством ничуть не меняется уже лет -дцать. По прежнему производители ноют о упущенных барышах и стригут миллионы с тех, кто не может воспользоваться пираткой, например с гос. учреждений или фирм.
                    А сейчас вообще делают проще. Фирмы, торгующие девайсами, напрямую заключают договор с производителем ПО и за доп. плату устанавливают лицензионный софт. Так нередки случаи, когда ноут продают с фри досом, а за 2-3 тыс установят лицензионную винду с офисом, плюс всякие рары, pdf и djvu ридеры. За доп. плату еще кучу лицензионного софта зальют. Так что не надо про смердящее платное ПО, оно просто переходит на новый уровень, пользуясь массой бестолковых покупателей, которым можно втюхать все что угодно. И если кто-то не додумался до такого, то это его проблемы. Мелкософт вот додумался и не жужжит    
                    Любители халявы могут написать такую программу сами и раздавать ее
                    бесплатно. Вы к примеру     Вы ж такой умный.
                    Действительно, раз кто-то не занимается речевыми технологиями, значит он дурак, это же очевидно        
                    Только что-то за 15 лет таких не нашлось писателей.
                    С тем же успехом это может свидетельствовать и о другом - это мало кому интересно. Сравните на форумах количество тем на графику и распознание речи, будете неприятно удивлены чему народ отдает предпочтение.    
                  • 0
                    Нет аватара MsDemonId
                    29.05.1319:20:17
                    И да - МЫ ХОТИМ ЗАРАБАТЫВАТЬ С ПОМОЩЬЮ СВОЕГО ТРУДА.
                    Ну так, бог в помощ! Кто же против? Все разногласие только в одном - в способе зарабатывания    
                • 0
                  RadiantConfessor RadiantConfessor
                  14.05.1509:41:57

                  Вот вы тут всех лечили два года назад, а гугл взял да и сделал тоже самое. Работаете на конкурентов?

                  • 0
                    Нет аватара MsDemonId
                    23.05.1518:20:20

                    Это Вы о чём?

                    • 0
                      RadiantConfessor RadiantConfessor
                      28.05.1515:47:51

                      Вы напирали на то, что облако для распознавания речи хуже локальной версии. При этом и Гугл и Эпл и Майкрософт делают свои системы распознавания речи облачными.

                      Облако это производительность. Облако позволяет реализовать искусственный интеллект. В локальной версии вам ни какой производительности мобильного телефона на такие выкрутасы не хватит.

                      • 0
                        Нет аватара MsDemonId
                        28.05.1522:58:03

                        Вы напирали на то, что облако для распознавания речи хуже локальной

                        версии. При этом и Гугл и Эпл и Майкрософт делают свои системы

                        распознавания речи облачными.

                        Во первых, не хуже локальной, а имеющий определенные недостатки, в частности необоснованная привязка к интернету.

                        Во вторых, гугл по определению является сетевым сервисом и распознавание речи является лишь частью этого сервиса, а не отдельной задачей, как в сабже.

                        В третьих, яблочники как раз и продвигают политику жесткой привязки пользователей своей платформы исключительно к платному софту. По сути они убивают бесплатный софт на своей платформе. Хотите и на PC пользоваться исключительно платным софтом? Денег девать некуда? Лучше отдайте их в ближайший детдом, они им более нужны, чем яблочникам или мелкософтовцам.

                        Облако это производительность.
                        Во всем нужно знать меру. В данном случае производительность облака не нужна, так как задача не требует каких-то запредельных вычислительных мощностей.

                        Облако позволяет реализовать искусственный интеллект.
                        Не смешите мои тапки. Реализация ИИ не имеет никакого отношения к облачным технологиям, а создается на базе нейропроцессоров. Если взять наиболее распространенные системы с элементами ИИ, такие как распознавание лиц или подозрительного поведения в толпе, или систем распознавания типа и количества автотранспорта, да даже банальные системы распознавания автомобильных номеров, то все они строго локальны. Интернет используют только для пересылки уже обработанных данных.

                        И это правильно, во всем должна быть мера, а не слепое следование моде.

                        В локальной версии вам ни какой производительности мобильного телефона на такие выкрутасы не хватит.
                        Тут автор самолично дал оценку производительности процессора, необходимой для нормальной работы сервиса. ЕМНИП она составила нечто сравнимое с Intel 80486DX4-100. Даже смартфоны первых поколений имели производительность в несколько раз больше. Про нынешние и говорить нечего.

                        На мой взгляд наилучший вариант, это предложить пользователю на выбор оба варианта — локальный и облачный. А денежки с локального могут собирать за скачивание обновлений.

                        • 0
                          RadiantConfessor RadiantConfessor
                          29.05.1510:56:59

                          Не смешите мои тапки. Реализация ИИ не имеет никакого отношения к облачным технологиям, а создается на базе нейропроцессоров

                          Дело в том, что нейропроцессорам в мобильниках нет места, а в облаке запросто. кроме того локальное приложение кушает ресурсы, энергию, память, занимает процессор, а облачное требует только связь. Понимаете?

                          Отредактировано: Zveruga~11:58 29.05.15
                          • 0
                            Нет аватара MsDemonId
                            30.05.1510:49:46

                            Дело в том, что нейропроцессорам в мобильниках нет места, а в облаке запросто.
                            Блиииин, ну нельзя же быть таким бестолковым. Нахрена в данной задаче нейропроцессор? Здесь объемы обрабатываемых данных смешные, а алгоритмы хоть и сложные, но все же линейные, так что вполне справится простой. Не нужно по воробьям стрелять из пушки.

                            кроме того локальное приложение кушает ресурсы,

                            энергию, память, занимает процессор, а облачное требует только

                            связь. Понимаете?

                            В отличии от Вас я добрый десяток лет занимался написанием и реверсом программ. Так что не надо мне тут вешать ерунду про ресурсы и память.

                            Что касается энергопотребления. Довольно весомый аргумент для мобилы. Только не в пользу облака. Дело в том, что энергопотребление процессора на порядок меньше потребления приемопередатчика смарта, так как дальность посылки радиоволн прямо пропорциональна мощности передатчика. В итоге, выполняя программу энергию потребляет только процессор. В режиме «только связь" помимо процессора (а он все равно потребляет, так как программа связи то выполняется) начинает кушать еще и приемопередатчик. Вот еще один аргумент в пользу локализации программы    

                            • 0
                              RadiantConfessor RadiantConfessor
                              30.05.1511:19:23

                              А вы почему понять не можете, что энергоёмкие системы всегда будут лучше себя чувствовать вне локального приложения.

                              Просто ответьте, почему ни гугл ни эпл ни майкрософт не стали делать локальных распознователей речи?

                              • 0
                                Нет аватара MsDemonId
                                30.05.1523:11:08

                                А вы почему понять не можете, что энергоёмкие системы всегда будут

                                лучше себя чувствовать вне локального приложения.

                                С какого перепуга? Еще раз повторю, если прошлый раз объяснил недоходчиво. В случае с программой энергию кушает только процессор. В случае с сетью энергию будет кушать тот же процессор + передатчик (кушающий в несколько раз больше процессора). И как в таком случае локальное приложение будет кушать больше облачного?

                                Просто ответьте, почему ни гугл ни эпл ни майкрософт не стали

                                делать локальных распознователей речи?

                                Уже отвечал. Ну да ладно, вкратце.

                                1. Гугл по определению сетевой ресурс. Все его сервисы так или иначе завязаны вокруг инет-поисковика, который по определению не может быть локальным.

                                2. Эпл тоже переключился исключительно сетевое направление, так как это позволяет собирать кучу денег.

                                3. Микрософт тоже стал засматриваться в сторону привязки пользователей к инету, разумеется строго к своим сервисам. Их первая попытка была еще в начале 2000-х, но слава богу тогда нетбуки с треском провалились. Сейчас, благодаря прогрессу, идет более удачная экспансия и народ все больше и больше подсаживается на интернет.

                                ----------------------

                                Ну и чтобы закрыть тему с якобы большой ресурсо- и энергоемкостью, приведу простой пример.

                                Есть движок распознавания речи с открытым исходным кодом: Pocketsphinx. Замечателен тем, что написан на чистом C, благодаря чему легко портируется на любые платформы. Что касается мобил, то есть порты под iOS, WindowsPhone и Java. Так вот, приложение легко и просто запускается прямо на смарте. Достоинство — гибкая настройка распознавания. Можно задать либо свободное распознавание речи, либо четко заданный набор слов (комманд). Последнее — то что доктор прописал, т.к. в этот режим наиболее удобен для создания систем голосового управления чем-либо и ресурсов практически не потребляет.

                                При создании, например, умного дома я лично отдам предпочтение этому приложению, так как оно не зависит от наличия интернета и работает не в пример быстрее. Быстрее потому, что приложению для распознания не требуется связываться с серверами.

                                Можете убедиться: Видео

                                На видео Java-вариант. C-вариант работает в добрый десяток раз быстрее.

                                Вопрос исчерпан?

                                • 0
                                  RadiantConfessor RadiantConfessor
                                  30.05.1523:30:19

                                  Вы хотя бы видели на чём у гугл его распознаватель речи работает? )))

                                  • 0
                                    Нет аватара MsDemonId
                                    30.05.1523:53:06

                                    На керосине. Ну что же, я так понял, что остальные вопросы закрыты? Подведем итог?

                                    1. Скорость - локальное быстрее, т.к. не зависит от качества связи, скорости инета и загруженности серверов. Даже на джаве работает вполне сносно, что расширяет диапазон применяемых аппаратов (например старички на симбиане).

                                    2. Точность - локальное может быть заточено под небольшой словарь, что положительно сказывается на качестве распознавания. Облачные всегда универсальны и пока еще подвержены ложным срабатываниям.

                                    3. Стоимость - локальное вообще бесплатно!

                                    4. Универсальность - тут облака рулят и позволяют более качественно вводить общий текст голосом.

                                    По трем из четырех критериев локальное приложение однозначно рулит. Да и по четвертому не все однозначно, с теми же СМС вполне справится.

                                    • 0
                                      RadiantConfessor RadiantConfessor
                                      31.05.1500:51:23

                                      Просто запускать на мобильнике распознавание речи с таким уровнем интеллекта ка в гугл у вас не получится. Тут нужен целый минисуперкомпьютер и много-много энергии. Но вы не хотите это признавать. Даже после того как такие фирмы как гугл, эпл и майкрософт опровергли ваши доводы.

                                      • 0
                                        Нет аватара MsDemonId
                                        31.05.1517:47:51

                                        Вот ведь упорный    

                                        Я дал конкретную ссылку на конкретный бесплатный продукт, ни в чем не уступающий ни гуглу, ни яндексу, ни эплу ни кому другому, так как принципы распознавания у всех одинаковы, разница только в реализации. Более того, подкрепил это видосом с демой конкретного устройства. Причем продукт очень гибкий в настройке под конкретные нужды и под любую платформу. Нужно распознавание всего текста? Там есть словарь на 500000 русских слов, подключайте и будет Вам счастье. Более-менее современные смарты легко справятся с таким словарем.

                                        Вы же не привели ни одного довода в пользу облачных решений. Ни одного, кроме святой веры в святую троицу — гугла, огрызка и мелкософта. Неужели трудно понять, что ими движет исключительно жажда наживы? Как заметил один из авторов A.I.Kid Speereo, в споре со мной, если программу локализовать, то неизбежно появятся пиратки и они не дополучат часть потенциальной прибыли. Привязав программу к облаку они избавляются от проблемы с пиратками, а значит мимо их кармана не уйдет ни одна копейка. По его же словам это и стало одной из основных причин в пользу выбора облака, а вовсе не ресурсоемкость программы (хотя бы мое с ним обсуждение почитайте). Собственно вот его коментарий:

                                        Cопрут. Так понятно? Зачем бесплатно работать?

                                        В случае отдельного приложения — это неизбежно. Взлом, варезы, торренты. Миллионы юзеров, благодарящих засранцев «за полезную прогу» на варезном форуме.

                                        Сопрут сами разработчики ОС — при «подписывании» получают возможность обратного инжиниринга на своей же ОС и со своего же компилятора.

                                        Точно такой же логикой руководствуются и гуглы с эплами, а вовсе не мифической сложностью и ресурсоемкостью программы.

                                        Ну и последний раз, надоело уже:

                                        Тут нужен целый минисуперкомпьютер и много-много энергии.
                                        То есть один из авторов A.I.Kid Speereo врет, утверждая, что:

                                        Мы можем и на клиенте!

                                        И даже на 100 MIPS!

                                        100 MIPS — Это Pentium-60 МГц! Еще раз, чтобы дошло — данная программа может пойти на процессоре с частотой в 60 МГц! Даже древний смарт Nokia N73 имеет процессор в 300 МГц, причем более производительной архитектуры.

                                        Если есть обоснованные контраргументы, то отвечу. Доводы, типа «Тут нужен целый минисуперкомпьютер и много-много энергии. Но вы не хотите это признавать.» не принимаются, так как попахивают, точнее даже пованивают, натуральным тролизмом.

                                        • 0
                                          RadiantConfessor RadiantConfessor
                                          31.05.1518:02:34

                                          Дело в том, что речь идёт об интеллектуальном опознавании речи, а оно невозможно без больших объёмов данных. По этому все мобильные приложения будут уступать облачным.

Написать комментарий
Отмена
Для комментирования вам необходимо зарегистрироваться и войти на сайт,