|   |   |   |   |   |  Подкасты (353)  | 
  • RSS
Особенности Telegram, WhatsApp, Viber и других «мессенджеров» «Безупречная» работа смартфонов от А-брендов Ночь, улица, фонарь, аптека… Поэтайзер MWC 2017 — все материалы выставки
Обзоры Статьи Описания

Версия для печати Блоггерам

Голосовые сервисы и их будущее развитие на примере Alexa от Amazon

Голосовые команды появились давным-давно, но так и не стали революцией, которая навсегда изменила наш мир, а когда-то казалось, что именно так и произойдет. Зачем нажимать на кнопки телефона, если можно произнести команду и он тут же выполнит ее? В те времена казалось, что голосовой интерфейс – это будущее, за которое стоит побороться, и в этой гонке участвовали многие компании. Но они быстро осознали, что сам по себе интерфейс не дает ровным счетом ничего, люди стесняются разговаривать со своими устройствами, им это кажется ненормальным. Голосовой набор стал чем-то привычным, но особо не используемым в повседневной жизни, пока не произошел повторный расцвет, в первую очередь за счет голосового поиска и распознавания на Android, во вторую очередь за счет Siri от Apple. Люди стали чаще использовать голосовой набор, команды для установки будильников и напоминаний, причем происходит это уже на естественном языке. Достаточно сказать фразу «OK, Google, поставь будильник на 7 утра», чтобы ваш смартфон это сделал. Такого рода команд огромное количество, и они позволяют обходиться без рук, с телефоном можно общаться голосом, и он сносно распознает все команды. Десять лет назад о таком можно было только мечтать, а сегодня это уже привычная деталь современных устройств, которая не вызывает никакого удивления, а воспринимается некой повседневной нормой. Постепенно непривычность этого интерфейса исчезает, все чаще мы задаем поисковые запросы голосом, так как это быстрее, чем набирать текст на сенсорной клавиатуре. Равно как и телефоны начинают нам отвечать голосом, а не просто показывать странички. Это очень удобно в машине, когда нет времени смотреть на экран, а узнать что-то необходимо, либо нужно внести заметки о встрече в свой календарь.

Первой компанией, что попыталась перенести эти наработки в домашнюю обстановку и преуспела в этом, стала компания Amazon. Пару лет назад они выпустили помощника – Amazon Echo, небольшую колонку, которая распознает голосовые команды и позволяет получать ответы на свои вопросы, добавлять информацию в свой календарь, ставить будильники, одним словом, делать все то, что вы можете сделать на смартфоне. Относительно недавно вышла вторая версия устройства – Echo Dot, она стала меньше, а голосовой помощник, которого зовут Alexa, стал чуточку умнее. Посмотрите ролик про Alexa, чтобы понять, что она умеет сегодня. Перевод не требуется, смысл рассказа понятен и так.

У Google есть аналогичное устройство, которое называется Google Home, и оно обладает примерно теми же возможностями, что и Echo. Отмечу, что в Google Home лучше работает распознавание голоса, можно говорить сложные фразы, а вот Echo примерно на уровне Siri, часто сложные вопросы ставят систему в тупик. Зато у Echo есть поддержка многих устройств умного дома, которые можно контролировать голосом, это преимущество того, что Echo появился несколько раньше. Часто эти системы сравнивают между собой по текущим возможностям и параметрам, что, на мой взгляд, несколько преждевременно.

Голосовые сервисы и их будущее развитие на примере Alexa от Amazon

Мы находимся в самом начале развития голосовых помощников и эволюции их интерфейсов, и говорить о том, что кто-то уже выиграл эту гонку, нельзя. Качество работы голосового помощника будет зависеть от нескольких моментов, попробую перечислить их в случайном порядке:

  • Качество распознавания речи;
  • Качество синтеза речи;
  • Возможность «понимания» как простых команд, так и сложных вопросов, заданных в произвольной форме.

Первые два пункта носят сугубо технический характер, пути решения для этих вопросов понятны, и ежегодно качество распознавания речи на разных языках возрастает. Более того, тот же Google уже научился распознавать вкрапления слов, сказанных на других языках, например, сказав «хочу послушать Deep Purple», вы увидите правильную расшифровку названия группы на английском языке. Система распознавания постепенно обучается тому, что не всегда люди в одной фразе пользуются исключительно своим родным языком, давая оригинальные имена явлениям, музыкальным группам, да много чему.

Сложнее ситуация с пониманием сложных предложений, например, задавать Alexa или Siri длинные вопросы не стоит, ответ скорее всего вас разочарует. А вот попробовать пообщаться с Google о том, почему Толстой выбрал таких героев для романа «Война и мир», можно попробовать. Коренное отличие подхода Google от того же Amazon или Apple заключается в том, что голосовой интерфейс не является для компании чем-то отдельным, он часть большей системы поискового гиганта. Фактически, имея постоянно улучшающийся поиск, в Google переносят его в голосовой интерфейс, что позволяет добиться намного лучших результатов, чем у конкурентов. В этой гонке выигрывает не тот, кто создает лучшую технологию распознавания голоса или синтеза речи, а тот, кто может создать систему, умеющую предугадывать желания пользователей и создавать для них дополнительный комфорт. Условно идеологию Google следующего десятилетия можно описать так: «отвечать на вопросы людей, которые они еще не успели задать». В то же время Amazon, Apple и другие компании планируют и создают системы, что напрочь лишены прогнозной части, а умеют лишь отвечать на четко поставленные вопросы. Типовой сценарий, например, прогноз погоды или маршрут до работы, считать сложным прогнозом нельзя, это банально и неинтересно. Хотя для кого-то, может, и создает видимость «интеллекта» машины.

Проблема успешного помощника заключается в необходимости доступа к большому объему информации, как к вашим личным данным, так и к различным сервисам. Приведу такой пример. Каждый год у меня есть традиционные поездки на выставки, в январе я отправляюсь на CES в Лас-Вегас, в феврале-марте – в Барселону на MWC, в сентябре еду в Берлин на IFA. Каждый год маршруты примерно одинаковы, равно как и та информация, которая мне нужна как до поездок, так и во время них. Как может определить мою поездку тот же Amazon или Siri? По факту писем, в которых содержатся билеты, бронь на гостиницу, или соответствующих поисков, которые сделаны через устройства этих компаний. В случае Google компания «видит» мою историю перемещений и может проанализировать ее, причем такой анализ может быть многоплановым – это история геометок, анализ фотографий и того, что на них изображено, почта с письмами и так далее. Не стоит недооценивать смартфоны на Android, так как они дают всеобъемлющую информацию о том, что мы делаем, когда и как. Анализируя эти данные, можно понять наши пристрастия в еде (сколько вы провели времени в ресторанах, какие вам нравятся больше, какие меньше, сколько времени вы скучали за столом и сидели в телефоне). Та же Alexa ничего этого не знает и никакой возможности узнать не имеет, она отрезана от мира и заточена в вашем доме. А значит, прогнозирование для нее – это тайна за семью печатями, обеспечить высокий уровень система не сможет. Уникальность положения Google заключается в том, что это одновременно поисковый гигант и производитель платформы, что установлена на большинстве мобильных устройств в мире. Тот же Apple в теории может попытаться собирать ровно те же данные, но их качество будет заметно ниже, у них просто нет аналогичных возможностей по обработке данных, что хорошо видно на примере карт от Apple: число POI, их качество и подробности оставляют желать лучшего. В теории они смогут улучшить эти параметры до уровня текущего Google за 4-5 лет, но за это время и Google уйдет вперед.

У Amazon еще меньше данных, чем у Apple, поэтому у них перспектив на этом рынке и того меньше. Из крупных игроков можно и нужно вспомнить Microsoft, которые страдают от отсутствия данных из полей, у них нет мобильных устройств на своей ОС. А есть еще Facebook, который максимально близок к Google по сбору информации о том, что делают его пользователи ежедневно, но также страдает из-за отсутствия поисковой информации в большом количестве. Любая компания, которая захочет стать сильным игроком на рынке голосовых помощников, будет вынуждена решать очень сложный вопрос: где взять поисковую информацию, которая сможет повысить точность прогнозов и сделать их полезными.

В моем примере это будет означать необходимость предоставить мне наилучшие билеты в другие города, подсказать на основании исторических данных, когда их лучше всего купить, а также посмотреть те гостиницы, в которых я уже останавливался, и предложить наилучшие цены. Возможно, в автоматическом режиме написать в гостиницу и запросить скидку для постоянного клиента. Фантастика? Поверьте, эта фантастика случится с нами намного быстрее, чем вам кажется, это дело ближайшего десятилетия. Автоматизация нашей жизни произойдет моментально, и нам она наверняка понравится, хотя не обойдется и без шишек во время становления технологии. Например, текущие голосовые помощники не идентифицируют своих владельцев по голосу, достаточно сказать команду, и они начинают работать. Доходит до смешного, люди смотрят на телевизоре или компьютере ролик про проблему Alexa с заказом кукол для детей без ведома владельцев, и их Alexa также распознает команду на покупку и отправляет такой заказ! Это забавная иллюстрация того, что в будущем идентификация хозяина по голосу станет необходимой частью таких систем, они пока в самом начале своего пути.

С коммерческой точки зрения лидер сегодняшнего рынка помощников для дома – это Amazon. В компании не стали держать Alexa только для себя, а лицензируют эту технологию всем желающим. На CES 2017 больше десятка компаний показали свои продукты со встроенным помощником Alexa, это как прямые копии домашнего помощника Echo от Amazon, так и интеграция Alexa в телевизоры, холодильники, стиральные машины и даже наушники.

Голосовые сервисы и их будущее развитие на примере Alexa от Amazon

Пожалуй, именно этот факт и заставляет многих думать, что наступает время Amazon на этом рынке, но у меня есть свое мнение об этом. Засилье Alexa в продуктах других компаний связано с тем, что в Google не дают своего ассистента вовне, так как не считают его готовым. Он еще проходит обкатку в разных продуктах компании, например, вы можете загрузить мессенджер Allo и пообщаться с помощником в нем, увидите довольно нетривиальные варианты взаимодействия (пока, увы и ах, только на английском языке).

Голосовые сервисы и их будущее развитие на примере Alexa от Amazon Голосовые сервисы и их будущее развитие на примере Alexa от Amazon Голосовые сервисы и их будущее развитие на примере Alexa от Amazon

Как показывает история, в Google выпускают свои технологии на широкий рынок и не стремятся создавать самостоятельно железо, так случится и с условным Google Home, он будет доступен всем желающим, как только технологию сочтут готовой для массового рынка. Это значит, что у Alexa есть не так много времени, чтобы закрепиться на рынке. Тем более что работает Alexa поверх того же Android, то есть замена этого помощника на таковой от Google может происходить легко и просто. Скорее всего, мы увидим аналоги Google Home от разных компаний в конце 2017 - начале 2018 года.

В какой-то мере это пока очень узкая ниша, этакое устройство для управления умным домом и поиска, лишенное экрана на корпусе (смартфон – вот его удаленный экран) и с голосовым интерфейсом. Обратите внимание, что голосовых интерфейсов в нашей жизни незаслуженно мало, их почти нет. Я смог вспомнить лифты, которые отсчитывают этажи и говорят, куда они движутся, машину, которая сообщает важные новости голосом, и, пожалуй, все. Телефоны в расчет не беру, тут все понятно, интерфейс присутствует, и мы им пользуемся. Возможно, что эта тема станет модной на короткий промежуток времени. Возможно, что нет. Это не играет роли, так как голосовые интерфейсы станут стандартными для множества устройств, они выглядят естественно и позволяют избежать необходимости добавлять на корпус кучу клавиш и управляющих элементов, многие из которых излишни. Пример из другой области – это наушники The Dash от компании Bragi. В них есть голосовой помощник, который помогает их настроить и управлять наушниками в разных ситуациях. Нечто подобное есть у разных производителей, но именно в этих наушниках помощник стал не просто удобным, а приятным в использовании и выглядит естественно.

Голосовые интерфейсы вылезли из пеленок, технология стала взрослой. Но если у Google они присоединена ко всему, что делает компания в других областях, и будет использована для прогнозирования того, что вам нужно, то у других компаний все намного проще. В этом отличие, и поэтому я верю в то, что Google в конечном итоге будет очень популярен на этом рынке, повторит успех Android. Собственно голосовые помощники станут производным от Android для Google. Параллельно надо сказать, что получат развитие обычные голосовые интерфейсы для управления большим числом устройств, это будут простые или даже сложные команды. Например, вы сможете побеседовать со своим чайником и сказать, что-то этакое: «Вскипяти воду к вечерним новостям и напомни мне об этом свистком». Но это просто управление, а не прогнозирование, и не стоит путать эти две области. Чайник в Google Home, наоборот, вскипит за минуту до того, как вы решите прийти на кухню и включить его. Но это случится не завтра, а чуть позднее, когда такие системы получат широкое распространение. Мы уже движемся к этому семимильными шагами.

Ссылки по теме

Эльдар Муртазин (eldar@mobile-review.com)
Twitter    Instagram    Блог MrMurtazin.com

Опубликовано — 12 января 2017 г.

Мы в социальных сетях:

blog comments powered by Disqus

Есть, что добавить?! Пишите... eldar@mobile-review.com

 

Новости:

27.02.2017 Компания Archos займется персональным электротранспортом

27.02.2017 ZTE Blade V8 Mini – компактный смартфон для любителей фотографии

27.02.2017 Blade V8 Lite — обновление молодежной линейки ZTE Blade

27.02.2017 MediaTek и Nokia будут разрабатывать сети 5G совместно

27.02.2017 MediaTek представила чипсет Helio X30 с технологией энергосбережения CorePilot 4.0

27.02.2017 ВымпелКом объявил финансовые и операционные результаты за 4 квартал 2016 года

27.02.2017 Axon 7 – первый Daydream смартфон компании ZTE

27.02.2017 ESET: новый шифратор для macOS маскируется под кряк для легального софта

Hit

27.02.2017 Видео на канале: Обзор смартфона Meizu M5

Hit

27.02.2017 Видео на канале: Знакомство с Huawei P10

27.02.2017 Sony анонсировала новый флагманский смартфон Xperia XZ Premium с функцией сверхзамедленной съемки видео

27.02.2017 Состоялось возвращение Nokia 3310

27.02.2017 Huawei Watch 2 – новые смарт часы от китайского производителя

27.02.2017 Samsung анонсировала новую линейку планшетов Galaxy Tab S3 и Galaxy Book

26.02.2017 Lenovo представила новые Moto G5 и Moto G5 Plus

26.02.2017 Huawei представила свой флагман этого года – P10 с двойными камерами и оптикой Leica

26.02.2017 LG представила свой новый флагманский смартфон LG G6

25.02.2017 Сегодня состоится анонс нового Android смартфона BlackBerry Mercury с аппаратной QWERTY клавиатурой

Hit

24.02.2017 BLUBOO R1: первый защищенный телефон, поддерживающий беспроводную зарядку

24.02.2017 ARCHOS 50 Graphite и ARCHOS 55 Graphite – недорогие смартфоны с двойными камерами

24.02.2017 LG представила свой новый «долгоиграющий» смартфон LG X power2

23.02.2017 Стали известны технические характеристики Samsung Galaxy S8+

Hit

23.02.2017 Видео на канале: Обзор гарнитуры Jabra Elite Sport

23.02.2017 Samsung официально представил свой новый мобильный процессор серии Exynos 9

23.02.2017 ARCHOS 101 Saphir – недорогой защищённый планшет «2 в 1»

Подписка
 
© Mobile-review.com, 2002-2017. All rights reserved.