Согласно данным ВЦИОМ, голосовыми сообщениями пользуются 64% россиян. Невидимый, но полезный ассистент: что умеют делать Алиса, Маруся и другие российские голосовые помощники. Число используемых цифровых голосовых помощников к 2023 году утроится и составит 8 млрд по всему миру, говорится в исследовании Juniper Research.
В Петербурге назвали самых популярных голосовых помощников
Несмотря на то, что голосовые помощники уже в то время были привычным делом, Алисе удалось произвести впечатление на русскоговорящую публику. Голосовые ассистенты незаметно входят в нашу обыденную жизнь, что подтверждает исследование Google: помощником пользуются более чем один раз в день 41% взрослых и 55% подростков. Поскольку развитие голосовых ассистентов своими силами связано с продолжительными инвестициями, за исключением гигантов никто позволить себе такого не может. Рассказываем, каких голосовых ассистентов чаще всего используют россияне, в каких случаях просят их помочь и почему некоторые обходят стороной эту технологию.
Новости дня
- Выбираем лучший голосовой ассистент: Siri vs Google Ассистент vs Алиса
- Как настроить Марусю на телефоне. Здесь всё, что нужно знать
- ВЦИОМ: более 60% опрошенных россиян пользуются голосовыми сообщениями
- Самые умные: Сири и Алиса
- Банки визуализируют голосовых помощников
Список TOP-30 популярных голосовых помощников в мире
Для каждого намерения есть специальная модель, которая выделяет полезную информацию в том, что сказал пользователь, — она называется семантическим теггером. Теггер для погоды по предложению «Будет ли завтра дождь? Задавая вопросы, люди редко проговаривают всю нужную для ответа информацию, поэтому голосовому помощнику приходится её достраивать. Например, чтобы понять, погоду в каком городе хочет узнать пользователь, ассистент может либо переспросить пользователя, либо получить эту информацию сам, если на смартфоне включено определение геолокации. Только после этого помощник может дать подходящий ответ. Как голосовых помощников учат быть человечными Если запрос не подошёл ни под один из сценариев, то его перенаправляют в поиск или в модуль для неформальных разговоров — в Алисе его называют «болталкой». Голосовых ассистентов часто используют не для того, чтобы узнать или сделать что-то конкретное, а чтобы поиграть: спросить у помощника, какие книги ему нравятся или что на нём надето. Эта задача решается при помощи редакторских ответов: команда авторов выбирает сотни наиболее популярных у пользователей вопросов и пишет по несколько вариантов ответа на каждый. Составлять ответы нужно в едином стиле, чтобы из них складывался цельный образ помощника.
У каждого голосового ассистента есть личность: пол, имя, черты характера и стиль речи. Алиса не может позволить себе общаться с пользователем на «ты» и соблюдает дистанцию: здесь у неё есть прототип — Мэри Поппинс. Поэтому помощница не любит, когда с ней начинают заигрывать и сразу одергивает пользователя. Для ответов на неклассифицируемые вопросы и реплики голосовые помощники обычно используют нейросети, обученные на базе текстов из медиа, книг и кино. Так, Алиса учится на самых разных материалах, в которых персонажи в том числе ругаются и спорят — и может научиться совсем не тому, чего хотят разработчики.
Кроме того, маркетинговые голосовые ассистенты, которые производят обзвон потенциальных клиентов, генерируют компаниям дополнительную прибыль. В будущем отличить голосового ассистента от живого человека станет почти невозможно, считают специалисты. Каковы перспективы Исследование Group4media , опубликованное в октябре 2022 г. Исследование проводилось с января по сентябрь 2022 г. В опросе приняли участие жители российских городов с населением от 100 000 в возрасте от 14 лет. Виртуальные голосовые помощники — это развитие технологии чат-ботов на основе ИИ. К классическому боту «прикручивается» две технологии: синтеза голоса и распознавания речи. Хорошо обученные модели позволяют голосовому ассистенту поддерживать разговор с пользователем. Например, клиент спрашивает что-то, одна нейронная сеть переводит голос в текст, другая анализирует его и ищет ответ в базе знаний.
Голосовые помощники экономят время пользователей: с их помощью можно мгновенно включить музыку или набрать нужный номер. Однако для того, чтобы правильно отреагировать на запрос человека, голосовому ассистенту нужно выполнить десятки действий: распознать отдельные звуки, представить их в виде чисел, перевести в текст и так далее. Академия Яндекса составила путеводитель по работе голосовых помощников и узнала у разработчиков Алисы, как их речь делают человечной. Как голосовые помощники распознают речь Первая стадия в работе голосового ассистента — это обработка звука. Если сказать помощнику «Лев Толстой», то он услышит не два слова, а звуковой сигнал, в котором гласные и согласные плавно перетекают друг в друга. Задача системы распознавания речи SpeechKit — восстановить по этому сигналу то, что человек говорил. Процесс распознавания осложняется тем, что одни и те же фразы, произнесённые разными людьми в разной обстановке например, в вагоне метро или в безлюдном парке , будут давать непохожие друг на друга сигналы. Поэтому для распознавания речи голосовой помощник делит слова на звуковые фрагменты — фонемы. Носители языка узнают именно их: например, первые гласные в словах «дом» и «домашний» мы воспринимаем одинаково, хотя звуки разные. В Алисе различают всего 48 фонем — в соответствии с подходом Ленинградской фонологической школы. Для того, чтобы распознавать фонемы, помощник работает с их числовым представлением. Так, когда вы произносите запрос, смартфон записывает его и отправляет на сервер компании, которая разрабатывала голосового помощника. Там запись разделяется на множество маленьких фреймов — фрагментов речи длиной в сотые доли секунды. Затем каждый фрейм подвергают математическим преобразованиям и в результате получают коэффициенты, описывающие его частотные характеристики.
Несовершенная технология Хотя схема выглядит стройной и понятной, она по-прежнему изобилует багами. Только за прошлый год голосовые помощники спровоцировали несколько довольно громких инфоповодов. Например, Алиса по ошибке выдавала личный номер тверского пенсионера за номер администрации города Конаково. В итоге на бывшего мэра, давно ушедшего на пенсию, обрушилась лавина звонков горожан, желающих заказать пропуск. Та же Алиса вгоняла пользователей в ступор открытой критикой президента и фразами о том, что «он попал в Кремль случайно». Это лишь некоторые из ошибок, просочившихся в сеть. Куда больше милых багов, с которыми мы сталкиваемся при ежедневном взаимодействии с голосовыми помощниками. Но они по-прежнему пользуются спросом. За что мы их любим Люди говорят почти в четыре раза быстрее, чем печатают. Голосовой помощник помогает быстрее ввести данные и получить ответ. Конечно, при условии, что программа чётко распознала речь и нашла шаблон в базе данных. Голосовым приложением чаще пользуются, когда заняты руки. По этой причине из голосового приложения на смартфоне помощники быстро перекочевали в музыкальные колонки и умный дом. Можно заниматься домашними делами и параллельно заказывать еду из ресторана, не отвлекаясь на нажатие кнопок. Самый популярный ответ на вопрос, почему вы используете виртуальных ассистентов — «Это быстро» исследование Stonetemple Голосовые чатботы заменяют десятки сотрудников. Бизнесу выгоднее вложиться в разработку голосового помощника, ведь бот может общаться с сотнями клиентов одновременно, не уставать и не бегать покурить каждые полчаса. Помощника можно персонализировать. Изменить голосовые команды, дать имя ассистенту вместо «заводского» и даже выбрать голос, чтобы о погоде и курсах валюты вам рассказывал Трамп или Баста. Просто интересно. Каждый хотя бы раз так делал: задавал Алисе странный вопрос, а потом издевался над её ответом. А как ещё мог бы появиться баг с критикой Путина? Что бесит в голосовых помощниках Бот не понимает команды. Когда десять раз просишь включить ребёнку сказку про муми-тролля, а колонка десять раз включает Лагутенко, рано или поздно приходишь к мысли, что проще было бы написать. Сложнее преодолеть языковой барьер. Текстовый запрос можно быстро перевести онлайн-переводчиком, а голосовой ассистент общается на ограниченном наборе языков. Неловко как-то. Легче всего в контакт с голосовыми помощниками вступают зумеры. Бумерам, поколению 1990-х и даже миллениалам трудно заставить себя разговаривать с колонкой, чайником или утюгом.
Список TOP-30 популярных голосовых помощников в мире
Наш список голосовых ассистентов поможет вам выбрать наиболее подходящего, чтобы он стал вашим надежным помощником в повседневных задачах. Статья Голосовые ассистенты (Роботы-операторы), 80% опрошенных россиян постоянно общаются с голосовыми помощниками, В первом полугодии количество звонков с помощью голосового робота составило 360 млн, Смотрите также Голосовые помощники. Это один из первых российских голосовых помощников — его запустили в 2018 году.
Рынок умных колонок и голосовых ассистентов в России и мире
Однако технология распознавания голоса была разработана задолго до появления всемирно известных на сегодняшний день голосовых помощников. Начиналось все в 1952 году, когда было анонсировано появление первого голосового распознавателя чисел, разработанного компанией Bell. Позже, мир увидел инструмент под названием Shoebox, который был представлен IBM на Всемирной выставке в Сиэтле в 1962 году. Разработка была способна выполнять математические функции, а также распознавать 16 произнесенных слов и цифры от 1 до 9. Следующим этапом стало решение Harpy, созданное учёными университета Карнеги — Меллон в 1970-х годах, распознающее уже 1011 слов, что соответствовало словарному запасу трёхлетнего ребёнка. Как только были созданы технологии, способные распознавать последовательности слов, компании начали создавать для них приложения. В течение 1990-х годов такие компании, как IBM, Apple и другие, занимались разработкой решений, использующих распознавание голоса: в 1993 году Apple выпустила Macintosh с технологией PlainTalk, а в апреле 1997 года Dragon представила решение, позволяющее превращать в текст до 100 слов в минуту. Далее развитие шло в направлении решений для умного дома: в ноябре 2014 года Amazon представила смарт-динамик Alexa, через два года, в ноябре 2016-го, компания Google выпустила Google Home, а в феврале 2018 года на этот рынок вошла и компания Apple, представив Apple HomePod. А что происходит на рынке голосовых помощников в России сегодня?
Способствовать этому будет развитие рынка умных домашних устройств. В тексте и голосе уже очевидно повсеместное распространение ботов, а вот видео, личное общение и остальные более сложные коммуникации только начинают внедряться", - отмечает начальник управления "Мессенджеры и чат-боты" департамента цифрового бизнеса ВТБ Александр Раихин. Самыми популярными и известными чат-ботами являются виртуальные ассистенты, которые разрабатывают крупнейшие корпорации. Российские крупнейшие корпорации также занимаются разработкой собственных виртуальных помощников - Алиса от "Яндекса", Олег от Тинькофф Банка и Маруся от Mail.
Куда больше милых багов, с которыми мы сталкиваемся при ежедневном взаимодействии с голосовыми помощниками. Но они по-прежнему пользуются спросом. За что мы их любим Люди говорят почти в четыре раза быстрее, чем печатают. Голосовой помощник помогает быстрее ввести данные и получить ответ. Конечно, при условии, что программа чётко распознала речь и нашла шаблон в базе данных. Голосовым приложением чаще пользуются, когда заняты руки. По этой причине из голосового приложения на смартфоне помощники быстро перекочевали в музыкальные колонки и умный дом. Можно заниматься домашними делами и параллельно заказывать еду из ресторана, не отвлекаясь на нажатие кнопок. Самый популярный ответ на вопрос, почему вы используете виртуальных ассистентов — «Это быстро» исследование Stonetemple Голосовые чатботы заменяют десятки сотрудников. Бизнесу выгоднее вложиться в разработку голосового помощника, ведь бот может общаться с сотнями клиентов одновременно, не уставать и не бегать покурить каждые полчаса. Помощника можно персонализировать. Изменить голосовые команды, дать имя ассистенту вместо «заводского» и даже выбрать голос, чтобы о погоде и курсах валюты вам рассказывал Трамп или Баста. Просто интересно. Каждый хотя бы раз так делал: задавал Алисе странный вопрос, а потом издевался над её ответом. А как ещё мог бы появиться баг с критикой Путина? Что бесит в голосовых помощниках Бот не понимает команды. Когда десять раз просишь включить ребёнку сказку про муми-тролля, а колонка десять раз включает Лагутенко, рано или поздно приходишь к мысли, что проще было бы написать. Сложнее преодолеть языковой барьер. Текстовый запрос можно быстро перевести онлайн-переводчиком, а голосовой ассистент общается на ограниченном наборе языков. Неловко как-то. Легче всего в контакт с голосовыми помощниками вступают зумеры. Бумерам, поколению 1990-х и даже миллениалам трудно заставить себя разговаривать с колонкой, чайником или утюгом. Ощущение идиотизма ещё сильнее, если приходится общаться с техникой в публичных местах. Использовать голосовую команду для поиска информации без визуала сложно. На вопрос «Сколько времени? А покупка техники, выбор отеля или ресторана уже требуют в ответ фотографии и видео. Проблемы с защитой персональных данных. Например, Siri можно активировать, когда телефон находится в фоновом режиме.
При разработке нужно будет реализовать бизнес-логику и интеграции. А после этого протестировать навык и запустить его. Какой голосовой ассистент лучше Алиса от Яндекса Интерфейс Алисы на смартфоне. Помощник помогает пользователю в решении разных задач: Ищет информацию. Алиса может найти информацию по различным темам: погода, новости, курсы валют. Отвечает на вопросы. Развлекает пользователя. Включает музыку, фильмы, подкасты. Напоминает о событиях. Так ассистент уведомляет о важных мероприятиях: дни рождения, встречи. Переводит тексты на другие языки. С помощью Алисы можно переводить тексты на более чем 100 языков. Взаимодействует с детьми. Читает сказки, объясняет уроки. Управляет другими устройствами — умными лампами, кондиционерами, роботами-пылесосами. Но стоит учитывать, что некоторые функции могут быть недоступны для пользователей Алисы. Все зависит от географического положения человека и степени проникновения сервисов Яндекс. Например, если в вашем городе нет Яндекс. Такси, то заказать машину через Алису не получится. Также стоит учитывать, что лучше всего Алиса понимает русский язык. Помощник поддерживает другие языковые версии, но функционала в них может быть меньше. Алиса может работать на смартфонах, планшетах, десктопах, умных колонках и телевизорах. Кроме того, разработчики Алисы сделали ее доступной для iOS и Android. Личность Алисы При создании помощника разработчики прописали характер персонажа. Ассистент — молодая девушка, которая всегда готова помочь пользователю. При этом в общении ассистент аккуратно держит дистанцию, она не высокомерна, а при оскорблении аккуратно отстраивается от диалога. Разработчики старались сделать Алису самоироничной, добавить уместные шутки в ее речь. Семейство помощников Салют от Сбер Интерфейс Салюта на смартфоне. Источник Разработчики голосового ассистента от Сбера шагнули дальше и решили предоставить пользователю на выбор трех помощников: Джоя, Афину и Сбера. У каждого из ассистентов свой характер и особенности, можно выбрать наиболее подходящего для себя помощника. Однако функционал у них в целом одинаковый. Салют может: Найти информацию и ответить на вопросы. Можно узнать погоду, гороскоп совместимостей, новости и многое другое.
Самые умные голосовые помощники на сегодняшний день
Несмотря на то, что голосовые помощники уже в то время были привычным делом, Алисе удалось произвести впечатление на русскоговорящую публику. Голосовой помощник знает, когда ребенок зашел в школу и во сколько вышел из нее. В большинстве случаев использование голосовых ассистентов сводится к нулю: то они плохо понимают запрос, то не могут его выполнить. Голосовые помощники сегодня — Голосовой робот «Мегафона» поможет пассажирам NordStar не опоздать на рейс.
Рынок умных колонок и голосовых ассистентов в России и мире
Редакция «Эльдоблога» продолжает серию статей по умным технологиям. В этот раз мы представим топ голосовых помощников, которые сейчас есть на российском рынке, поговорим об их достоинствах и недостатках. Почему голосовые помощники полезны? Записав напоминалку, человек освобождает мозг от рутины — именно так делают руководители, перекладывая обязанности на секретаря. А с голосовым помощником не надо тратиться на секретаря и успеть можно гораздо больше. Если у вас заняты руки, голосовые помощники придут на помощь: даже если вы за рулем, рисуете или готовите обед, сообщение само отправится, звонок кому нужно совершится, а новости узнаются. Умный дом. Электронные ассистенты помогут настроить свое пространство в доме — по одной фразе можно запустить несколько действий. И все работает без вас: пылесос убирает, кондиционер охлаждает или греет, чайник кипятится, а вы занимаетесь чем-то более важным. Возьмут на себя охрану и безопасность дома.
Поиграют с детьми в развивающие игры, помогут выучить иностранный язык и даже исправить произношение. Помогут сэкономить: найдут товары или услуги дешевле и ближе к дому. Например, в 2021 году в США было сделано 45 миллионов голосовых покупок. По данным компании Voicebot, это в два раза больше, чем в 2018 году. Российский рынок пока отстает, но перспективы у голосовых покупок в России тоже очень неплохие. Голосовые помощники закажут такси или еду, запишут к парикмахеру. Помогут заняться спортом, подскажут полезные упражнения и поделятся мотивационными техниками. Помогут стать шеф-поваром: надиктуют рецепты и дадут команды умным кухонным гаджетам. Голосовых ассистентов и ботов выпускают даже те фирмы, которые раньше и не думали этого делать.
Ранее мы рассказывали: Алисе — 5 лет. Какие гаджеты с Алисой мы особенно любим? Яндекс Алиса Если вы и не пользовались этим виртуальным ассистентом, то наверняка о нем слышали.
Частично обойти ограничения можно, если сделать ассистента от VK Group основным: Откройте настройки телефона.
Перейдите в раздел «Приложения», а затем — «Все приложения». Нажмите на «три точки». Откройте вкладку «Приложения по умолчанию». Выберите Марусю в пунктах «Голосовой помощник», а также «Помощник и голосовой ввод».
Голосовым помощником по умолчанию является Google Assistant, и это нужно исправить Эти настройки помогут вам запустить Марусю через любой приложение, воспользовавшись комбинацией кнопок или кратковременным нажатием на кнопку питания. Предварительно на вашем смартфоне должна быть включена соответствующая опция в разделе «Функции кнопок». Без этой функции быстрый запуск не сработает Сколько бы разрешений Марусе я ни выдал, она никак не хочет запускаться голосом. Таковы ограничения Google, которые тот же Яндекс обходит при помощи собственного лончера.
Сделает ли что-то подобное VK Group — неизвестно.
Исследование проводили с января по сентябрь 2022 года, а в опросе приняли участие жители крупных российских городов. Пожалуй, единственный способ найти себе друга после тридцати.
То, что совсем недавно выглядело, как игрушка для убийства времени, превратилось в полноценный инструмент. Основным инструментом для взаимодействия предсказуемо оказался смартфон, — люди, разговаривающие с настольным компьютером всё ещё выглядят достаточно странно. А чем же россияне занимаются с умными помощниками?
Обновлён рейтинг голосовых помощников
Затем каждый фрейм подвергают математическим преобразованиям и в результате получают коэффициенты, описывающие его частотные характеристики. А на основании этих данных ассистент может предположить, к какой фонеме принадлежит фрейм. Как и человек, голосовой помощник не всегда хорошо распознаёт звуки, и ему приходится достраивать слова исходя из контекста и статистики. У него есть таблица вероятностей переходов, которая указывает, что после «к» с одной вероятностью будет «о», с другой — «т» и так далее. Это позволяет определить варианты последовательности фонем и потом варианты слов, которые вы могли сказать. Голосовому помощнику нужно учитывать множество акцентов, в которых фонемы звучат по-разному. Например, в Москве чаще будет произноситься гласная «а», а в Архангельске — «о». Причем, если для Siri и Alexa можно выбрать британский или американский английский, а вот вологодского или краснодарского русского нет.
Как голосовые ассистенты понимают и выполняют поручения После того, как голосовой помощник распознал речь и перевёл её в текст, ему нужно понять, какого ответа ждет пользователь. В Алисе запросы пользователей сначала классифицируются по намерениям, а потом перенаправляются в тематические разделы, например, для прослушивания музыки или неформального разговора. Задача классификатора намерений — определить, что человек хотел сказать своей фразой. Например, если пользователь спросил: «Будет ли завтра дождь? В классификаторе намерений запрос дробится на слова и пунктуационные знаки. Для них применяют обученные на больших данных эмбеддинги — представления слов, которые позволяют понять, в каком контексте эти слова обычно используются.
Это неудивительно, ведь в каждом смартфоне на операционной системе Android или iOS предустановлены голосовые помощники Assistant и Siri. При этом другие устройства с голосовыми помощниками не очень-то востребованы. Аналитики приводят следующую аналогию: население Европы в два раза превосходит население Северной Америки, а по количеству устройств с голосовыми помощниками догонит ее минимум в 2022 году.
Еще одной тенденцией, подмеченной Juniper Research, стало снижения интереса разработчиков голосовых помощников к персональным компьютерам. В пример приводится Microsoft, пересмотревший стратегию развития своей разработки Cortana.
Недавно мы разработали ассистента, который принимает заявки радиослушателей для поздравлений в прямом эфире, используя голоса популярных радиоведущих и поднимая слушателям настроение. В свою очередь мировой опыт показывает, что наибольший профит от использования технологии получает рынок электронной коммерции, который первым в мире стал интегрировать ассистентов в свой бизнес. Немаловажную роль в этом играют сами пользователи, которые активно используют голосовых помощников для решения повседневных задач, таких как покупка товаров, поиск в Интернете, установка напоминаний, выстраивание маршрута во время вождения, управление умными девайсами и многое другое. Активность пользователей драйвит, безусловно, в том числе и российский рынок. Статистика за 2022 год показывает рост проданных умных колонок в 6 раз по сравнению с 2020 годом. По данным на 2020 год аудитория голосовых девайсов в России составила 52 млн пользователей.
Прогнозируется, что к 2026 году совокупный объем российского рынка голосовых ассистентов вырастет в 12 раз — бизнес оценил их работу. Этот материал опубликован на платформе бизнес-сообщества Forbes Экспертиза Запрос на участие в бизнес-сообществе Forbes Экспертиза можно заполнить по ссылке.
Никому она ничего, конечно, не передала.
Скорее всего, это связано с тем, что и Сири, и Google Ассистент — нативные помощники для своих систем, тогда как Алиса — стороннее приложение. К слову о них: сообщения в сторонних приложениях: Siri в этот раз не подвела — все четко. Ассистент тоже. Алиса опять отшутилась.
И опять неудачно. Теперь — музыка: Обидно, что несмотря на встроенный в iOS Apple Music Сири испытывает большие проблемы с тем, чтобы включать песни западных исполнителей. Грамотно отличать русский от английского помощник Apple пока так и не умеет. Музыку» соответственно.
С английским у русской Siri полная катастрофа. Алиса выдала ссылку на клип в «Яндексе», Google. Ассистент сразу открыл видео на YouTube. Посмотрим, как обстоят дела с российскими исполнителями: Тут Сири выступила на уровне Алисы — поделилась ссылками на ролик из поисковика.
Ассистент снова сразу же открыл на YouTube нужное видео. Переходим к еде: И вот тут Алиса удивила. Если Сири и Google Ассистент просто открыли список ближайших пиццерий, помощник «Яндекса» вызвал карточку «Папа Джонс», где можно полностью сформировать заказ. Кафе: Тут все без сюрпризов — все помощники справились.
А вот еще одна задачка про кафе, но посложнее: Первый раунд, в котором выйграла Сири. Номер на экране — просто и понятно. Ассистент предложил выбор, а Алиса все поняла не правильно. С кафе ассистенты разобрались, а что насчет заправок?
Все снова на высоте.
ВЦИОМ: более 60% опрошенных россиян пользуются голосовыми сообщениями
В процессе голосовому ассистенту можно задавать вопросы и просить его о помощи, если что‑то не получается отправить. Siri считается одним из лучших голосовых помощников, однако в зарубежных независимых тестах и сравнениях в последние годы она уступает более гибким помощникам от Google и Amazon как в скорости реакции, так и в совместимости с умными устройствами других компаний. Аналитики Juniper Research прогнозируют трехкратное увеличение использования цифровых голосовых помощников. Лучшие голосовые помощники: 4 ассистента с поддержкой русского языка.