Если мысль о том, что голосовые помощники захватывают мир, пугает вас, сейчас самое время отвести взгляд от экрана. Независимая подборка лучших голосовых помощников с учетом всех плюсов и минусов. По нашим оценкам, от 90 до 95% пользователей голосовых ассистентов используют помощники на телефонах. В этой заметке я привожу подборку лучших голосовых помощников для компьютера и телефона. Число используемых цифровых голосовых помощников к 2023 году утроится и составит 8 млрд по всему миру, говорится в исследовании Juniper Research.
Алиса – а что это за робот...
- Лучшие голосовые помощники
- Google Assistant
- Почему голосовые помощники полезны?
- Голосовыми помощниками пользуются более половины россиян | - инновации и инвестиции
- Как устроен voice tech в России
Голосовой помощник
В нашей подборке Алиса получает звание самого семейного помощника. Siri Совместимость: Mac, iOS, WatchOS, умный дом Сири была первым голосовым помощником, который оказался интегрирован в смартфоны и умел отвечать пользователям. И было это больше десяти лет назад. Ассистент от Apple поначалу была стандартом для всех подобных программ и задала основной перечень способностей при работе со смартфоном. Постепенно конкуренты догоняли и перегоняли «яблочную» помощницу, и сейчас уже нельзя сказать, что она серьезно выделяется на фоне других. Однако для всех устройств Apple это встроенный ассистент, и многие действия она отлично упрощает: умеет читать сообщения, строить маршруты, находить файлы и даже завалившиеся под подушку AirPods. Однако в плане понимания русского языка Сири не отличается исключительным умом и слишком часто любит отправлять в поисковик. Если вы не собираетесь задавать сложные вопросы и вам не нужны развлечения на базе самого ассистента, это совершенно не проблема, но факт остается фактом.
В любом случае для платформ Apple именно «родная» Сири — лучший ассистент. Google Ассистент Совместимость: Windows, Android, iOS, умный дом Фраза «Окей, гугл», которой включается Ассистент, уже прочно вошла в обиход — и неудивительно, ведь этот помощник встроен в браузер Chrome на Android. Интересно, что Google использовали для робота ровно тот же голос, который мы ранее слышали в голосовой почте. Так что даже привыкать не пришлось — по крайней мере, англоязычным пользователям. Функциональность у Ассистента стандартная: задаем вопросы, запускаем приложения, используем функции смартфона и управляем умным домом с любым устройством Google Home. Помощник часто отвечает на вопросы, с которыми конкуренты просто отправляют в поисковики, но по сторонним навыкам, пожалуй, чуть отстает от Алисы. Интеграция при этом происходит с сервисами Google, а вот они в России развиты не так чтобы очень хорошо, даже если брать банальные «Карты» и «Поиск».
И русский язык не является для Ассистента родным, так что сложный уровень общения тут тоже не предполагается. Однако для тех, кто пользуется Android, мы не видим причин не использовать этого помощника — жизнь он упрощает. Базируясь на экосистеме теперь уже компании VK — почте и поиске Mail. То есть помогает структурировать дела, упрощает работу со смартфоном, а вместе с умной колонкой «Капсула» организует центр управления домашними развлечениями.
Разработчики программы акцентируют внимание юзеров на том, что «Дуся» — это не чат-бот, который будет заигрывать с пользователем и рассказывать ему анекдоты а-ля Siri.
К числу недостатков программы «Дуся» можно отнести то, что она является платной. Пользователю даётся неделя на знакомство с интеллектуальной помощницей — по истечении этого срока придётся приобрести подписку. Голосовой помощник давно не обновлялся разработчиками, поэтому не поддерживается некоторыми устройствами. Особенности приложения: Можно самому добавлять скрипты, чтобы «Дуся» понимала даже специфичные задачи. Активация жестами: встряхиванием, поднесением к уху и пр.
Более 150 встроенных функций: прокладывание маршрутов, поиск мест и не только. Импорт и экспорт скриптов.
Когда пользователь обращается к умной колонке, чтобы запустить чат с банком, как это происходит в случае запуска голосового банковского помощника, на экране появляется визуальный образ. Общение происходит в режиме реального времени: Тамара реагирует на вопросы, а ее речь синхронизирована с изображением на экране — движением губ и мимикой. Визуальный образ Тамары был создан нейросетью, совместившей портреты 50 выдающихся женщин, которые в разное время внесли значимый вклад в развитие ИТ-сферы.
Мы постоянно работаем над развитием голосового, а теперь и визуального консультанта. В этом году для клиентов с нарушением слуха в тестовом режиме был внедрен видеоаватар, который консультирует пользователей по банковским услугам и сервисам на русском жестовом языке.
Что касается функций и возможностей — то здесь, в общем-то, всё на высоте точно не хуже, чем у большинства конкурентов! Кстати, несмотря на кучу преимуществ, у Siri есть и недостатки по крайней мере для русскоязычной аудитории : иногда она не понимает завуалированные вопросы и некоторые обороты речи... Впрочем, можно переформулировать...
К 2023 году число голосовых помощников в мире достигнет восемь млрд
Общие голосовые помощники используют в бизнесе для обслуживания клиентов. Информация о них есть в нашем тексте чуть ниже. Что умеют голосовые помощники Среди потребителей голосовые помощники очень популярны для выполнения простых задач: Алиса, Siri, Google Ассистент ежедневно помогают владельцам смартфонов узнать погоду, новости, поставить будильник, установить лимит на траты. При работе голосовой ассистент учитывает озвученный запрос и геолокацию пользователя, что позволяет сделать запрос локальным.
Популярность голосовых помощников как минимум в быту среди обывателей растет. По данным исследования Juniper Research , в 2023 году в мире будет использоваться более 8 миллиардов голосовых помощников. Для сравнения, на конец 2018 года голосовых помощников было 2,5 миллиарда.
Для чего используют виртуальных ассистентов? Например, американские пользователи используют голосовые помощники для ответов на вопросы, чтобы включить музыку, узнать прогноз погоды. Самый непопулярный запрос — заказ товара.
Об этом говорит исследование Forrester за 2020 год. Источник: cossa. Как голосовые помощники распознают речь Чтобы понимать человеческий голос, искусственный интеллект разделяет слова на звуки, а точнее — на звуковые маленькие части длиной в сотые доли секунды, фонемы.
Затем каждая часть слова математически обрабатывается, получая в результате коэффициенты — они и описывают частотные характеристики звуковой части. На основе этих данных голосовой помощник определяет голосовой запрос. Иногда у голосового помощника не получается понять фразу, тогда он достраивает слово из контекста всего предложения.
Для этого у ассистентов есть таблица вероятностей переходов, в которой описаны возможные последовательности букв в словах.
На шестом месте голосовой финансовый ассистент Олег от компании Тинькофф 59,3 тыс. Олег вовремя напомнит о неоплаченных счетах и поможет держаться в рамках бюджета, подскажет курс валют, забронирует столик в ресторанах или купит билеты в кино, найдет скидки на товары и услуги. А еще даст совет или просто поболтает.
Разработанная компанией Amazon Alexa заняла седьмое место 29,2 тыс. На восьмом месте персональная помощница Cortana от Microsoft 10,4 тыс. Она призвана предугадывать потребности пользователя. При желании ей можно дать доступ к личным данным, таким как электронная почта, адресная книга, история поисков в сети, все эти данные она будет использовать, чтобы предугадать нужды пользователя.
Ева 4,6 тыс. Она присваивает звонку одну из 25 категорий: полезный вызов, служба доставки, коллекторы, спам и другие.
В том же исследовании говорится, что продажи домашних голосовых помощников в 2016 году удвоились и составили в США 35.
Категория «Другие» почти не присутствует на рынке, и ниже мы попытаемся разобраться, почему это так. Как работает домашний голосовой помощник — команда и распознавание голоса Каждый голосовой помощник имеет как минимум микрофон и громкоговоритель: первый нужен, чтобы слышать ваши команды, второй — чтобы отвечать вам. В зависимости от модели могут отличаться число микрофонов, их направленность как правило, это 360 градусов , чувствительность и другие параметры.
Но на принципе работы это никак не сказывается. Голосовой помощник подключается к интернету, он не умеет работать без постоянного доступа к сети. Вы настраиваете свой голосовой помощник на фразу, которая его «будит», это команда, заставляющая его «слушать» все, что вы скажете.
Например, сказав Alexa, вы пробудите помощник от Amazon, и он начнет слушать все, что вы говорите. Команды выключения как таковой нет, устройство просто засыпает, когда понимает, что диалог завершился. Пробудить его можно повторной командой Alexa.
Много шуток в США было на тему того, что не повезло женщинам, которых зовут так же, как устройство от Amazon, у них оно будет работать постоянно. На самом деле в Alexa, также как и в других голосовых помощниках, вы можете сменить слово-команду на любое другое. Совет от разработчиков прост: чтобы это слово не было коротким и его можно было хорошо распознать даже в шумных условиях.
Устройство в локальной памяти хранит все настройки, там же располагаются буфер и система распознавания голоса. Домашний голосовой помощник можно воспринимать как упрощенный вариант смартфона, в котором может быть дисплей, либо его может и не быть. Важно, что система распознавания голоса в большинстве случаев локальная, именно устройство обрабатывает звук и распознает его.
В ряде случаев, когда устройство не может самостоятельно распознать и расшифровать голос, оно отправляет запись в облако, где происходит распознавание, так как серверы имеют большую производительность и большие базы данных для проверки и подбора слов. Как правило, большинство производителей используют комбинированные системы, распознавание голоса происходит локально, на сервер, который должен его обработать, он отправляется в виде условного текста или уже команды. Для ряда запросов, предполагающих местное действие, оно тут же осуществляется.
Например, когда пользователь говорит «установить будильник на 8 часов утра», система локально выполняет команду, не обращаясь в облако. То же самое касается и настройки других устройств умного дома, например, изменения температуры в термостате. Многие ошибочно считают, что если голосовой помощник распознает локально команды и голос, то эти данные навсегда остаются в нем, это не так.
Все зависит от производителя, марки устройства, но всегда все данные, записанные после слова-команды, передаются на серверы производителя, где они и хранятся. Эти данные могут быть использованы для более точной настройки системы распознавания и в других целях, например, их может запросить полиция в рамках расследования уголовного дела, и компания-производитель их предоставит. Следующий важный момент — это языки, на которых умеют говорить голосовые помощники.
Например, для Amazon это английский и немецкий. В случае Amazon сервис Alexa — это удобный способ что-то купить на сайте Amazon, поэтому ареал распространения ограничен теми странами, где сервис имеет наибольшую аудиторию. Для того же Google Home в планах, напротив, быть везде где только возможно.
Мы увидим экспансию Google Home на всех мировых рынках, он начнет появляться на всех языках. Хотя пока он представлен ровно в том же количестве стран, что его прямой конкурент. Здесь Google выступает в роли догоняющего и поэтому не спешит быть везде, так как другие конкуренты маловероятны, ниже мы обсудим, почему это так.
Итак, вы сказали слово-команду, и ваше устройство «проснулось», записывает ваш голос, чтобы его распознать. Первый и самый важный элемент — это распознавание голоса и его преобразование в текст. Как правило, текущие голосовые помощники настраиваются на один основной язык.
Например, если устройство поддерживает как английский, так и русский, одновременно разговаривать с ним на двух языках не выйдет, оно будет путаться и просить повторить фразы. В будущих устройствах этот момент будет с легкостью разрешен, так как голосовые помощники научатся сами определять язык, на котором вы говорите. Но пока они могут только анализировать контекст, в котором вы произносите фразу все это происходит в облаке , чтобы заменить некоторые слова на английские.
Например, раньше, когда вы произносили фразу «в каком году вышел альбом обратная сторона луны у пинк флойд», она распознавалась именно так, как я написал. Причина заключается в том, что Google задействует нейронные сети для анализа не только самой фразы, но и сказанного контекста. То есть, система пытается предугадать, что именно вы хотите, какой смысл у вашего вопроса.
Если вы по какой-то причине пропустили революцию в системах распознавания и расшифровки голоса, никогда не пользовались голосовой диктовкой на Android-смартфонах, то просто попробуйте это сделать в браузере по этой ссылке. В Google уже поддерживается более 80 языков, для каждого возможно преобразование голоса в текст и обратно. Конкуренты пока от Google отстают, но со временем ситуация на этом рынке выровняется, так как с течением времени, обрабатывая семплы речи, каждая компания добьется очень высокой точности распознавания голоса.
В данный момент технология находится в разработке. Amazon не назвала точную дату выхода новой функции и не уточнила, станет ли она общедоступной.
Алиса – а что это за робот...
- 1779 год — первый синтезатор речи
- 29 регионов России используют голосовых помощников в сфере здравоохранения
- Как это работает? Голосовые помощники для дома и квартиры на примере Google, Amazon и других
- Сравнение голосовых помощников. Что выбрать? - Статья
- Голосовые помощники
- Лучшие голосовые помощники в 2024 году: рейтинг вариантов
Комаровка в Украине и советы по ужину: что умеют голосовые помощники Siri, Алиса и Google Assistant
Голосовому помощнику нужно учитывать множество акцентов, в которых фонемы звучат по-разному. Голосовой помощник — искусственный интеллект с развитыми навыками распознавания речи, который обрабатывает огромные объемы информации, благодаря чему постоянно учится. Команда российского оператора Tele2 сообщила о запуске новой услуги для своих абонентов — голосового помощника по имени «Астра». Эксперт рассказал Hi-Tech , как в России появляются голосовые ассистенты и сколько денег уходит на их разработку. Команда российского оператора Tele2 сообщила о запуске новой услуги для своих абонентов — голосового помощника по имени «Астра». Десятилетняя эволюция умных устройств, которые от стандартных голосовых помощников, выполняющих простые бытовые задачи, доросли до технологий, способных запоминать предпочтения пользователя и находить ответы на самые неожиданные вопросы, — яркий.
ВЦИОМ: более 60% опрошенных россиян пользуются голосовыми сообщениями
Маруся голосовой помощник команды для умных колонок VK Капсула | Добавьте в голосовой помощник Алису от Яндекса новые навыки на тему — Новости. |
✓ ТОП-9 самых популярных голосовых помощников 2022 рейтинг Медиалогии | Эксперт рассказал Hi-Tech , как в России появляются голосовые ассистенты и сколько денег уходит на их разработку. |
Голосовыми помощниками пользуются более половины россиян | Как работают голосовые помощники? |
29 регионов России используют голосовых помощников в сфере здравоохранения
Какие проблемы в использовании ИИ и голосовых помощников вы как эксперт можете выделить? Рейтинг построен по количеству упоминаний голосовых помощников в русскоязычном сегменте соцмедиа. Выбираем самого умного голосового помощника в 2023 году. Голосовой помощник – сервис на основе искусственного интеллекта, распознающий человеческую речь и способный выполнить определенное действие в ответ на голосовую команду. неправильного произношения и рекомендации:Использование голосовых помощников может значительно упростить повседневные задачи, такие как поиск информации, управление устройствами, покупки и другие. Один из первопроходцев среди голосовых помощников, ставший неотъемлемой частью экосистемы устройств работающих на операционной системе iOS.
Некоторыми госуслугами стало возможно пользоваться с помощью голосового помощника
Страницы в категории «Виртуальные ассистенты». Голосовые ассистенты незаметно входят в нашу обыденную жизнь, что подтверждает исследование Google: помощником пользуются более чем один раз в день 41% взрослых и 55% подростков. Google Ассистент остается самым популярным голосовым помощником в мире.
37 компаний, создающих голосовые приложения для медицины
ВЦИОМ: более 60% опрошенных россиян пользуются голосовыми сообщениями | Выбираем самого умного голосового помощника в 2023 году. |
Понимают ли нас голосовые помощники? — Нож | Выбор имени голосового помощника проходил в несколько этапов. |
Голосовой помощник Alexa заговорит голосом усопших | Темпы роста рынка голосовых помощников, по оценке Group, превышают темпы роста IT-рынка в целом: голосовые ассистенты стали неоспоримым трендом, который продолжает набирать обороты. |
Сколько стоит работа голосового помощника в России
Виртуальный ассистент консультирует горожан по наиболее распространенным вопросам в сфере госуслуг, ЖКХ, транспорта и другим темам. Это помогает решать повседневные задачи москвичей максимально быстро и удобно», — рассказал Андрей Савицкий, руководитель общегородского контакт-центра. Первым проектом, в который внедрили голосового помощника, была передача показаний счетчиков. Это позволило ускорить обработку заявок жителей, а также грамотно распределить ресурсы операторов. Всего обработано около 4,2 миллиона звонков жителей. В среднем голосовой помощник принимает около 400 тысяч таких обращений в месяц.
Он принимает показания водосчетчиков, напоминает о необходимости проведения поверки и подсказывает даты сезонного отключения воды. Горожанам достаточно произнести код плательщика, указанный в едином платежном документе, и показания счетчиков воды, после чего виртуальный ассистент сам передаст данные в расчетную систему центра госуслуг. Сегодня голосовой помощник задействован в работе 10 городских горячих линий. Он помогает составлять заявки на вызов мастера, записываться к врачу, на медицинские процедуры, лабораторные и инструментальные исследования, подсказывает статус готовности документов. Как работает и развивается голосовой помощник Общаться с горожанами роботу помогают технологии синтеза и распознавания речи.
Когда голосовой запрос поступает в систему, он воспринимает его как набор звуковых волн. Чтобы восстановить сказанное, визуальный ассистент запускает процесс распознавания речи: нейросеть анализирует речевой поток, определяет, какие именно звуки были произнесены, и делит звуковую волну на фрагменты. Затем система сопоставляет их с имеющимися в ее базе знаний шаблонами, подбирает нераспознанные слова по контексту и определяет последовательность слов, после чего собирает их в предложение.
Настоящий помощник умеет еще и поднять шефу настроение, так что заказываем шутки. С просьбой «расскажи анекдот» Алиса и Google Assistant справились насколько успешно, сказать сложно — чувство юмора-то у людей разное , а вот Siri замялась: Хотя, видимо, в этом и была вся соль.
С поиском музыки вышло неоднозначно: на запрос «открой последний альбом Metallica» Алиса сразу включила первый трек с нужной пластинки, а Siri почему-то запустила вторую песню. Справедливости ради отметим, что мы не просили проигрывать альбом с начала, но логично было бы сделать именно так. Google Assistant тоже предложил запустить Metallica, только вот нативный музыкальный сервис не был активирован. Вечная загадка — что приготовить на ужин, когда совсем лень и холодильник практически пустой. С помощниками, по идее, такой проблемы быть не должно.
Но все они просто выдали ссылки на ресурсы о готовке еды. Ответы принимаются, но хотелось бы конкретики: мол, вот вам самый простой вариант со списком нужных продуктов. Для проверки мы выбрали улицу с заковыристым названием: 2-я Шестая линия. Лучше всех справилась Алиса — с первого раза и без дополнительных уточнений. Второе место заслужил Google Assistant: сначала он выдал что-то непонятное, но потом исправился и верно указал путь.
Siri же призналась, что ничего не нашла, однако это не единственная ее проблема: на простейший запрос «проложи маршрут к Комаровке» помощница решила, что нам нужна… деревня с таким названием в Украине. Запрос «открой Onliner» оказался слишком простым: справились все, но Алиса не только нашла сайт, а еще и автоматически открыла его в браузере. Siri просто выдала результаты поисковых запросов в интернете, а Google Assistant нашел на смартфоне приложение «Каталог» и запустил его — неплохо, но чуточку не то, что мы просили. Удобный сценарий использования голосовых помощников — запрос курса валют.
Так в Tele2 представляют «Астру» Например, «Астра» может указать адресную причину, по которой пользователь не может ответить на звонок. Или помочь записать отдельное аудиосообщение для избранных номеров. В Tele2 рассказали: «Астру» программировали как остроумную и дерзкую помощницу, которая хорошо разбирается в новых трендах и технологиях.
Она способна грамотно отвечать на звонки, всегда на стороне абонента, может легко поставить на место спамеров и мошенников.
Например, если человек лежит, то он не может просто взять и пойти, для этого ему нужно пройти цепочку последовательности — сесть, встать и только потом уже пойти. Алгоритмы марковской модели в распознавании речи работают примерно по тому же принципу матричного графа. А благодаря наличию нейросетей, любой желающий при должных знаниях может «научить» свой сервис обучаться, то есть чем больше люди будут пользоваться теми или иными функциями, тем лучше будут оптимизированы алгоритмы работы распознавания речи, благодаря улучшению генерирующей работы Марковской модели, расширением словарного запаса и пополнением библиотеки голосовых паттернов. Так, например, в 1990 году увидела свет одна из первых коммерческих программ по распознаванию речи — Dragon Dictate, ориентированная на массовый рынок потребителей.
За эту космическую сумму денег пользователь получал возможность писать текст, просто проговаривая его в микрофон. К сожалению, программа не всегда работала корректно, и допускала даже по тем меркам достаточно серьезные ошибки. Представляла она из себя портал VAL, призванный помочь покупателям в поиске нужной информации о интересующих товарах. Сферой использования этой системы были торговые центры, информационные стенды и прочие коммерчески ориентированные области деятельности. В 1997 году, вышла обновленная версия вышеупомянутой Dragon Dictate, в ней разработчики потрудились над скоростью и качеством распознавания речи.
Google уже в 2002 году предприняла решение по развитию голосового поиска и интеграцией его в свою экосистему. Voice Search не имел особого успеха, но послужил отправной точкой для будущего приложения Voice Search для iPhone и Android, ставшим впоследствии интерактивным помощником Google Now, а с недавних пор Google Assistant. Система распознавания речи 2002 года от Google как и аналоги конкурентов работала при помощи телефонного звонка на специальный номер, пользователи не оценили такой способ поиска, так как он оказался попросту неудобен. Но разработчики компании засучив рукава продолжили движение в этой сфере, и судя по нынешним продуктам, время в стенах офиса на Mountain View было потрачено не зря. В систему была введена фирменная система распознавания и синтезирования речи VoiceOver.
Её главным отличием была независимость от «спикера», то есть пользоваться ей мог кто угодно — систему не нужно было обучать к определенному голосу. Возможность синтеза речи нашла применение для людей с плохим зрением, система могла читать любой текст на экране, от статей в интернете, электронных писем до элементов системы, например пунктов в меню настроек и названия файлов на рабочем столе. Позже Microsoft решили не отставать от Apple и интегрировали голосовое управление в свою новую Windows Vista. Google Voice Search Наконец, мы переходим к становлению нынешних голосовых помощников. Как я говорил, Google уже в 2002 году попробовали себя в создании поиска по телефону.
Спустя 7 лет компания представила приложение голосового поиска на смартфонах iPhone. Приложение функционировало с помощью облачных вычислений на серверах Google. Благодаря огромному числу голосовых запросов пользователей, словесная и фонетическая база данных на серверах к 2011 году насчитывала уже около 230 миллиардов слов на разных языках мира. Благодаря колоссальному успеху, приложение Voice Search по сей день закрепляет за собой славу самого популярного сервиса Google. Позже появилась версия и под собственную операционную систему Android.
В связи с этим корпорацией была развернута масштабная рекламная кампания смартфонов на фирменной платформе, акцентируя внимание клиентов на уникальной для того времени фишке — голосовом поиске. В 2011 году функцию голосового поиска получил и фирменный браузер Google Chrome. В 2012 году вместе с презентацией Android 4. Функционал работы сервиса строился на подборе актуальной информации для пользователя с учетом его местоположения, личной информации календаря, поисковых запросов, истории браузера и маршрутам перемещения. Каждый пользователь имел возможность настроить карточки с рекомендациями под себя.