Команда российского оператора Tele2 сообщила о запуске новой услуги для своих абонентов — голосового помощника по имени «Астра».
Как развивались сервисы голосовых помощников и какие технологии в них используются
Интеграция в iOS была продолжительной: только к запуску iOS 7 и выходу iPhone 5S она стала вполне функциональной, и даже обрела возможность выбора между мужским и женским голосом. Перспективы и возможности. До анонса iOS 14 абсолютно точно можно было называть Siri довольно примитивной из-за небольшого количества команд и медленной работой. В России Siri полноценно заговорила на русском в iOS 8. С лета 2016 года сторонние разработчики получили возможность добавлять к Siri функциональность. Но и это не придавало ей потенциал. Произошло чудо: в 2020 году она стала знать в 20 раз больше фактов, чем за три года до этого, а задержка ответов на быстрые вопросы значительно сократилась. А ещё Siri научилась читать и отправлять сообщения в мессенджеры без необходимости их запуска. В целом, функциональность стала обширной — Siri может позвонить кому-то, прочитать сообщение, настроить будильники, таймеры и напоминания, узнать маршруты, найти музыку, ответить на вопросы, открыть фото, презентации и даже спланировать день. Есть ощущение, что Apple явно намерена догнать упущенное и преуспеть.
Кстати, в отдельном материале мы собрали 13 полезных команд этому голосовому ассистенту.
В ходе опроса мы уточняли, знают ли пользователи о новых голосовых ассистентах. В 2020 году голосовых помощников стали использовать чаще. Меняется расстановка сил среди устройств с голосовыми помощниками. В то же время ассистентов стали больше использовать на других устройствах. За год кейсы использования голосовых ассистентов стали разнообразнее. Умные телевизоры.
Большинство новых телевизоров с функцией Smart TV, в том числе эконом-класса, оснащены функцией голосового помощника. Яндекс расширяет присутствие в сегменте дорогих ТВ-приставок с Алисой и начал сотрудничество с производителями ТВ. Ставка на производителей телевизоров является важным стратегическим шагом, так как это очень внушительный рынок: по оценкам М. Заметим, что в оценках российского рынка мы пока не учитываем сегмент Smart TV как платформу для голосовых помощников, так как в данном случае они используются в основном для управления устройством и поиска видеоконтента. Мы сотрудничаем с компаниями в Китае, США и в России, помогаем разрабатывать скиллы и контент для ассистентов, создаем инструменты, помогающие разработчикам в решении их задач на этом молодом и динамичном рынке.
Однако дополнительные вопросы сбивают с толку Bixby и Alexa. Siri также выступает хуже всех в управлении устройствами.
Кроме того, он хуже, чем Google Assistant, работает с камерой.
Российские голосовые помощники В 2017 году «Яндекс» выпустил своего голосового ассистента — Алису. Сегодня она считается одной из самых умных и продвинутых в сегменте. Алиса умеет не только точно отвечать на запрос человека, но и вступать с ним в диалог как виртуальный собеседник.
Благодаря самообучению она постоянно совершенствуется. Еще одна лидирующая отечественная разработка — Маруся от VK. Основные умения ассистентов похожи, но у Маруси есть особенность — она отличный помощник для пользователей социальной сети «ВКонтакте». Там с помощью ассистента можно найти пользователя или сообщество, включить песню или подкаст, набрать и отправить сообщение, позвонить контакту и проверить электронную почту. Для получения доступа ко всем возможностям Алисы и Маруси потребуются соответствующие подписки.
Подписка дает возможность слушать музыку, аудиокниги, управлять просмотром фильмов в онлайн-кинотеатрах, а также получать дополнительные скидки на доставку еды, такси и другие бонусы. Набор их навыков пока уступает лидерам рынка, но помогает клиентам компаний получать более качественное обслуживание. Ева отвечает за звонки, безопасность в сети и защиту от спама, Олег поможет перевести деньги и выполнит роль секретаря, пока владелец смартфона занят. Салют работает только на устройствах Сбера, его изюминка — опция выбора голоса и тона собеседника — деловой, умеренный или дружеский.
Обзор голосовых помощников: что умеют Алиса, Салют, Маруся, Google Assistant и Siri
В статье мы рассмотрим историю развития голосовых ассистентов — от первых синтезаторов речи 1779 года до умных колонок в наших домах. Голосовой помощник – это программное обеспечение, которое позволяет пользователям взаимодействовать с устройствами с помощью голосовых команд. Первым в привычном понимании голосовым помощником стала Siri от Apple, которая появилась в iPhone 4S в 2011 году. неправильного произношения и рекомендации:Использование голосовых помощников может значительно упростить повседневные задачи, такие как поиск информации, управление устройствами, покупки и другие.
Приятно познакомиться, Ева, Олег, Маша, Салют, Алиса! Протестировали голосовых помощников
Голосовые помощники: что мешает их развитию и что ждёт в будущем | «Помощников много не бывает»: лучшие голосовые ассистенты для русскоязычных пользователей. |
«Алиса» от «Яндекса» стала самым обсуждаемым голосовым помощником в России | С голосовым ассистентом можно поболтать, о чём хотите — о погоде, кино или текущих делах. |
Голосовые помощники: что мешает их развитию и что ждёт в будущем | В этой заметке я привожу подборку лучших голосовых помощников для компьютера и телефона. |
Некоторыми госуслугами стало возможно пользоваться с помощью голосового помощника
Кстати, несмотря на кучу преимуществ, у Siri есть и недостатки по крайней мере для русскоязычной аудитории : иногда она не понимает завуалированные вопросы и некоторые обороты речи... Впрочем, можно переформулировать... По голосовой команде — она способна настраивать ОС, запускать различные приложения и задачи, делать пометки в календаре и т.
Дмитрий Головин, заместитель руководителя департамента информационных технологий города Москвы: «В базе знаний робота-помощника содержится более 400 тематик, по которым он может оказать помощь, например, записать на прием к врачу или сдать показания счетчиков. Он подскажет график работы органов исполнительной власти и статус готовности документов, а также подаст заявку в Единый диспетчерский центр.
Роботу-помощнику достаточно двух минут, чтобы выслушать вопрос, получить дополнительную информацию и предоставить ответ звонившему». В мэрии отметили, что голосовой помощник находит нужную информацию в два раза быстрее человека.
Чтобы восстановить сказанное, визуальный ассистент запускает процесс распознавания речи: нейросеть анализирует речевой поток, определяет, какие именно звуки были произнесены, и делит звуковую волну на фрагменты. Затем система сопоставляет их с имеющимися в ее базе знаний шаблонами, подбирает нераспознанные слова по контексту и определяет последовательность слов, после чего собирает их в предложение.
Человеческий язык довольно сложен для понимания искусственным интеллектом, поэтому для развития возможностей робота общегородской контакт-центр использует глубокое обучение с помощью комбинации методов и алгоритмов, применение которой позволяет добиться более точного распознавания речи. Благодаря технологиям виртуальный ассистент способен самостоятельно совершенствовать свои навыки. В роли учителя выступает человек, он закладывает конкретные примеры и шаблоны в базу знаний робота, которые в дальнейшем использует в своей работе голосовой помощник. База знаний — это своеобразная энциклопедия для виртуального ассистента, в которой содержатся ответы на самые распространенные вопросы жителей.
Сегодня в ней собрана информация по более чем 230 темам: вопросам жилищно-коммунального хозяйства, транспорта, оказания госуслуг, а также о контактах и режиме работы городских учреждений. Так как жители часто используют разговорный сленг, в базу знаний добавлен большой словарь разговорных слов, который постоянно обновляется. Например, робот понимает значение слов платежка, жировка, квиток, талончик и других. Робот на линии единой справочной службы Самой востребованной городской линией у москвичей является единая справочная служба Правительства Москвы.
На нее приходится наибольшее число звонков, поступающих в общегородской контакт-центр. Главная городская горячая линия стала одной из первых, где начали использовать искусственный интеллект, чтобы увеличить скорость и улучшить качество обработки заявок. Виртуальный ассистент может подсказать график работы и контакты органов власти, управ районов и управляющих компаний, адрес ближайшего центра госуслуг «Мои документы», записать на прием к специалистам, а также уточнить статус готовности документов. База знаний голосового помощника единой справочной службы Правительства Москвы регулярно обновляется.
Siri и Ассистент отправляют сообщения, Алиса отшучивается. Никому она ничего, конечно, не передала. Скорее всего, это связано с тем, что и Сири, и Google Ассистент — нативные помощники для своих систем, тогда как Алиса — стороннее приложение. К слову о них: сообщения в сторонних приложениях: Siri в этот раз не подвела — все четко. Ассистент тоже.
Алиса опять отшутилась. И опять неудачно. Теперь — музыка: Обидно, что несмотря на встроенный в iOS Apple Music Сири испытывает большие проблемы с тем, чтобы включать песни западных исполнителей. Грамотно отличать русский от английского помощник Apple пока так и не умеет. Музыку» соответственно.
С английским у русской Siri полная катастрофа. Алиса выдала ссылку на клип в «Яндексе», Google. Ассистент сразу открыл видео на YouTube. Посмотрим, как обстоят дела с российскими исполнителями: Тут Сири выступила на уровне Алисы — поделилась ссылками на ролик из поисковика. Ассистент снова сразу же открыл на YouTube нужное видео.
Переходим к еде: И вот тут Алиса удивила. Если Сири и Google Ассистент просто открыли список ближайших пиццерий, помощник «Яндекса» вызвал карточку «Папа Джонс», где можно полностью сформировать заказ. Кафе: Тут все без сюрпризов — все помощники справились. А вот еще одна задачка про кафе, но посложнее: Первый раунд, в котором выйграла Сири. Номер на экране — просто и понятно.
Ассистент предложил выбор, а Алиса все поняла не правильно. С кафе ассистенты разобрались, а что насчет заправок?
Русскоговорящие голосовые помощники: кто умнее?
В 2019 году IQ Loup Ventures протестировали голосовых помощников и выяснили – Google Assistant понимает больше вопросов, чем конкуренты и дает наиболее развернутые и понятные ответы. Алиса, первый российский голосовой помощник, предназначенный для массового использования, появилась в 2017 году. Голосовые помощники – очень полезная штука, которая выручает во многих ситуациях. По нашим оценкам, от 90 до 95% пользователей голосовых ассистентов используют помощники на телефонах. «Виктория» — голосовой помощник «Службы 122» — стал самым востребованным из ассистентов. Поскольку развитие голосовых ассистентов своими силами связано с продолжительными инвестициями, за исключением гигантов никто позволить себе такого не может.
Ожидается трехкратный рост использования цифровых голосовых помощников
Перспективы монетизации голосовых помощников Согласно прогнозам Juniper Research, к 2023 году в мире будут использовать 8 миллиардов голосовых помощников — на одного человека будет приходиться дватри ассистента. Согласно данным ВЦИОМ, голосовыми сообщениями пользуются 64% россиян. Всего голосовой помощник обработал уже свыше 31,3 миллиона обращений — почти половину от общего числа звонков в единую справочную службу. Несмотря на то, что голосовые помощники уже в то время были привычным делом, Алисе удалось произвести впечатление на русскоговорящую публику. Выбор имени голосового помощника проходил в несколько этапов. Теперь — с нейросетью YandexGPT. Она позволила улучшить мои сценарии работы, а это значит, что я умею ещё больше, чем раньше. Я доступна в умных устройствах, сервисах и приложениях Яндекса, а ещё в новом Чате. Придумываю идеи, пишу и редактирую тексты.
«Алиса» от «Яндекса» стала самым обсуждаемым голосовым помощником в России
И дело даже не в технических трудностях. Но мы забываем об этом, когда видим прямые ответы поисковой системы», — рассуждает Штайн. Шах также считает, что представление пользователям некого «единого» ответа на вопрос — это проблема, поскольку источники информации и любые разногласия между ними в таком ответе скрыты. На эти проблемы Шах и Бендер предлагают ряд решений. Они считают, поисковые технологии должны учитывать различные способы поиска информации, многие из которых не предполагают прямых ответов. Люди часто используют поиск для изучения тем, по которым у них, возможно, даже нет конкретных вопросов, говорит Шах. В этом случае полезнее было бы просто предложить список документов. Кроме того, источники, использованные ИИ для составления ответа, должны проговариваться прямо. Шах также считает, что поисковые инструменты будущего должны иметь возможность отвечать пользователю, что он задал глупый вопрос. Это помогло бы избежать повторения в запросе оскорбительных или предвзятых посылок.
По мнению Штайна, поисковые системы на основе ИИ могли бы обосновывать свои ответы, приводя аргументы в пользу различных точек зрения. Однако многие из этих предложений просто подчеркивают дилемму, которую выявили Штайн и его коллеги. Все, что снижает удобство, большинство пользователей сочтут менее привлекательным. Google заявляет, что знает о многих проблемах, которые поднимают эти исследователи, и усердно работает над разработкой технологий, которые принесут людям пользу.
Ассистент Дуся Совместимость: Android Переходим к помощникам калибром поменьше.
Дуся представляет не крупную IT-компанию, работает только на одной платформе — Android — и не залезает в умные устройства. Однако у нее есть два больших козыря. Первый — это конфиденциальность и автономность. В отличие от всех остальных помощников, Дуся работает даже без подключения к интернету и хранит все свои данные прямо на вашем устройстве. То есть даже при нестабильном подключении, например, за городом или в помещении, где плохо ловит сеть и нет Wi-Fi, она сможет помочь и совершенно точно никому не передаст ваши данные. Другой плюс — это настраиваемость.
Если у Алисы и Маруси есть навыки, то у Дуси — целые скрипты, которые она способна выполнять, во-первых, даже без команды, по предварительной настройке, а во-вторых, список этих скриптов вы можете дополнять самостоятельно. Напоминать о перерывах, чтобы попить воды, строить маршрут по расписанию — определяете то, что вам надо, и Дуся в этом ассистирует. Недостаток помощницы очевиден: делает ее небольшая команда, и ПО обновляется не совсем оперативно. Пользователи отмечают, что у Дуси нет поддержки ряда версий Android, но есть определенные баги. Олег Совместимость: iOS, Android Считается , что женские голоса делают голосовых помощников более располагающими к себе и позволяют устанавливать контакт, но банк «Тинькофф» пошел другим путем и сделал мужчину-ассистента, назвав его по имени основателя компании. Работает Олег в мобильном приложении банка и в основном заточен под финансовые вопросы: перевести деньги, узнать курсы валют, разобраться с расходами и инвестициями или получить совет на все ту же финансовую тему — такова зона ответственности этого ассистента.
Хотя и функция общения у него тоже есть, так же как и привычные по другим ассистентам возможности делать покупки или искать рестораны поблизости. Это, пожалуй, самый необычный голосовой помощник: не только из-за пола, но и потому, что имеет достаточно узкую специализацию. Будет интересно посмотреть, получит ли он отдельное приложение, которое позволит Олегу зажить без привязки к «Тинькоффу». Салют Совместимость: iOS, Android, умные устройства Одна голова хорошо — а три лучше, решили в «Сбере» и сделали сразу трех виртуальных ассистентов. Одной командой «Салют» можно вызвать Джой и Афину с женскими голосами и Сбера с мужским. У каждого из них свой характер и стиль ответов — по сути, нам предлагают помощников для разных аудиторий огромной корпорации.
Несколько компаний работают сегодня над системами, позволяющими автоматизировать ввод врачебных записей в системы электронных медицинских карт. Kiroku - система, позволяющая автоматически "выбирать" нужный контекст из разговора с пациентом и автоматически создавать клинические записи для врача. MDOps позволяет значительно уменьшить время на создание документации путем диктовки и автоматического создания клинических записей с помощью iPhone или iPad. Notable использует носимые устройства, голосовой интерфейс и AI для упрощения взаимодействий врача с пациентом. Saykara упрощает захват данных с помощью виртуального записывающего решения на базе AI-технологий, которое позволяет избавиться от необходимости работы с системой электронных медицинских карт. Sopris Health — это интеллектуальная клиническая платформа, использующая "умную" систему расшифровки голоса на базе AI. Suki - цифровой виртуальный ассистент для врачей, который позволяет снизить нагрузку, связанную с заполнением медицинской документации. При этом используются обработка естественной речи для ее преобразования в текст и наоборот. Кроме того, есть решения, которые отслеживают развитие болезни со временем, используя речевые данные. Ava предназначена для глухих и слабослышащих людей, показывая им кто и что говорит.
VocaliD использует голосовой банк и технологии обработки голоса, позволяющие создать уникальные голоса, персонализирующие любые устройства, которые преобразуют текст в голос. Voiceitt - разрабатывает первую в мире технологию распознавания голоса, предназначенную для понимания нестандартной речи. Платформы для разработчиков Эти компании создают программные решения для тех, кто хочет разрабатывать и публиковать голосовые приложения, особенно если они предназначены для нескольких аппаратных платформ например, Amazon Alexa и Google Home. ConversationHealth создает функциональные боты для поддержки клинической деятельности.
Typle — простенькая утилита для Windows 7, 8 и 10. Функционал Typle весьма ограничен: программа может открывать файлы и приложения, но при этом не способна, скажем, управлять музыкальным проигрывателем. Зато Typle прекрасно понимает русский язык, а благодаря продвинутой технологии распознавания речи может работать даже с бюджетными микрофонами. Заключение В скором времени владельцев гаджетов с Android ждет нелегкий выбор.
А между тем, развитие голосовых помощников идет полным ходом. У Тинькофф и Сбербанка, например, уже давно также появились свои собственные ассистенты. Удивляться этому не следует, ведь голосовые помощники — это не только весело, но и действительно удобно. Читайте также.