Первым в привычном понимании голосовым помощником стала Siri от Apple, которая появилась в iPhone 4S в 2011 году. Статья Голосовые ассистенты (Роботы-операторы), 80% опрошенных россиян постоянно общаются с голосовыми помощниками, В первом полугодии количество звонков с помощью голосового робота составило 360 млн, Смотрите также Голосовые помощники. Сегодня мы делаем первые шаги к тому, чтобы у голосового помощника появился визуальный образ.
Голосовых помощников станет больше, чем людей
В Tele2 рассказали: «Астру» программировали как остроумную и дерзкую помощницу, которая хорошо разбирается в новых трендах и технологиях. Она способна грамотно отвечать на звонки, всегда на стороне абонента, может легко поставить на место спамеров и мошенников. Она ответит на входящие вызовы, если абонент находится вне зоны действия сети, не поднимает трубку или сбрасывает звонок. Ассистент поможет узнать контакты курьера или детали записи в салон красоты.
Маруся Ассистент от Mail. Как и Ал иса, Ма руся имеет свой «дом» — умную колонку «Капсула». Вообще, эти ассистенты очень похожи во многом, но Маруся использует сервисы Mail. В целом же, по функционалу, обучению и охвату этот голосовой помощник значительно уступает ближайшему конкуренту. Рядовые функции Марусе по плечу, но в целом пользоваться ей в полной степени смогут лишь те, кто предан VK и сервисам Mail. Дуся Ассистент Дуся — отд ельное приложение, доступное в Google Play только для устройств на Android. Её главная о собенн ость в том, что можно самостоятельно настраивать скрипты её функционала.
По умолчанию их свыше 150: это запуск разных приложений, создание заметок, установка будильников, навигация и так далее. Дуся настраивается с помощью ПК или чата в Телеграме, посредством текстовых команд. Кроме того, она способна распознавать управление жестами и виджетами. Главный Дусин недостаток — платный доступ: бесплатная версия работает всего неделю.
Как отметили разработчики, данную функцию можно будет использовать, чтобы увековечить память об усопших родственниках. По словам Прасада, «ИИ не избавит от боли от потери, но поможет сохранить воспоминания».
При этом для работы технологии понадобится около минуты речи настоящего человека — подойдут даже аудиосообщения.
Важно, что система распознавания голоса в большинстве случаев локальная, именно устройство обрабатывает звук и распознает его. В ряде случаев, когда устройство не может самостоятельно распознать и расшифровать голос, оно отправляет запись в облако, где происходит распознавание, так как серверы имеют большую производительность и большие базы данных для проверки и подбора слов. Как правило, большинство производителей используют комбинированные системы, распознавание голоса происходит локально, на сервер, который должен его обработать, он отправляется в виде условного текста или уже команды. Для ряда запросов, предполагающих местное действие, оно тут же осуществляется. Например, когда пользователь говорит «установить будильник на 8 часов утра», система локально выполняет команду, не обращаясь в облако.
То же самое касается и настройки других устройств умного дома, например, изменения температуры в термостате. Многие ошибочно считают, что если голосовой помощник распознает локально команды и голос, то эти данные навсегда остаются в нем, это не так. Все зависит от производителя, марки устройства, но всегда все данные, записанные после слова-команды, передаются на серверы производителя, где они и хранятся. Эти данные могут быть использованы для более точной настройки системы распознавания и в других целях, например, их может запросить полиция в рамках расследования уголовного дела, и компания-производитель их предоставит. Следующий важный момент — это языки, на которых умеют говорить голосовые помощники. Например, для Amazon это английский и немецкий.
В случае Amazon сервис Alexa — это удобный способ что-то купить на сайте Amazon, поэтому ареал распространения ограничен теми странами, где сервис имеет наибольшую аудиторию. Для того же Google Home в планах, напротив, быть везде где только возможно. Мы увидим экспансию Google Home на всех мировых рынках, он начнет появляться на всех языках. Хотя пока он представлен ровно в том же количестве стран, что его прямой конкурент. Здесь Google выступает в роли догоняющего и поэтому не спешит быть везде, так как другие конкуренты маловероятны, ниже мы обсудим, почему это так. Итак, вы сказали слово-команду, и ваше устройство «проснулось», записывает ваш голос, чтобы его распознать.
Первый и самый важный элемент — это распознавание голоса и его преобразование в текст. Как правило, текущие голосовые помощники настраиваются на один основной язык. Например, если устройство поддерживает как английский, так и русский, одновременно разговаривать с ним на двух языках не выйдет, оно будет путаться и просить повторить фразы. В будущих устройствах этот момент будет с легкостью разрешен, так как голосовые помощники научатся сами определять язык, на котором вы говорите. Но пока они могут только анализировать контекст, в котором вы произносите фразу все это происходит в облаке , чтобы заменить некоторые слова на английские. Например, раньше, когда вы произносили фразу «в каком году вышел альбом обратная сторона луны у пинк флойд», она распознавалась именно так, как я написал.
Причина заключается в том, что Google задействует нейронные сети для анализа не только самой фразы, но и сказанного контекста. То есть, система пытается предугадать, что именно вы хотите, какой смысл у вашего вопроса. Если вы по какой-то причине пропустили революцию в системах распознавания и расшифровки голоса, никогда не пользовались голосовой диктовкой на Android-смартфонах, то просто попробуйте это сделать в браузере по этой ссылке. В Google уже поддерживается более 80 языков, для каждого возможно преобразование голоса в текст и обратно. Конкуренты пока от Google отстают, но со временем ситуация на этом рынке выровняется, так как с течением времени, обрабатывая семплы речи, каждая компания добьется очень высокой точности распознавания голоса. Также добавим сюда алгоритмы анализа контекста в облаке.
Понятно, что в Google будут первыми в этом забеге, так как уже делают это для других сервисов, в том числе и смартфонов, но преимущество не будет длиться вечность, в конечном итоге на рынке появится массовая и дешевая технология, она повторяема любой компанией. Условно можно считать, что преимущество Google измеряется 3-5 годами, пока конкуренты не приблизят свои технологии к тем, что существуют у этого гиганта. Первый этап работы любого голосового помощника, как мы выяснили, это распознавание голоса и перевод его в текст. Нет никакой проблемы в том, чтобы повторить Amazon Alexa или любой иной голосовой помощник, в Китае стоимость производства такой коробки составит 15-20 долларов от силы, а цена Google Home — 109 долларов без учета налогов. Как и за что крупные производители берут такие деньги и получают сверхприбыль, во всяком случае, на первый взгляд? Ответ кроется в том, что у них, с одной стороны, нет конкурентов, обладающих сходными технологиями, те же китайцы не могут завалить рынок голосовыми помощниками, так как отсутствуют общедоступные технологии для этого, о чем подробно ниже.
С другой стороны, в отличие от продажи обычной беспроводной колонки, где срок жизни влияет только на себестоимость ремонта и гарантийные обязательства для производителя, в домашнем голосовом помощнике есть запросы к облаку компании, каждый запрос стоит для компании определенных денег. Недорого стоят запросы в платформе от Google, они тарифицируются отрезками по 15 секунд, стоимость такого запроса составляет 0. Например, если вы распознали отрывок в 16 секунд, то с вас возьмут 0. Такие цены приводятся для любого приложения на смартфоне и имеют ограничение до одного миллиона минут. Для голосовых помощников дома, машин, телевизоров и прочего вам нужно обратиться в Google, цены будут выставлены индивидуально. Специально чтобы подсчитать, сколько может стоить сторонней компании обслуживание домашнего голосового помощника, установил диктофон и посчитал, сколько запросов в среднем в день у меня к Google Home.
До этого момента я искренне полагал, что практически не пользуюсь этой системой, когда нахожусь в США, после своего эксперимента убедился, что это не так. В среднем в день у меня порядка 20 обращений к Google Home причем я делал это один, другие люди не работали с системой , запросы стандартные, как правило, это голосовой поиск чего-то в сети, когда лениво вставать с дивана, а смартфона или планшета под рукой нет.
Голосовой помощник для социальных служб
С появления первых голосовых помощников прошло 25 лет, а технология всё ещё далека от совершенства. Теперь — с нейросетью YandexGPT. Она позволила улучшить мои сценарии работы, а это значит, что я умею ещё больше, чем раньше. Я доступна в умных устройствах, сервисах и приложениях Яндекса, а ещё в новом Чате. Придумываю идеи, пишу и редактирую тексты. неправильного произношения и рекомендации:Использование голосовых помощников может значительно упростить повседневные задачи, такие как поиск информации, управление устройствами, покупки и другие.
Комаровка в Украине и советы по ужину: что умеют голосовые помощники Siri, Алиса и Google Assistant
Это один из первых российских голосовых помощников — его запустили в 2018 году. Эксперт рассказал Hi-Tech , как в России появляются голосовые ассистенты и сколько денег уходит на их разработку. Рейтинг построен по количеству упоминаний голосовых помощников в русскоязычном сегменте соцмедиа. Обзор функций голосового помощника Алиса от «Яндекс».
Алиса, Джой, Олег, Ева… Кто они? ТОП-9 самых популярных голосовых помощников
Предварительно на вашем смартфоне должна быть включена соответствующая опция в разделе «Функции кнопок». Без этой функции быстрый запуск не сработает Сколько бы разрешений Марусе я ни выдал, она никак не хочет запускаться голосом. Таковы ограничения Google, которые тот же Яндекс обходит при помощи собственного лончера. Сделает ли что-то подобное VK Group — неизвестно. Но хотелось бы. Ну а я лишь скажу несколько слов о том, как подключить Марусю к телефону: Подключите колонку к источнику питания. Запустите приложение Маруся на своем смартфоне.
Откройте настройки и перейдите в раздел «Подключить колонку». Авторизуйтесь в своей учетной записи VK ID регистрируется одним кликом. Активируйте геолокацию и Bluetooth на телефоне.
Таким образом, пока стоит обратиться к сторонним голосовым помощникам для компьютеров — благо, такие варианты есть.
Вот лишь некоторые из тех, которые поддерживают русский язык: «Горыныч» — ассистент, владеющий как русским, так и английским. Проблема «Горыныча» заключается в том, что речь он распознаёт весьма посредственно — если владелец ПК вдруг охрипнет, то голосовой ассистент просто перестанет его понимать. Разработчики утверждают, что «Агрегат» гораздо лучше Cortana по ряду причин: во-первых, «Агрегат» понимает русский, во-вторых, он устанавливается на любую операционную систему будь то OSX, Windows или Linux , в-третьих, пользователи могут повышать функциональность «Агрегата» путём установки дополнительных модулей. Typle — простенькая утилита для Windows 7, 8 и 10.
Функционал Typle весьма ограничен: программа может открывать файлы и приложения, но при этом не способна, скажем, управлять музыкальным проигрывателем. Зато Typle прекрасно понимает русский язык, а благодаря продвинутой технологии распознавания речи может работать даже с бюджетными микрофонами. Заключение В скором времени владельцев гаджетов с Android ждет нелегкий выбор.
Это связано с ростом эффективности технологии: робот лучше понимает собеседника и быстрее оказывает ему необходимую услугу. В то же время происходит закономерное увеличение пользовательской базы , обрабатываемой роботами-операторами: в первом полугодии 2021 года роботы АБК обзвонили в 800 раз больше клиентов, чем в аналогичный период 2019; в среднем звонок от робота получают более 1 млн человек в день. Для нас это идеальный пример доверия между человеком и роботом в телефонной трубке: вы звоните ему с конкретным запросом и получаете четкий ответ. Стоит отметить, что спектр сегментов бизнеса, в которых эти технологии востребованы, становится шире. Чаще всего роботы-операторы используются в рамках теле маркетинга , информирования, коллекшена и банкинга; среди дополнительных сфер — проведение опросов, обучение и HR. Роботы-операторы — это про цифровую трансформацию, про оптимизацию ресурсов — как финансовых , так и человеческих.
Кроме того, перед выдачей ответов пользователю важно делать дополнительный фактчекинг данных от помощника. Да, ошибки в ответах пока могут быть, особенно в каких-то сложных навыках, например отгадывании загадок. При работе сразу с несколькими помощниками можно обратить внимание, что у каждого из них есть свои оригинальные черты: чувство юмора, тембр голоса, манера общения и даже пол. Зачем это нужно?
Одно из объяснений — человек охотнее взаимодействует с устройством или технологией, у которой есть признаки эмпатии. Например, оно может «подыграть» пользователю: продолжить шутку, обозначить свои границы, дать ненавязчивый «человечный» совет. При этом разработчики голосового ассистента должны учитывать, что аудитория у продукта многомиллионная: пользоваться устройством могут взрослые, дети. Поэтому важно выдержать баланс, чтобы голосовой ассистент никого не обидел, не расстроил и тем более не причинил вред.
Бывает, что разработчики стараются придавать своим продуктам некоторые индивидуальные черты. В то же время важно помнить про эффект зловещей долины , и производители это учитывают — большинство ассистентов не пытаются притворяться человеком и обычно стремятся к тому, чтобы не реагировать излишне человечно на определенные вопросы. Леонид Саночкин, технический лидер в МТС AI Сколько стоит создание ассистента и что для этого нужно уметь Пока разработку собственных голосовых помощников могут позволить себе крупные компании. Например, разработка Олега обошлась «Тинькофф» примерно в 50 миллионов рублей и оправдала себя уже в первый месяц, когда позволила сэкономить столько же.
Чтобы разработать своего помощника, стоит определиться с тем, какие проблемы будет решать ИИ и какой результат получат пользователи. Сейчас технологии позволяют разработать как голосового помощника, так и чат-бота. Они оба распознают человеческую речь, но первый может сам выстроить логическую цепочку, а второй отправит автоматизированный ответ. Если бюджет не позволяет разработать личного Олега, то лучше будет обратиться к экосистеме Сбера или Алисы, которые помогут разработать свой навык на их платформе.
Навыки для Алисы можно создать с помощью платформы Яндекс. Диалоги , а Сбер работает в SmartApp Studio. Тех, кто не умеет программировать, выручит визуальный конструктор от Яндекса или сторонний Dialogflower. На базе Aimylogic можно создать навыки почти для всех известных ассистентов.
По данным Just Al, создание чат-бота займет от недели до 3,5 месяцев и в среднем будет стоить от 250 до 300 тысяч рублей. При том можно заняться разработкой самостоятельно, и тогда придется оплатить лишь лицензию за использование конструктора , которая стоит от 5900 до 59 000 рублей в зависимости от количества пользователей. Работа строится по следующей схеме. Первым этапом определяются требования и создается ТЗ.
На проектировании проводятся анализ и разметка пользовательских данных и создание макетов интерфейса. При разработке нужно будет реализовать бизнес-логику и интеграции. А после этого протестировать навык и запустить его. Какой голосовой ассистент лучше Алиса от Яндекса Интерфейс Алисы на смартфоне.
Помощник помогает пользователю в решении разных задач: Ищет информацию. Алиса может найти информацию по различным темам: погода, новости, курсы валют. Отвечает на вопросы. Развлекает пользователя.
Включает музыку, фильмы, подкасты.
«Алиса» от «Яндекса» стала самым обсуждаемым голосовым помощником в России
Выбираем самого умного голосового помощника в 2023 году. Рынок голосовых помощников в 2022-м вырос на 33%, до 2,7 млрд руб. В 2023-м он может увеличиться еще на 40–45% за счет перехода на голосовые контакт-центры и роста потребности в персонализации. Голосовые ассистенты заслужили доверие как у крупных, так и у небольших компаний, став важной. Статья Голосовые ассистенты (Роботы-операторы), 80% опрошенных россиян постоянно общаются с голосовыми помощниками, В первом полугодии количество звонков с помощью голосового робота составило 360 млн, Смотрите также Голосовые помощники. Аналитики Juniper Research прогнозируют трехкратное увеличение использования цифровых голосовых помощников.
Некоторыми госуслугами стало возможно пользоваться с помощью голосового помощника
Голосовые помощники составят расписание, переведут деньги, закажут еду, возьмут на себя управление умным домом — в общем, они умеют все, что положено уметь хорошему помощнику. В этой заметке я привожу подборку лучших голосовых помощников для компьютера и телефона. Кроме того, внедрены персональные медицинские помощники — устройства для непрерывного контроля состояния пациентов. Перспективы монетизации голосовых помощников Согласно прогнозам Juniper Research, к 2023 году в мире будут использовать 8 миллиардов голосовых помощников — на одного человека будет приходиться дватри ассистента. Голосовые помощники – очень полезная штука, которая выручает во многих ситуациях.