Обзор функций голосового помощника Алиса от «Яндекс». Голосовой помощник знает, когда ребенок зашел в школу и во сколько вышел из нее. Обзор функций голосового помощника Алиса от «Яндекс».
В Петербурге назвали самых популярных голосовых помощников
Это в том числе единая медицинская справочная служба «122», единая справочная города Москвы и контактный центр Московского транспорта. Дмитрий Головин, заместитель руководителя департамента информационных технологий города Москвы: «В базе знаний робота-помощника содержится более 400 тематик, по которым он может оказать помощь, например, записать на прием к врачу или сдать показания счетчиков. Он подскажет график работы органов исполнительной власти и статус готовности документов, а также подаст заявку в Единый диспетчерский центр. Роботу-помощнику достаточно двух минут, чтобы выслушать вопрос, получить дополнительную информацию и предоставить ответ звонившему».
С помощью голосового помощника можно звонить, отправлять сообщения, устанавливать напоминания, добавлять мероприятия в календаре, узнавать новости и прогноз погоды, искать рестораны и маршруты, а также определять музыку. Вслед за своим главным соперником с небольшим отрывом расположился помощник Siri от компании Apple 106,8 тыс. Первая Siri начала говорить еще на телефонах iPhone 4S в 2011 году. При помощи технологии голосового синтеза, именно Siri стала первым голосовым помощником, который смог поддержать диалог. Она может не только позвонить на нужный номер или отправить сообщение, но и запоминает привычки пользователя и предугадывает, что может ему понадобится в течение дня.
На шестом месте голосовой финансовый ассистент Олег от компании Тинькофф 59,3 тыс. Олег вовремя напомнит о неоплаченных счетах и поможет держаться в рамках бюджета, подскажет курс валют, забронирует столик в ресторанах или купит билеты в кино, найдет скидки на товары и услуги. А еще даст совет или просто поболтает. Разработанная компанией Amazon Alexa заняла седьмое место 29,2 тыс.
Нажмите на «три точки». Откройте вкладку «Приложения по умолчанию». Выберите Марусю в пунктах «Голосовой помощник», а также «Помощник и голосовой ввод». Голосовым помощником по умолчанию является Google Assistant, и это нужно исправить Эти настройки помогут вам запустить Марусю через любой приложение, воспользовавшись комбинацией кнопок или кратковременным нажатием на кнопку питания. Предварительно на вашем смартфоне должна быть включена соответствующая опция в разделе «Функции кнопок». Без этой функции быстрый запуск не сработает Сколько бы разрешений Марусе я ни выдал, она никак не хочет запускаться голосом.
Таковы ограничения Google, которые тот же Яндекс обходит при помощи собственного лончера. Сделает ли что-то подобное VK Group — неизвестно. Но хотелось бы. Ну а я лишь скажу несколько слов о том, как подключить Марусю к телефону: Подключите колонку к источнику питания.
То, что совсем недавно выглядело, как игрушка для убийства времени, превратилось в полноценный инструмент. Основным инструментом для взаимодействия предсказуемо оказался смартфон, — люди, разговаривающие с настольным компьютером всё ещё выглядят достаточно странно. А чем же россияне занимаются с умными помощниками?
Русскоговорящие голосовые помощники: кто умнее?
Рейтинг пополняет отличный голосовой помощник для пользователей смартфонов на базе Android, которые много времени проводят в пути. «Помощников много не бывает»: лучшие голосовые ассистенты для русскоязычных пользователей. В прошлом году голосовой помощник Общегородского контакт-центра Москвы принял больше 38 миллионов звонков горожан.
Как это работает? Голосовые помощники для дома и квартиры на примере Google, Amazon и других
Команда LinDeal исследовала известных голосовых помощников и составила свой топ-20 для Android и iOS, честно расписав все плюсы и минусы. К 2024 году более 90% голосовых помощников будут осуществлять поддержку и управлять девайсами умного дома. Aiva создала голосового "помощника", обеспечивающего коммуникации пациентов с медицинской организацией и улучшающие рабочие процессы в ней. Согласно данным ВЦИОМ, голосовыми сообщениями пользуются 64% россиян. Специально чтобы подсчитать, сколько может стоить сторонней компании обслуживание домашнего голосового помощника, установил диктофон и посчитал, сколько запросов в среднем в день у меня к Google Home.
Сегмент голосовых помощников к 2024 году вырастет на 769%
В настоящий момент решения на базе ИИ доступны не только корпоративным клиентам, но также малому и среднему бизнесу. По словам эксперта, стоимость создания голосового помощника не сильно изменилась за последние годы. При этом нельзя игнорировать факт увеличения затрат на инфраструктуру и содержания собственного штата специалистов, занимающихся продакшеном, исследованием и разработкой, со стороны вендоров. Коммерческий директор Neuro.
Поэтому голосовые помощники могут отреагировать на ругательство также, как и человек, а точнее — герой фильма или книги. Безопасность и конфиденциальность данных при использовании голосовых помощников Производители голосовых помощников уверяют, что данные пользователей конфиденциальны, а разговоры не прослушиваются, коммуникация с устройством безопасна.
Но как тогда голосовой помощник будет обучаться? Несмотря на слова корпораций о безопасности, нужно обращать внимание, что в момент настройки голосового помощникам пользователь дает согласие на использование и обработку персональных данных. Кроме того, без Data Science невозможна работа и развитие голосового помощника. Вопрос в том, как хранятся эти данные? IT-гиганты сообщают, что голосовые помощники не записывают все, что происходит вокруг смартфона или колонки.
Запись начинается только с момента запуска команды, обращения к ассистенту, вроде «Okey, Google», «Siri», «Алиса» и прочих. По словам разработчиков, записанные данные шифруются и хранятся на облаке, а их защите уделяют много внимания. Но все же в СМИ иногда всплывают неприятные истории нарушения конфиденциальности. Так, в 2019 году выяснилось, что у Amazon разговоры с умной колонкой прослушивал специальный отдел независимых подрядчиков. А в 2021 году Google признал , что Google Assistant слушает пользователей в фоновом режиме.
Если на счет конфиденциальности данных есть опасения, то специалисты рекомендуют отключать доступ к микрофону у приложений с голосовыми ассистентами. Как пользоваться голосовым помощником решают сами пользователи. Виртуальные голосовые ассистенты в бизнесе Кроме решения повседневных задач пользователей виртуальные голосовые помощники помогают бизнесу, например, они могут отвечать на звонки вместо оператора или заниматься продажей товаров и услуг. Это тип общих голосовых помощников. В бизнесе голосовых помощников в основном создают для коммуникации с клиентами во время телефонных звонков.
Лучшие голосовые помощники Голосовые помощники призваны сэкономить время и упростить жизнь человека. Расскажем о самых популярных моделях на российском рынке. Алиса «Алису» от компании «Яндекс» можно смело назвать самым популярным голосовым ассистентом. Она работает со всеми операционными системами, прекрасно уживается в системе «Умный дом», встречается во многих сервисах компании. Но чаще всего ее можно найти в составе «Яндекс.
Скорее всего, можно ожидать, что Google будет бесплатно раздавать такие решения для партнеров, создающих голосовые помощники, во всяком случае, первоначально подход будет такой. Это подход, который мы видим в Android, на первом этапе систему раздают бесплатно и всячески подсаживают на нее производителей, а затем постепенно начинают закручивать гайки, чтобы добиться дополнительных плюсов для себя. Обработка запроса, сценарии и их выполнение После того, как голосовой помощник распознал голос и превратил его в текст, он отдает его в облако либо выполняет простую локальную команду, как это было в примере с будильником. Достоинство голосового помощника напрямую вытекает из того числа операций команд , которые он способен распознать и правильно их обработать. Именно сценарии использования становятся второй проблемой для широкого и быстрого распространения голосовых помощников по всему миру. В Amazon привлекли сторонних разработчиков, чтобы они создавали свои сценарии использования и команды, к концу февраля 2017 года таких команд стало 10. В Amazon их называют «умениями» skills.
Простота создания новых умений подкупает разработчиков, равно как и то, что продукты от Amazon популярны в Америке, поэтому очень быстро голосовые помощники научились заказывать пиццу из любого магазинчика рядом, вызывать Uber и делать множество не таких тривиальных вещей. Чем больше людей пользуется голосовыми помощниками, тем большее число сценариев возникает, а система быстрее учится их правильно обрабатывать. Например, в самом начале пути Alexa почти не знала немецкие рок-группы, хотя сам язык поддерживался. Сегодня поиск по музыкальным группам Германии и жанрам музыки пусть и не идеален, но вполне сносен, вы можете получить необходимые сведения, запросив информацию. Система обучается, и прогресс налицо. Для сторонних разработчиков возникает вопрос, кто будет создавать и поддерживать такую систему. Например, в Китае сейчас наблюдается бум стартапов, что инвестируют десятки миллионов долларов в это направление, они создают компании, которые пытаются в одном продукте предоставить как раз обработку сценариев и их автоматизацию.
Это не только и не столько рынок голосовых помощников, для такой автоматизации найдется более широкое применение, например, это обработка заказов на сайтах, создание чат-ботов для поддержки клиентов любого бизнеса, в России вы уже сталкиваетесь с этим, обращаясь в службу поддержки Билайна, беседу с вами ведет программа. Бум развития сценариев, которые нужны потребителям, напрямую связан с помощниками, они выигрывают от того, что в алгоритмы загоняют стандартные действия. К сожалению, формализовать естественный язык не так-то просто, поэтому любые диалоги с голосовым помощником или программой в сети не являются очень глубокими. Так, любой разговор можно описать в парадигме вопрос-ответ, когда каждая пара образует один уровень, большинство программ обработки диалогов сегодня ведут более-менее осмысленный разговор для 2-3 уровней, затем они начинают пасовать, и тогда появляется продуманная программистами заглушка, например, у Siri это шутки, которые должны скрыть незнание программой того, как действовать дальше. Пользовательские сценарии условно можно разделить на простейшие, те, что не зависят от страны и языка, и сложные. То есть, это предопределенные действия, реализация которых в устройстве или программе не вызывает никаких затруднений. В простых сценариях важно, чтобы система распознавания речи правильно распознала контекст и то, является запрос утверждением или вопросом.
Например, одна и та же фраза может восприниматься системой различно: «Будильник на 8 часов стоит или нет? Многие системы первоначально просто ставили будильник на это время, не проверяя, есть он уже или нет. Теперь они «научились» проверять состояние будильника и правильно отвечать на этот вопрос. Сложные сценарии напрямую привязаны к контексту языка и страны. Например, спрашивая, что сегодня идет в кино, вы не ждете, что голосовой помощник зачитает вам список фильмов в Нью-Йорке, наверное, вы хотите услышать его для своего города и желательно для своего района или любимого кинотеатра. Локальный контекст становится архиважным, и глобальные компании зачастую не могут сделать ничего в этой области. Исключением является Google, у которого системы Google Now и Google Maps построены вокруг сбора точек интереса, или POI, то есть «изучают» мир, отзывы о тех или иных заведениях.
В Amazon этой информации нет, поэтому сценарии подразумевают не только алгоритм действий, но им нужна и первоначальная информация. В России дочерняя компания i-Free под названием Just AI с 2011 года создает такую платформу, то есть они пытаются создавать сценарии, применимые для российского рынка. Первым продуктом, в котором на массовом рынке применяются сценарии, созданные компанией, стал робот Pudding в нашем варианте «Емеля» , он умеет разговаривать на русском языке, искать определенный контент и защищать детей от нежелательных слов и запросов. Назвать «Емелю» роботом сложно, это самый настоящий голосовой помощник, ориентированный на детей в возрасте от 5 до 11 лет, при этом он не является игрушкой. Со стороны компании Just AI в этом голосовом помощнике сценарии и распознавание русской речи движок от Nuance. В теории, если ребенок начнет интересоваться самоубийством или подобными темами, такой «робот» может отговорить его и отправить экстренное сообщение родителям — это те самые сценарии, которые нужно разработать и добавить их в устройство. Другой пример, дети часто хотят, чтобы им рассказали сказку, выбор сказок огромен, и возникает вопрос, на какой остановиться.
В таких голосовых помощниках будет выбор приоритетных произведений, известных как детям, так и родителям. То есть, если вы не знаете, что именно хотите услышать, то говорите: «Хочу сказку». А уже сам помощник выбирает, какую именно сказку вы услышите. Насколько умным будет ваш голосовой помощник, напрямую зависит от того, насколько он понимает контекст беседы, знает ваш образ жизни например, где вы работаете и адрес офиса, ваш распорядок дня. Понятно, что в этой гонке преимущество за Google, так как в рамках Ассистента компания знает про вас так много, что может построить разумные сценарии и подсказки, которые будут уместны и важны. Другие компании в этом направлении пока являются отстающими, но пытаются быстро развиваться. Умение обработать запрос, правильно выделить его контекст и найти релевантный ответ для голосовых помощников становится важнейшим свойством.
Те компании, что научились выпускать голосовых помощников в Китае а таких уже десятки , не могут быстро и легко локализовать продукт для России или других стран, им нужны сценарии, которых у них нет.
Forbes Экспертиза
Вот и проверим на других ассистентах. Но сперва дадим шанс Алисе. Удивительно, но на смартфоне ассистент с первого раза верно понял имя. Siri тоже сразу предложила подборку ссылок на мексиканского мастера: статьи в Wikipedia, онлайн-кинотеатр и так далее. То же самое сделал и Google Assistant. Настоящий помощник умеет еще и поднять шефу настроение, так что заказываем шутки. С просьбой «расскажи анекдот» Алиса и Google Assistant справились насколько успешно, сказать сложно — чувство юмора-то у людей разное , а вот Siri замялась: Хотя, видимо, в этом и была вся соль. С поиском музыки вышло неоднозначно: на запрос «открой последний альбом Metallica» Алиса сразу включила первый трек с нужной пластинки, а Siri почему-то запустила вторую песню. Справедливости ради отметим, что мы не просили проигрывать альбом с начала, но логично было бы сделать именно так. Google Assistant тоже предложил запустить Metallica, только вот нативный музыкальный сервис не был активирован. Вечная загадка — что приготовить на ужин, когда совсем лень и холодильник практически пустой.
С помощниками, по идее, такой проблемы быть не должно. Но все они просто выдали ссылки на ресурсы о готовке еды. Ответы принимаются, но хотелось бы конкретики: мол, вот вам самый простой вариант со списком нужных продуктов. Для проверки мы выбрали улицу с заковыристым названием: 2-я Шестая линия. Лучше всех справилась Алиса — с первого раза и без дополнительных уточнений.
Об этом говорит исследование Forrester за 2020 год. Источник: cossa. Как голосовые помощники распознают речь Чтобы понимать человеческий голос, искусственный интеллект разделяет слова на звуки, а точнее — на звуковые маленькие части длиной в сотые доли секунды, фонемы. Затем каждая часть слова математически обрабатывается, получая в результате коэффициенты — они и описывают частотные характеристики звуковой части.
На основе этих данных голосовой помощник определяет голосовой запрос. Иногда у голосового помощника не получается понять фразу, тогда он достраивает слово из контекста всего предложения. Для этого у ассистентов есть таблица вероятностей переходов, в которой описаны возможные последовательности букв в словах. Кстати, такие таблички помогают распознавать запросы пользователей в зависимости от их акцента, поэтому, например, в Siri можно выбрать британский или американский английский язык. Если спросить у голосового помощника «Как дела? Да и форма голосовых помощников все чаще обретает человеческие черты: имя, пол, голос, может быть даже чувство юмора. Так как голосовых помощников учат быть человечными? Если для распознавания голоса виртуальными ассистентами используются сложные вычисления, то решать вопрос человечности позволяет большой список ответов, сочиненных редакторами и психологами. Это заготовленные специалистами голосовые сообщения с продуманными сценариями, где составлены ответы на самые популярные вопросы и запросы людей.
Редакторы сознательно составляют пул ответов в стиле, который будет гармонировать с образом голосового помощника, чтобы образ был человечнее. Для ответов на вопросы, которые невозможно предугадать, голосовые помощники используют нейросети, обученные материалами из медиа, литературы, кино. Поэтому голосовые помощники могут отреагировать на ругательство также, как и человек, а точнее — герой фильма или книги. Безопасность и конфиденциальность данных при использовании голосовых помощников Производители голосовых помощников уверяют, что данные пользователей конфиденциальны, а разговоры не прослушиваются, коммуникация с устройством безопасна.
Например, иногда лень лезть в карман за телефоном — намного проще крикнуть условной «Алисе», чтобы та сама поставила таймер или сообщила прогноз погоды на завтра. Голосовые помощники используют не только как отдельные устройства, но и как «мозг» умного дома. Виртуальные ассистенты, например, могут не только включать музыку, но и контролировать температурный режим в помещении и проверять камеры наблюдения. Лучшие голосовые помощники Голосовые помощники призваны сэкономить время и упростить жизнь человека. Расскажем о самых популярных моделях на российском рынке.
Изначально мы делали решение для крупных предприятий, банков и e-commerce, где сокращение любых издержек всегда критично. Но мы увидели, что больший спрос на автоматизацию коммуникаций у предприятий малого и среднего бизнеса, — они гибче и быстрее адаптируют свои внутренние бизнес-процессы. За счет голосовых помощников мы помогаем экономить время сотрудников, а также продвигать дополнительные услуги. Но возможности виртуального ассистента не ограничиваются коммуникациями с клиентами. Успех голосовых помощников — в их гибкости. Они дают бизнесу возможность решать широкий спектр бизнес-задач: от автоматизации рутинных повторяющихся процессов до создания уникального голоса бренда для персонализированного общения с аудиторией. На сегодняшний день МТТ входит в цифровую экосистему МТС успешно запустил сотни голосовых ассистентов в различных отраслях, высокий интерес мы видим у игроков в самых разных сферах — от онлайн-торговли и доставки до газовой промышленности.
Один из множества нетривиальных кейсов — компания «Лэнд-Сервис», которая обслуживает дорогостоящее холодильное оборудование. Мы сделали для них кастомизированное комплексное решение, которое самостоятельно распознает и присваивает степень критичности аварийных заявок, а дальше обзванивает всех ответственных лиц, от инженера до генерального директора, если ситуация действительно критична.
Сравнение голосовых помощников. Что выбрать?
Какие проблемы в использовании ИИ и голосовых помощников вы как эксперт можете выделить? Голосовой помощник – это программное обеспечение, которое позволяет пользователям взаимодействовать с устройствами с помощью голосовых команд. неправильного произношения и рекомендации:Использование голосовых помощников может значительно упростить повседневные задачи, такие как поиск информации, управление устройствами, покупки и другие.
Алиса, Джой, Олег, Ева… Кто они? ТОП-9 самых популярных голосовых помощников
Эта задача решается при помощи редакторских ответов: команда авторов выбирает сотни наиболее популярных у пользователей вопросов и пишет по несколько вариантов ответа на каждый. Составлять ответы нужно в едином стиле, чтобы из них складывался цельный образ помощника. У каждого голосового ассистента есть личность: пол, имя, черты характера и стиль речи. Алиса не может позволить себе общаться с пользователем на «ты» и соблюдает дистанцию: здесь у неё есть прототип — Мэри Поппинс. Поэтому помощница не любит, когда с ней начинают заигрывать и сразу одергивает пользователя. Для ответов на неклассифицируемые вопросы и реплики голосовые помощники обычно используют нейросети, обученные на базе текстов из медиа, книг и кино. Так, Алиса учится на самых разных материалах, в которых персонажи в том числе ругаются и спорят — и может научиться совсем не тому, чего хотят разработчики. Как и ребёнка, голосового помощника нельзя научить вести себя вежливо, ограждая от всего: то есть, обучая нейросеть на «чистом» датасете, где нет грубостей и прочих неприятных вещей, встречающихся в реальном мире. Если ассистент не будет знать о существовании подобных выражений, то он будет отвечать на них бездумно, случайными фразами — ведь для него эти слова останутся неизвестными.
Пусть лучше голосовой помощник знает, что это такое, и выработает определённую позицию по этим вопросам. Обучение ассистентов — как обучение детей: они всему учатся постепенно и иногда ошибаются. И это нормально. Попробуйте свои силы на Уроке цифры.
Фирменное приложение в основном нужно для настройки колонок и чтобы превратить телефон в пульт для телевизора с «Салют ТВ». Колонки Сбера не умеют звонить. Но сам Салют может позвонить за вас в ресторан и забронировать столик. Или предупредить, что входящий звонок нежелательный, и принять его на автоответчик. Лучшая для музыки Apple Siri Все российские голосовые ассистенты намертво привязаны к собственным музыкальным сервисам.
Большие колонки вроде SberBoom или «Станции Макс» отлично звучат, но вынуждают платить за подписку, а качество трансляции треков удовлетворит не всех меломанов. Если вы пользуетесь техникой Apple, лучший вариант ассистента и умных колонок для вас — Siri.
Также этот виртуальный ассистент поможет управлять системой умного дома — причем не только от Яндекса. Многие производители, например, Xiaomi , Polaris, Philips предлагают использовать Алису для голосового управления умной техникой. Но есть и проблемы. Например, помощник до сих пор полноценно не умеет работать с отправкой сообщений и звонками по списку контактов, с чем прекрасно справляется Google Ассистент. У Алисы же есть только ограниченные решения-«костыли»: функция дозвона в экстренные службы, умение звонить через мобильное приложение Яндекса на Яндекс. Станцию и блокировать звонки с нежелательных номеров через Яндекс. Человечность тоже иногда сбоит, особенно при сложных вопросах. Так, на вопрос «Будет ли экономический кризис?
Конечно, нет». Siri Siri — основной голосовой помощник для гаджетов Apple. Виртуальный ассистент умеет работать со звонками на iPhone , сообщениями и картами, напомнит о событиях и найдет музыку, поможет распланировать день и запомнить место для парковки. Также Siri эффективно управляет смартфоном, работает с некоторыми приложениями и интернет-сервисами, поможет советом и даже удачно пошутит. Кроме того, для управления приложениями, в которые Siri не интегрирована, создан сервис «Быстрые команды», в котором любой пользователь может запрограммировать определенную последовательность. Так удонбно отключать сеть в определенных обстоятельствах например, выход из дома , открывать нужные сайты, делать интернет-заказы и совершать действия с приложениями, которые не работают с Siri напрямую. А в iOS 15 у ассистента появился офлайн-режим, понимание контекста фраз на экране и даже длинных диалогов. Так что на гаджетах Apple действительно есть смысл пользоваться именно Siri — она предустановлена даже в Mac. Но имейте в виду, что она не всегда правильно распознает команды, особенно сложные, а ее акцент иногда оставляет желать лучшего. Маруся Завязанная на социальную сеть ВКонтакте и сервисы Mail.
Виртуальный ассистент может проложить маршрут и запомнить фразу, включить вашу любимую радиостанцию или запустить музыкальный трек, рассказать о погоде и ввести запрос в поисковик Mail. Как и Алиса, Маруся разговаривает приятным женским голосом и знает разные игры и сказки. Ассистент работает с торговой площадкой AliExpress и музыкальным сервисом Spotify , умеет воспроизводить музыку из ВКонтакте и «дружит» с онлайн-кинотеатром Wink. А еще Маруся вместе с Капсулой активно учатся взаимодействовать с системами умного дома.
Та же Алиса вгоняла пользователей в ступор открытой критикой президента и фразами о том, что «он попал в Кремль случайно». Это лишь некоторые из ошибок, просочившихся в сеть. Куда больше милых багов, с которыми мы сталкиваемся при ежедневном взаимодействии с голосовыми помощниками. Но они по-прежнему пользуются спросом. За что мы их любим Люди говорят почти в четыре раза быстрее, чем печатают. Голосовой помощник помогает быстрее ввести данные и получить ответ.
Конечно, при условии, что программа чётко распознала речь и нашла шаблон в базе данных. Голосовым приложением чаще пользуются, когда заняты руки. По этой причине из голосового приложения на смартфоне помощники быстро перекочевали в музыкальные колонки и умный дом. Можно заниматься домашними делами и параллельно заказывать еду из ресторана, не отвлекаясь на нажатие кнопок. Самый популярный ответ на вопрос, почему вы используете виртуальных ассистентов — «Это быстро» исследование Stonetemple Голосовые чатботы заменяют десятки сотрудников. Бизнесу выгоднее вложиться в разработку голосового помощника, ведь бот может общаться с сотнями клиентов одновременно, не уставать и не бегать покурить каждые полчаса. Помощника можно персонализировать. Изменить голосовые команды, дать имя ассистенту вместо «заводского» и даже выбрать голос, чтобы о погоде и курсах валюты вам рассказывал Трамп или Баста. Просто интересно. Каждый хотя бы раз так делал: задавал Алисе странный вопрос, а потом издевался над её ответом.
А как ещё мог бы появиться баг с критикой Путина? Что бесит в голосовых помощниках Бот не понимает команды. Когда десять раз просишь включить ребёнку сказку про муми-тролля, а колонка десять раз включает Лагутенко, рано или поздно приходишь к мысли, что проще было бы написать. Сложнее преодолеть языковой барьер. Текстовый запрос можно быстро перевести онлайн-переводчиком, а голосовой ассистент общается на ограниченном наборе языков. Неловко как-то. Легче всего в контакт с голосовыми помощниками вступают зумеры. Бумерам, поколению 1990-х и даже миллениалам трудно заставить себя разговаривать с колонкой, чайником или утюгом. Ощущение идиотизма ещё сильнее, если приходится общаться с техникой в публичных местах. Использовать голосовую команду для поиска информации без визуала сложно.
На вопрос «Сколько времени? А покупка техники, выбор отеля или ресторана уже требуют в ответ фотографии и видео.
29 регионов России используют голосовых помощников в сфере здравоохранения
Как и человек, голосовой помощник не всегда хорошо распознаёт звуки, и ему приходится достраивать слова исходя из контекста и статистики. У него есть таблица вероятностей переходов, которая указывает, что после «к» с одной вероятностью будет «о», с другой — «т» и так далее. Это позволяет определить варианты последовательности фонем и потом варианты слов, которые вы могли сказать. Голосовому помощнику нужно учитывать множество акцентов, в которых фонемы звучат по-разному. Например, в Москве чаще будет произноситься гласная «а», а в Архангельске — «о». Причем, если для Siri и Alexa можно выбрать британский или американский английский, а вот вологодского или краснодарского русского нет. Как голосовые ассистенты понимают и выполняют поручения После того, как голосовой помощник распознал речь и перевёл её в текст, ему нужно понять, какого ответа ждет пользователь. В Алисе запросы пользователей сначала классифицируются по намерениям, а потом перенаправляются в тематические разделы, например, для прослушивания музыки или неформального разговора. Задача классификатора намерений — определить, что человек хотел сказать своей фразой.
Например, если пользователь спросил: «Будет ли завтра дождь? В классификаторе намерений запрос дробится на слова и пунктуационные знаки. Для них применяют обученные на больших данных эмбеддинги — представления слов, которые позволяют понять, в каком контексте эти слова обычно используются. Один из самых простых методов эмбеддинга — это контекстные векторы. Сперва для текстового корпуса составляют словарь, из которого выбираются самые распространённые слова.
Исследования 5 июля 202205. От умных колонок и умных часов до умных телевизоров и умных термостатов - эти устройства с голосовым помощником используются практически во всех сферах нашей жизни.
Используя систему Медиалогия, проанализировали, какие голосовые помощники упоминались чаще всего пользователями соцсетей в период с января 2021 года по июнь 2022 года. С большим отрывом самой обсуждаемой стала Алиса от Яндекса 420,1 тыс. Ее разработка началась в 2016 году, а уже в 2018 году она начала покорять пользователей. Изначально Алиса могла находить информацию лишь в поисковике Яндекса, но теперь благодаря нейронным сетям она распознает речь, анализирует её, определяет тематику диалога, выделяют полезную для поиска информацию, синтезируют ответы помощника. На второй позиции Сбер Салют 157,4 тыс. Пользователь может сам выбрать своего персонажа: Джой, Афину и Сбер. Любой из них поможет перевести деньги, разобраться с платежами, сообщит о состоянии счета и даже закажет еду домой и запишет на стрижку.
Как правило, текущие голосовые помощники настраиваются на один основной язык. Например, если устройство поддерживает как английский, так и русский, одновременно разговаривать с ним на двух языках не выйдет, оно будет путаться и просить повторить фразы. В будущих устройствах этот момент будет с легкостью разрешен, так как голосовые помощники научатся сами определять язык, на котором вы говорите. Но пока они могут только анализировать контекст, в котором вы произносите фразу все это происходит в облаке , чтобы заменить некоторые слова на английские. Например, раньше, когда вы произносили фразу «в каком году вышел альбом обратная сторона луны у пинк флойд», она распознавалась именно так, как я написал. Причина заключается в том, что Google задействует нейронные сети для анализа не только самой фразы, но и сказанного контекста. То есть, система пытается предугадать, что именно вы хотите, какой смысл у вашего вопроса. Если вы по какой-то причине пропустили революцию в системах распознавания и расшифровки голоса, никогда не пользовались голосовой диктовкой на Android-смартфонах, то просто попробуйте это сделать в браузере по этой ссылке.
В Google уже поддерживается более 80 языков, для каждого возможно преобразование голоса в текст и обратно. Конкуренты пока от Google отстают, но со временем ситуация на этом рынке выровняется, так как с течением времени, обрабатывая семплы речи, каждая компания добьется очень высокой точности распознавания голоса. Также добавим сюда алгоритмы анализа контекста в облаке. Понятно, что в Google будут первыми в этом забеге, так как уже делают это для других сервисов, в том числе и смартфонов, но преимущество не будет длиться вечность, в конечном итоге на рынке появится массовая и дешевая технология, она повторяема любой компанией. Условно можно считать, что преимущество Google измеряется 3-5 годами, пока конкуренты не приблизят свои технологии к тем, что существуют у этого гиганта. Первый этап работы любого голосового помощника, как мы выяснили, это распознавание голоса и перевод его в текст. Нет никакой проблемы в том, чтобы повторить Amazon Alexa или любой иной голосовой помощник, в Китае стоимость производства такой коробки составит 15-20 долларов от силы, а цена Google Home — 109 долларов без учета налогов. Как и за что крупные производители берут такие деньги и получают сверхприбыль, во всяком случае, на первый взгляд?
Ответ кроется в том, что у них, с одной стороны, нет конкурентов, обладающих сходными технологиями, те же китайцы не могут завалить рынок голосовыми помощниками, так как отсутствуют общедоступные технологии для этого, о чем подробно ниже. С другой стороны, в отличие от продажи обычной беспроводной колонки, где срок жизни влияет только на себестоимость ремонта и гарантийные обязательства для производителя, в домашнем голосовом помощнике есть запросы к облаку компании, каждый запрос стоит для компании определенных денег. Недорого стоят запросы в платформе от Google, они тарифицируются отрезками по 15 секунд, стоимость такого запроса составляет 0. Например, если вы распознали отрывок в 16 секунд, то с вас возьмут 0. Такие цены приводятся для любого приложения на смартфоне и имеют ограничение до одного миллиона минут. Для голосовых помощников дома, машин, телевизоров и прочего вам нужно обратиться в Google, цены будут выставлены индивидуально. Специально чтобы подсчитать, сколько может стоить сторонней компании обслуживание домашнего голосового помощника, установил диктофон и посчитал, сколько запросов в среднем в день у меня к Google Home. До этого момента я искренне полагал, что практически не пользуюсь этой системой, когда нахожусь в США, после своего эксперимента убедился, что это не так.
В среднем в день у меня порядка 20 обращений к Google Home причем я делал это один, другие люди не работали с системой , запросы стандартные, как правило, это голосовой поиск чего-то в сети, когда лениво вставать с дивана, а смартфона или планшета под рукой нет. Все запросы вписываются в 30 секунд, то есть они стоят 0. В месяц таких запросов наберется 600, в год их уже будет 7200 штук, что составит 86. Учитывая, что средний жизненный срок домашнего голосового помощника уже превышает два года рынок появился два года назад, и посчитать реальный срок невозможно, но он будет 4-5 лет как минимум , получается, что любой производитель, не имеющий бесплатной системы преобразования голоса в текст, обречен на экономический крах. Однако не все так плохо, тот же Nuance предлагает модель лицензирования на определенное число устройств, с определенным средним числом обращений в течение года или разовым лицензионным платежом. Это более гибкая модель, которая позволяет сторонним компаниям строить свои голосовые помощники. То же самое можно сказать про подход Amazon, когда возникла конкуренция со стороны Google, в компании начали бесплатно раздавать Alexa Voice Services AVS , причем в версии с распознаванием речи только в облаке ASR , а также добавили модуль распознавания естественного языка NLU. Такое решение в какой-то мере вынужденное, так как в Amazon хотят быстро улучшить качество распознавания речи, добавить новые языки, чтобы на равных конкурировать с Google.
В январе 2017 года на CES в Лас-Вегасе было показано два десятка устройств, что используют голосовые возможности от Amazon, это беспроводные колонки, персональные помощники, термометры и многие иные предметы «умного» дома. Среди корпораций, имеющих возможность доминировать на рынке голосовых помощников и разрабатывать собственные системы, отметим такие компании, как Amazon, Apple, Google, Facebook, Microsoft, Samsung. Другие производители будут вторичны, так как не смогут создать собственные системы распознавания голоса и конвертации его в текст, они будут пользоваться теми решениями, что предоставят им перечисленные компании. Скорее всего, можно ожидать, что Google будет бесплатно раздавать такие решения для партнеров, создающих голосовые помощники, во всяком случае, первоначально подход будет такой. Это подход, который мы видим в Android, на первом этапе систему раздают бесплатно и всячески подсаживают на нее производителей, а затем постепенно начинают закручивать гайки, чтобы добиться дополнительных плюсов для себя. Обработка запроса, сценарии и их выполнение После того, как голосовой помощник распознал голос и превратил его в текст, он отдает его в облако либо выполняет простую локальную команду, как это было в примере с будильником. Достоинство голосового помощника напрямую вытекает из того числа операций команд , которые он способен распознать и правильно их обработать. Именно сценарии использования становятся второй проблемой для широкого и быстрого распространения голосовых помощников по всему миру.
В Amazon привлекли сторонних разработчиков, чтобы они создавали свои сценарии использования и команды, к концу февраля 2017 года таких команд стало 10. В Amazon их называют «умениями» skills. Простота создания новых умений подкупает разработчиков, равно как и то, что продукты от Amazon популярны в Америке, поэтому очень быстро голосовые помощники научились заказывать пиццу из любого магазинчика рядом, вызывать Uber и делать множество не таких тривиальных вещей.
Голосовой помощник Alexa заговорит голосом усопших Голосовой помощник Alexa заговорит голосом усопших 23 июня 2022, 16:11 МСК Поделиться Комментарии На конференции Re:Mars компания Amazon представила новую функцию для голосового помощника Alexa. Во время презентации старший вице-президент Рохит Прасад попросил прочитать «Волшебника страны Оз» голосом бабушки.
Голосовой помощник тут же переключился на более мягкий и человеческий голос, имитируя члена семьи.