Специально чтобы подсчитать, сколько может стоить сторонней компании обслуживание домашнего голосового помощника, установил диктофон и посчитал, сколько запросов в среднем в день у меня к Google Home.
Информация
- Ума палата: Алиса, Маруся и другие / Хабр
- «Алиса» от «Яндекса» стала самым обсуждаемым голосовым помощником в России
- Обзор голосовых помощников: что умеют Алиса, Салют, Маруся, Google Assistant и Siri
- К 2023 году число голосовых помощников в мире достигнет восемь млрд
- 10 главных умных помощников в 2022 году
- Высокоэффективные помощники - «Ведомости. Импортозамещение»
Artox Media Digital Group о развитии голосовых помощников
Также в прогнозе Juniper Research говорится о стремительном развитии голосовой коммерции - к 2023 году объем этого рынка превысит 80 миллиардов долларов. Аналитики пояснили, что включают в понятие денежные переводы и покупки цифровых товаров, а не только совершение традиционных покупок при помощи голосовых ассистентов. Между тем, в исследовательской компании Gartner недавно тоже высказались по поводу перспектив виртуальных помощников, сделав упор на растущем внедрении голосовых ассистентов на рабочих местах. Колл-центры стали полигоном для испытания многих виртуальных помощников, но с распространением технологий искусственного интеллекта и совершенствованием диалоговых интерфейсов появились различные типы цифровых ассистентов. Комментируя прогноз, директор по исследованиям Gartner Аннетт Джамп Annette Jump отметила, что в следующие три года все больше организаций станут использовать виртуальных помощников для сотрудников.
Никаких простых ответов Здесь возникает дилемма. Получать прямые ответы удобно, но часто они могут быть неверными, неуместными или оскорбительными. В 2020 году Штайн и его коллеги, Мартин Поттаст из Лейпцигского университета и Маттиас Хаген из Университета Мартина Лютера в Галле-Виттенберге, опубликовали статью, посвященную проблемам прямых ответов на поисковые запросы. Штайн и его коллеги рассматривают поисковые технологии как переход от организации и фильтрации информации с помощью таких методов, как предоставление списка документов, соответствующих поисковому запросу, к составлению рекомендаций в форме единственного ответа на вопрос. Но состоится этот переход, по их словам, не скоро.
И дело даже не в технических трудностях. Но мы забываем об этом, когда видим прямые ответы поисковой системы», — рассуждает Штайн. Шах также считает, что представление пользователям некого «единого» ответа на вопрос — это проблема, поскольку источники информации и любые разногласия между ними в таком ответе скрыты. На эти проблемы Шах и Бендер предлагают ряд решений. Они считают, поисковые технологии должны учитывать различные способы поиска информации, многие из которых не предполагают прямых ответов.
Люди часто используют поиск для изучения тем, по которым у них, возможно, даже нет конкретных вопросов, говорит Шах. В этом случае полезнее было бы просто предложить список документов. Кроме того, источники, использованные ИИ для составления ответа, должны проговариваться прямо. Шах также считает, что поисковые инструменты будущего должны иметь возможность отвечать пользователю, что он задал глупый вопрос. Это помогло бы избежать повторения в запросе оскорбительных или предвзятых посылок.
Она работает со всеми операционными системами, прекрасно уживается в системе «Умный дом», встречается во многих сервисах компании. Но чаще всего ее можно найти в составе «Яндекс. У «Алисы» обширный набор команд.
С ее помощью вы можете: Включать, перелистывать, ставить на паузу песни. Собирать различные комплекты одежды на работу или на выход.
На второй позиции Сбер Салют 157,4 тыс.
Пользователь может сам выбрать своего персонажа: Джой, Афину и Сбер. Любой из них поможет перевести деньги, разобраться с платежами, сообщит о состоянии счета и даже закажет еду домой и запишет на стрижку. Третье место заняла Маруся 156,8 тыс.
Она подберет и включит музыку из VK и любых других музыкальных сервисов, почитает детям сказки, расскажет все новости о погоде, пока вы собираетесь на работу, включит свет или запустит пылесос, найдет ответ на любой вопрос. На четвертой строке рейтинга Google Ассистент 108,6 тыс. С помощью голосового помощника можно звонить, отправлять сообщения, устанавливать напоминания, добавлять мероприятия в календаре, узнавать новости и прогноз погоды, искать рестораны и маршруты, а также определять музыку.
Вслед за своим главным соперником с небольшим отрывом расположился помощник Siri от компании Apple 106,8 тыс. Первая Siri начала говорить еще на телефонах iPhone 4S в 2011 году.
Голосовые помощники
И одна из главных причин этого - перегрузка, в том числе из-за количества времени, затрачиваемого на ввод информации в компьютерные системы, заполнение документов. Несколько компаний работают сегодня над системами, позволяющими автоматизировать ввод врачебных записей в системы электронных медицинских карт. Kiroku - система, позволяющая автоматически "выбирать" нужный контекст из разговора с пациентом и автоматически создавать клинические записи для врача. MDOps позволяет значительно уменьшить время на создание документации путем диктовки и автоматического создания клинических записей с помощью iPhone или iPad. Notable использует носимые устройства, голосовой интерфейс и AI для упрощения взаимодействий врача с пациентом. Saykara упрощает захват данных с помощью виртуального записывающего решения на базе AI-технологий, которое позволяет избавиться от необходимости работы с системой электронных медицинских карт. Sopris Health — это интеллектуальная клиническая платформа, использующая "умную" систему расшифровки голоса на базе AI. Suki - цифровой виртуальный ассистент для врачей, который позволяет снизить нагрузку, связанную с заполнением медицинской документации.
При этом используются обработка естественной речи для ее преобразования в текст и наоборот. Кроме того, есть решения, которые отслеживают развитие болезни со временем, используя речевые данные. Ava предназначена для глухих и слабослышащих людей, показывая им кто и что говорит. VocaliD использует голосовой банк и технологии обработки голоса, позволяющие создать уникальные голоса, персонализирующие любые устройства, которые преобразуют текст в голос. Voiceitt - разрабатывает первую в мире технологию распознавания голоса, предназначенную для понимания нестандартной речи. Платформы для разработчиков Эти компании создают программные решения для тех, кто хочет разрабатывать и публиковать голосовые приложения, особенно если они предназначены для нескольких аппаратных платформ например, Amazon Alexa и Google Home.
Запустить простейшего бота можно бесплатно, и вот он уже автоматизирует общение с клиентом, а добавив пару долларов, можно подключить к нему пользовательские сценарии и искусственный интеллект. Использование ИИ приносит пользу, отмечает Любименко, если технология внедрена правильно, обдуманно, в балансе с потребностями клиентов и бизнес-процессами компании.
Усманов добавляет, что из слабых сторон также можно выделить безопасность.
К классическому боту «прикручивается» две технологии: синтеза голоса и распознавания речи. Хорошо обученные модели позволяют голосовому ассистенту поддерживать разговор с пользователем. Например, клиент спрашивает что-то, одна нейронная сеть переводит голос в текст, другая анализирует его и ищет ответ в базе знаний. Если ответа нет, то она просит уточнить запрос. При этом к 2025 г. Совокупный среднегодовой темп роста этого рынка в 2021—2025 гг. Экономная экономика Применение чат-ботов и их более продвинутых версий — голосовых помощников снижает нагрузку на контактные центры, увеличивает охват маркетинговых компаний, повышает удовлетворенность качеством сервиса.
Для большой организации совокупный экономический эффект от применения ботов может составлять сотни миллионов рублей, для очень больших речь идет о миллиардах, считает руководитель управления развития диалоговых систем в Альфа-банке Станислав Милых. При этом боты позволяют сохранить тот же количественный состав персонала колл-центров при растущем количестве запросов.
Одной из самых популярных для Android считается Алиса. Функциональные возможности В этом случае много зависит от личных предпочтений пользователя. Одна система может лучше справляться с поиском информация, другая — облегчает управление компьютером или смартфоном. Есть даже помощники, выступающие в качестве продвинутой навигационной системы для облегчения путешествий. Однако лучше отдавать предпочтение универсальным ассистентам, которые обладают широким набором дополнительных функций.
Голосовые помощники
Приятно познакомиться, Ева, Олег, Маша, Салют, Алиса! Протестировали голосовых помощников | Наш список голосовых ассистентов поможет вам выбрать наиболее подходящего, чтобы он стал вашим надежным помощником в повседневных задачах. |
Обновлён рейтинг голосовых помощников | Использование голосового ассистента помогает сократить задержки, паузы в диалоге с клиентом, время ожидания при пиковых нагрузках и массовых инцидентах. |
Сегмент голосовых помощников к 2024 году вырастет на 769%
Голосовой помощник – это программное обеспечение, которое позволяет пользователям взаимодействовать с устройствами с помощью голосовых команд. Рассказываем, каких голосовых ассистентов чаще всего используют россияне, в каких случаях просят их помочь и почему некоторые обходят стороной эту технологию. Команда LinDeal исследовала известных голосовых помощников и составила свой топ-20 для Android и iOS, честно расписав все плюсы и минусы. Алиса, первый российский голосовой помощник, предназначенный для массового использования, появилась в 2017 году.
Ожидается трехкратный рост использования цифровых голосовых помощников
10 главных умных помощников в 2022 году | Темпы роста рынка голосовых помощников, по оценке Group, превышают темпы роста IT-рынка в целом: голосовые ассистенты стали неоспоримым трендом, который продолжает набирать обороты. |
Что умеет голосовой помощник Алиса | С голосовым ассистентом можно поболтать, о чём хотите — о погоде, кино или текущих делах. |
ВЦИОМ: более 60% опрошенных россиян пользуются голосовыми сообщениями | При этом время задержки Siri и голосового помощника Bixby от Samsung больше, чем у Assistant и Alexa. |
Банки визуализируют голосовых помощников | Кроме того, внедрены персональные медицинские помощники — устройства для непрерывного контроля состояния пациентов. |
Маруся голосовой помощник команды для колонки Капсула | В то же время современные ученые утверждают, что языковые модели ИИ, на которых основаны голосовые помощники, не столько понимают нас, сколько имитируют это понимание. |
10 главных умных помощников в 2022 году
Рейтинг построен по количеству упоминаний голосовых помощников в русскоязычном сегменте соцмедиа. Лучшие голосовые помощники: 4 ассистента с поддержкой русского языка. Это один из первых российских голосовых помощников — его запустили в 2018 году. В процессе голосовому ассистенту можно задавать вопросы и просить его о помощи, если что‑то не получается отправить.
29 регионов России используют голосовых помощников в сфере здравоохранения
Выбираем самого умного голосового помощника в 2023 году. Алиса, Сбер Салют и Google Assistant стали самыми обсуждаемыми голосовыми помощниками по версии «Медиалогии». Сколько стоит создание ассистента и что для этого нужно уметь. Пока разработку собственных голосовых помощников могут позволить себе крупные компании. Голосовые помощники сегодня — Голосовой робот «Мегафона» поможет пассажирам NordStar не опоздать на рейс.
Некоторыми госуслугами стало возможно пользоваться с помощью голосового помощника
Банки визуализируют голосовых помощников | АиФ Новосибирск | Первым в привычном понимании голосовым помощником стала Siri от Apple, которая появилась в iPhone 4S в 2011 году. |
Сколько стоит работа голосового помощника в России | Голосовыми помощниками пользовались 63% россиян за последние полгода, – выяснили исследователи из Group4media. |
Кто такая Алиса от Яндекса, обзор возможностей и функций голосового помощника Алиса | Голосовые помощники сегодня — Голосовой робот «Мегафона» поможет пассажирам NordStar не опоздать на рейс. |
Кто такая Алиса от Яндекса, обзор возможностей и функций голосового помощника Алиса | неправильного произношения и рекомендации:Использование голосовых помощников может значительно упростить повседневные задачи, такие как поиск информации, управление устройствами, покупки и другие. |
Как развивались сервисы голосовых помощников и какие технологии в них используются | Голосовые ассистенты незаметно входят в нашу обыденную жизнь, что подтверждает исследование Google: помощником пользуются более чем один раз в день 41% взрослых и 55% подростков. |
29 регионов России используют голосовых помощников в сфере здравоохранения
Кроме того, маркетинговые голосовые ассистенты, которые производят обзвон потенциальных клиентов, генерируют компаниям дополнительную прибыль. В будущем отличить голосового ассистента от живого человека станет почти невозможно, считают специалисты. Каковы перспективы Исследование Group4media , опубликованное в октябре 2022 г. Исследование проводилось с января по сентябрь 2022 г. В опросе приняли участие жители российских городов с населением от 100 000 в возрасте от 14 лет. Виртуальные голосовые помощники — это развитие технологии чат-ботов на основе ИИ.
К классическому боту «прикручивается» две технологии: синтеза голоса и распознавания речи. Хорошо обученные модели позволяют голосовому ассистенту поддерживать разговор с пользователем. Например, клиент спрашивает что-то, одна нейронная сеть переводит голос в текст, другая анализирует его и ищет ответ в базе знаний.
К сожалению, формализовать естественный язык не так-то просто, поэтому любые диалоги с голосовым помощником или программой в сети не являются очень глубокими. Так, любой разговор можно описать в парадигме вопрос-ответ, когда каждая пара образует один уровень, большинство программ обработки диалогов сегодня ведут более-менее осмысленный разговор для 2-3 уровней, затем они начинают пасовать, и тогда появляется продуманная программистами заглушка, например, у Siri это шутки, которые должны скрыть незнание программой того, как действовать дальше. Пользовательские сценарии условно можно разделить на простейшие, те, что не зависят от страны и языка, и сложные. То есть, это предопределенные действия, реализация которых в устройстве или программе не вызывает никаких затруднений. В простых сценариях важно, чтобы система распознавания речи правильно распознала контекст и то, является запрос утверждением или вопросом.
Например, одна и та же фраза может восприниматься системой различно: «Будильник на 8 часов стоит или нет? Многие системы первоначально просто ставили будильник на это время, не проверяя, есть он уже или нет. Теперь они «научились» проверять состояние будильника и правильно отвечать на этот вопрос. Сложные сценарии напрямую привязаны к контексту языка и страны. Например, спрашивая, что сегодня идет в кино, вы не ждете, что голосовой помощник зачитает вам список фильмов в Нью-Йорке, наверное, вы хотите услышать его для своего города и желательно для своего района или любимого кинотеатра. Локальный контекст становится архиважным, и глобальные компании зачастую не могут сделать ничего в этой области. Исключением является Google, у которого системы Google Now и Google Maps построены вокруг сбора точек интереса, или POI, то есть «изучают» мир, отзывы о тех или иных заведениях. В Amazon этой информации нет, поэтому сценарии подразумевают не только алгоритм действий, но им нужна и первоначальная информация.
В России дочерняя компания i-Free под названием Just AI с 2011 года создает такую платформу, то есть они пытаются создавать сценарии, применимые для российского рынка. Первым продуктом, в котором на массовом рынке применяются сценарии, созданные компанией, стал робот Pudding в нашем варианте «Емеля» , он умеет разговаривать на русском языке, искать определенный контент и защищать детей от нежелательных слов и запросов. Назвать «Емелю» роботом сложно, это самый настоящий голосовой помощник, ориентированный на детей в возрасте от 5 до 11 лет, при этом он не является игрушкой. Со стороны компании Just AI в этом голосовом помощнике сценарии и распознавание русской речи движок от Nuance. В теории, если ребенок начнет интересоваться самоубийством или подобными темами, такой «робот» может отговорить его и отправить экстренное сообщение родителям — это те самые сценарии, которые нужно разработать и добавить их в устройство. Другой пример, дети часто хотят, чтобы им рассказали сказку, выбор сказок огромен, и возникает вопрос, на какой остановиться. В таких голосовых помощниках будет выбор приоритетных произведений, известных как детям, так и родителям. То есть, если вы не знаете, что именно хотите услышать, то говорите: «Хочу сказку».
А уже сам помощник выбирает, какую именно сказку вы услышите. Насколько умным будет ваш голосовой помощник, напрямую зависит от того, насколько он понимает контекст беседы, знает ваш образ жизни например, где вы работаете и адрес офиса, ваш распорядок дня. Понятно, что в этой гонке преимущество за Google, так как в рамках Ассистента компания знает про вас так много, что может построить разумные сценарии и подсказки, которые будут уместны и важны. Другие компании в этом направлении пока являются отстающими, но пытаются быстро развиваться. Умение обработать запрос, правильно выделить его контекст и найти релевантный ответ для голосовых помощников становится важнейшим свойством. Те компании, что научились выпускать голосовых помощников в Китае а таких уже десятки , не могут быстро и легко локализовать продукт для России или других стран, им нужны сценарии, которых у них нет. Им нужно понимание локального контекста, а оно не может появиться из ниоткуда. И на этом пути выигрывают компании, которые уже начинают собирать такие данные всеми возможными способами.
Мне это чем-то напоминает золотую лихорадку в картографии, когда в первые годы развития карт на мобильных устройствах все бились за максимальное и точное наполнение по POI, так как карта без расшифровки названий компаний и магазинов, времени их работы и тому подобного — это почти бесполезный рисунок. Обратите внимание, что есть еще один важный момент для домашних голосовых помощников, это наличие контента, например, музыки. Одно дело, когда у вас уже есть подписка на какой-то музыкальный сервис и вы слушаете и ищете музыку в нем. Другое дело, если вы ищете что-то, чего там нет, тут на первый план выходит легальность воспроизведения и то, насколько большая библиотека доступна вашему помощнику, может ли он получить этот контент бесплатно или он должен его купить. Это интересный вопрос, но на нем мы останавливаться не будем. Из текста в голос — обратное преобразование Самые сложные операции позади, голос распознали, запрос обработали, помощник получил ответ в виде текста, и тут самое время его озвучить. К сожалению, системы преобразования текста в речь не так уж идеальны, и в них с легкостью можно узнать робота. Понятно, что в ближайшие 5-6 лет этот момент кардинально изменится, но сегодня многие преобразователи напоминают робота Вертера из советского фантастического фильма, говорят они нечисто, немного заикаются.
К сожалению, этот момент просто требует времени и изменения технологий, крупные производители получат преобразователи текста в голос со сносными характеристиками быстрее, чем небольшие компании. Посмотрите в ролике, как общается «Емеля», чтобы скрыть недостатки TTS-движка, тут даже придумали историю, что это робот с другой планеты и поэтому он говорит именно так. Понятно, что этот «робот» не звучит чисто, у Google Home или Amazon язык лучше, но нет поддержки русского у Google Home она появится в 2018 году, осенью, если судить по текущим планам компании. Отсутствие в России голосовых помощников объясняется просто — чтобы адаптировать китайские устройства, нужно обладать как модулями конвертации речи в текст и обратно, так и неким подобием AI, который обрабатывает сценарии и имеет некий контент на борту. В этом аспекте тот же «Емеля», или Roobo Pudding — первый пробный шар, который интересен с точки зрения технологий, как продукт для конечного потребителя он интересен в меньшей мере. Впрочем, об этом мы поговорим в обзоре, где устроим для него подробнейшие испытания всех возможностей.
Прототип будущего помощника был представлен на стенде форума. Когда пользователь обращается к умной колонке, чтобы запустить чат с банком, как это происходит в случае запуска голосового банковского помощника, на экране появляется визуальный образ. Общение происходит в режиме реального времени: Тамара реагирует на вопросы, а ее речь синхронизирована с изображением на экране — движением губ и мимикой. Визуальный образ Тамары был создан нейросетью, совместившей портреты 50 выдающихся женщин, которые в разное время внесли значимый вклад в развитие ИТ-сферы. Мы постоянно работаем над развитием голосового, а теперь и визуального консультанта.
А вот последнее на этот раз досталось Amazon Alexa. Сравнивались реализации голосовых помощников на смартфонах. Согласно тесту, Siri и Google Assistant конкурентоспособны, когда дело доходит до скорости. При этом время задержки Siri и голосового помощника Bixby от Samsung больше, чем у Assistant и Alexa.