Утреннее шоу Алисы теперь можно настроить на свой вкус, указав тематику новостей и подкастов. Что сказать: «Алиса, запусти утреннее шоу», «Алиса, включи утреннее шоу». Эти программы помогают узнать нужную информацию в начале дня или рассказать о том, что вы могли пропустить. «Мы хотим, чтобы Алиса была не только помощником, но и другом, с которым приятно проводить время. Поэтому мы учим её следить за новостями, развлекать пользователей и создавать приятную атмосферу в доме, и утреннее шоу — первый шаг в этом направлении».
Как взглянуть на «Алису» по-новому? 5 необычных навыков для «Яндекс.Станции»
Навигатор , Лончер и в мобильную и десктопную версии Яндекс. Браузера [2]. Общение с ассистентом возможно голосом и вводом запросов с клавиатуры. Алиса отвечает или прямо в диалоговом интерфейсе, либо же показывает поисковую выдачу по запросу или нужное приложение.
Анализ запроса и формирование ответа Распознать голосовой запрос Алисе помогает технология SpeechKit. На этом этапе происходит отделение голоса от фоновых шумов. Разобраться с акцентами, диалектами, сленгами и англицизмами алгоритмам позволяет накопленная Яндексом база из миллиарда произнесённых в разных условиях фраз [11] [12].
На следующем этапе наделить запрос смыслом и подобрать правильный ответ позволяет технология Turing, своим названием отсылающая к Алану Тьюрингу и его тесту. Благодаря ей «Алиса» может не только давать ответы на конкретные вопросы, но и общаться с пользователем на отвлечённые темы. Для этого текст запроса дробится на токены, как правило, это отдельные слова, которые в дальнейшем отдельно анализируются.
Для максимально точного ответа Алиса учитывает историю взаимодействия с ней, интонацию запроса, предыдущие фразы и геопозицию. Это объясняет тот факт, что на один вопрос разные пользователи могут получить разные ответы [11] [12]. Первоначально нейросеть Алисы обучали на массиве текстов из классики русской литературы , включая произведения Льва Толстого , Фёдора Достоевского , Николая Гоголя , а затем — на массивах живых текстов из Интернета [13].
Как рассказывал глава управления машинного обучения Яндекса Михаил Биленко в интервью изданию Meduza , в ходе ранних тестов в манере общения Алисы появилась дерзость, которая удивляла и забавляла пользователей. Чтобы дерзость не перешла в хамство и чтобы ограничить рассуждения Алисы на темы, связанные с насилием, ненавистью или политикой, в голосового помощника была внедрена система фильтров и стоп-слов [14]. Последний этап — озвучивание ответа — реализуется с помощью технологии Text-to-speech.
Основой служат записанные в студии 260 тысяч слов и фраз, которые затем были «порезаны» на фонемы. Из этой аудиобазы нейросеть собирает ответ, после чего интонационные перепады в готовой фразе сглаживаются нейросетью, что приближает речь «Алисы» к человеческой [11] [12] [15]. Навыки Помимо сервисов Яндекса, в Алису могут быть интегрированы сторонние сервисы.
В 2018 году компания расширила возможности Алисы через систему навыков, использующих платформу голосового помощника для взаимодействия с пользователем. Навыки — это чат-боты и другие интернет-сервисы, активирующиеся по ключевой фразе и работающие в интерфейсе «Алисы». В марте 2018 Яндекс открыл для сторонних разработчиков платформу Яндекс.
Диалоги , предназначенную для публикации новых навыков и их подключения к Алисе. Уже к апрелю 2018 года на платформе Яндекс. Диалогов были опубликованы более 3 тысяч навыков, более 100 прошли модерацию [17].
А как продолжить. Роутер переключил канал и Алиса молчит. Сказал продолжить - в момент отключения играла музыка, Алиса начала играть просто музыку. С начала слушать не интересно. Алексей Киваков.
Если вы хотите послушать текст статьи — скажите «Подробнее». Хотите начать заново — скажите "Меню". Возникли проблемы? Следите за событиями Севастополя в режиме онлайн. Происшествия, новости культуры, спорта, политики и экономики Лента новостей Благовещенска Лента новостей Благовещенска — последние новости Благовещенска оперативно.
Но сейчас, прежде чем начать читать текст, Алиса ещё и оповестит получателя, из какой именно комнаты или Дома пришло сообщение. Звонки без постороннего шума Улучшилось шумоподавление внешних шумов во время звонка. Сейчас функция доступна на Станции Миди, Станции Макс и Станции 2, поддержка других моделей появится позже. Обновление уже доступно пользователям Станций с сегодняшнего дня. Розыгрыш в нашем Телеграм-канале!
Шёпот и эмоции в Алисе: история развития голосового синтеза Яндекса
Утреннее шоу от Алисы на Яндекс Станции | Алиса с каждым днем становится лучше, и теперь у нее появилось собственное утреннее шоу! Каждое утро вас ждет коктейль из рассказа о погоде, персональной подборки новостей, выпуска классного подкаста и, специально подобранных под вас треков с комментариями Алисы! |
«Алиса» научилась вести утренние шоу | Больше настроек для моего Утреннего шоу: выбирайте комфортный порядок из подкастов на интересные темы, прогноза погоды, рассказа о навыках, музыки и новостей из выбранных источников. Запущу, как обычно, по фразе: «Алиса, доброе утро!» Радионяню смогут. |
Вышло большое обновление Алисы. Смотри, что теперь умеет твоя Яндекс Станция
«Алиса, включи шоу» — для начала воспроизведения выбранного видео. Для настройки новостей на Яндекс Алисе необходимо открыть раздел «Интеграция» в настройках приложения. «Алиса» научилась персонализировать «Утреннее шоу» и включать новости радиостанций. К слову, Алиса теперь умеет вести "утренние шоу". Теперь пользователи могут добавить новости в Утреннее шоу Алисы. Для этого достаточно открыть приложение Яндекс и сказать: «Алиса, открой настройки шоу» или «Алиса, открой настройки новостей».
Слушать утреннее и вечернее шоу Алисы на Станции
Поэтому мы учим её следить за новостями, развлекать пользователей и создавать приятную атмосферу в доме, и утреннее шоу — первый шаг в этом направлении. А для тех, кто сидит на самоизоляции, голосовой помощник даёт советы о том, как провести время с пользой. Работает это примерно так: сначала Алиса рассказывает сводку погоды, потом переходит к самым актуальным новостям, перемешивая их с музыкой. И иногда добавляет к ним подкасты.
Сусанна Альперина Еще до того, как настали времена карантина и самоизоляции, некоторые люди привыкли разговаривать с голосовой системой Алиса как с добрым другом. Она - и советчик, и исполнитель желаний, и информатор... Сейчас же в умных колонках с Алисой появилось ее персональное утреннее шоу. Люди могут слушать полезную информацию, музыку и интересные истории, подобранные специально для них. Чтобы запустить программу, достаточно сказать: "Алиса, включи утреннее шоу!
Также "Яндекс" обучил своего голосового помощника ориентироваться в происходящем и говорить о том, что волнует людей. Например, сейчас в паузах между новостями и песнями "Алиса" рассказывает, как с пользой и удовольствием провести время дома. Поэтому мы учим её следить за новостями, развлекать пользователей и создавать приятную атмосферу в доме, и утреннее шоу - первый шаг в этом направлении", - отметил руководитель продукта Андрей Законов. Утреннее шоу доступно в "Яндекс.
Кроме того, в голосовом помощнике появились новости радиостанций. Утреннее шоу — это развлекательная программа, где «Алиса» выступает в роли ведущей. Она читает новости, ставит людям музыку и развлекает историями на разные темы — почти как настоящий диджей. Чтобы она включала наиболее подходящий контент, нужно указать свои предпочтения в настройках. Сейчас в голосовом помощнике доступны 11 новостных тематик и 21 рубрика для подкастов.
8 новых фишек «Яндекс Станций» и «Яндекс ТВ Станций», которые появились в апреле
Читает ли Алиса последние новости? Необходимые настройки | Яндекс Станция включает Шоу Алисы (погода, новости, музыка и т.п.). Об этом я рассказываю ниже. Для утреннего сценария использую автоматизацию охлаждения кухни кондиционером. |
Утреннее шоу Алисы стало персональным 😎 | Шоу и новости доступны в «и», «Станции Мини» и других умных колонках, где есть голосовой помощник «Алиса». |
«Яндекс» научил «Алису» вести персональное утреннее шоу | Пользователи умных колонок с голосовым помощником «Алиса» теперь могут послушать новости технологий от портала Утреннее шоу. |
Как взглянуть на «Алису» по-новому? 5 необычных навыков для «Яндекс.Станции» | MAXIM | Оказалось, что люди выбирают синтезированный вариант Алисы, несмотря на более плохое качество по сравнению с реальной речью человека. |
Утреннее шоу Алисы стало персональным 😎 | Обновление Алисы также включает в себя улучшенное утреннее шоу: теперь там не только новости и музыка, но и короткие подкасты, даты в истории, мудрости и комплименты. |
Умные колонки с "Алисой" научились вести персонализированные утренние шоу
На колонках с Алисой появилась функция Утреннего шоу | Пользователи умных колонок с голосовым помощником «Алиса» теперь могут послушать новости технологий от портала Утреннее шоу. |
Новый формат контента в утреннем шоу Алисы: истории от навыков | Теперь навыки смогут отправлять короткий регулярный контент в утреннее шоу Алисы. |
Утреннее шоу Алисы теперь можно настроить на свой вкус | «Алиса» научилась персонализировать «Утреннее шоу» и включать новости радиостанций. |
Утреннее шоу Алисы стало персональным 😎 | Помимо чтения актуальных новостей по утрам, «Алиса» также научилась отслеживать эфиры радиостанций. Утренние шоу впервые появились в апреле этого года. |
Голосовой помощник Алиса начала вести свое утреннее шоу
Помимо чтения актуальных новостей по утрам, «Алиса» также научилась отслеживать эфиры радиостанций. Теперь голосовой помощник может запускать новостные блоки с девяти станций, включая «Хит ФМ» и «Коммерсантъ FM». Утренние шоу впервые появились в апреле этого года. «Алиса» научилась персонализировать «Утреннее шоу». Настройка частоты получения новостей позволит вам сделать использование навыка Алисы более удобным и эффективным, подстроив его под ваш ритм жизни. Обновление Алисы также включает в себя улучшенное утреннее шоу: теперь там не только новости и музыка, но и короткие подкасты, даты в истории, мудрости и комплименты. Команды и сценарии для Алисы: покоряем умного помощника. Поэтому мы учим её следить за новостями, развлекать пользователей и создавать приятную атмосферу в доме, и утреннее шоу — первый шаг в этом направлении», — говорит руководитель продукта Андрей Законов.
Как взглянуть на «Алису» по-новому? 5 необычных навыков для «Яндекс.Станции»
«Алиса» научилась персонализировать «Утреннее шоу» и включать новости радиостанций. Особенностью Алисы стала личность, разработанная коллективом Яндекса вместе с журналистом и бывшим руководителем группы маркетинга компании Владимиром Гуриевым. Выбрать тематику новостей и подкастов можно в приложении «Яндекс», сказав «Алиса, открой настройки шоу» или «Алиса, открой настройки новостей». Обновление Алисы также включает в себя улучшенное утреннее шоу: теперь там не только новости и музыка, но и короткие подкасты, даты в истории, мудрости и комплименты. Добавьте в голосовой помощник Алису от Яндекса новые навыки на тему — Новости. так назвали программу, при которой Алиса будет ставить различные треки из плейлиста пользователя на , дополняя их различными комментариями во время пауз, а также сообщая новости на интересующую.
Читает ли Алиса последние новости? Настраиваем её на телефоне и на компьютере
Например, «Включить камеру, если на датчик движения поступил сигнал». По звукуСценарий запускается, если система распознает определенный звук. Например, «Включить музыку, если в доме слышен плач ребенка». Ранее мы рассказывали: Как усилить Wi-Fi сигнал в квартире или доме? Примеры интересных сценариев для голосового помощника Алисы Интересные сценарии для Алисы могут быть разными. Важно, чтобы у пользователя были необходимые приборы, которые могут быть задействованы в выполнении сценария. Вы не сможете настроить включение света в определенной комнате, если у вас не установлены лампы, которые подключены к системе умного дома. Вы также не сможете регулировать уровень освещения, если лампы не позволяют это делать.
Поэтому при настройке сценариев всегда обращайте внимание на приборы, которые у вас имеются. При создании сценария используйте простые и понятные выражения. Избегайте использования жаргона и сленга.
Афиша мероприятий и новости Анонсы интересных мероприятий будут отображаться на главном экране «Станции Дуо Макс». Чтобы узнать о предстоящем событии больше, надо нажать на кнопку «Подробнее», и «Алиса» покажет все детали во встроенном «Браузере». Радионяня для каждого в семье Теперь на «Яндекс Станции» можно включить режим радионяни и получать звуки из детской прямо на телефон. Для этого надо пригласить близких в свой «Дом» и указать, кто может включать режим радионяни. Но сейчас, прежде чем начать читать текст, «Алиса» ещё и оповестит их, из какой именно комнаты или «Дома» пришло сообщение.
Разработчик навыка сможет указать дату, до которой история актуальна. Длительность истории не должна превышать одной минуты. Чтобы подключить навык к утреннему шоу Алисы, оставьте заявку через форму: А теперь — подробнее о работе функциональности. Диалогов: он содержит состояния, поверхность запуска и другие важные параметры.
Ранее: Каждый раз поиски этого маленького пульта. Да и вставать не хочется, когда ты уже отдыхаешь. Сейчас: простой запуск голосом и настройка. Можно обучить УДЯ и другим кнопкам, но для себя оставил только важные. Сценарий: Старенький самсунг телевизор получил автоматизацию Ещё один из сценариев для использования Умного Пульта Яндекса. Ранее: приходилось ждать, когда телевизор запустится и заработает возможность зайти в лаунчер выбрать ютубчик. Сейчас: требуется только сказать голосом или зайти в УДЯ - телевизор кухонный включится и запустится ютуб! Сценарий: Время 11 часов ночи или время 7 часов утра Ранее: Яндекс станции неплохо определяют - когда вы говорите шепотом, и в ответ станция начинает отвечать шепотом. Но так срабатывает не всегда. Сейчас: Данный сценарий помогает разговаривать с ней спокойным голосом и не нужно каждую станцию отдельно настраивать на определенную тихую громкость. А ещё, в 11 часов ночи звуковое уведомление даёт понять, что уже нельзя шуметь. Графики и датчики климата Да, у меня в каждой комнате датчики климата. Простая автоматизация яркости телевизора Ещё один из сценариев для использования Умного Пульта Яндекса. Ранее: Приходилось вручную включать яркость для ночного режима. Сейчас: Простая автоматизация нажатия кнопок помогает быстро включить нужную яркость. Есть ещё сценарий для восстановления яркости. Сценарий: Время ночного просмотра телевизора Ранее: Включал телевизор через пульт. Бегал выключать свет, который не выключил. Сейчас: Одна автоматизация: голосовым запуском или через приложение. В ближайшее время докуплю ещё кнопку для запуска данного сценария — одно нажатие. Ещё можно найти эмбилайт ленту для вашего андроид тв. Сценарий: Время спать Ранее: Приходилось по отдельности выключать телевизор, светодиодную ленту, обесточить какие-то розетки и, конечно, выключить свет в спальне. В ближайшее время докуплю ещё кнопку для запуска данного сценария - долгое нажатие. УДЯ НЕ запоминает состояние телевизора. Можно и без умной розетки и wake on lan режима управлять. Тогда из этого моего сценария убрать телевизор. Сейчас: Возле входной двери установлена умная кнопка. После её зажатия происходит сценарий: выключается всё освещение, которое забывал выключить, выключается кондиционер, розетки обесточиваются если установлена умная розетка или умное реле на розетку. Сценарий: Помогаем кондиционеру не работать просто так Ранее: я забывал выключить кондиционер, когда открывалась дверь на балконе. Сейчас: Я также забываю выключать кондиционер, когда выхожу на балкон. С данным сценарием кондиционер отключается автоматически. Список покупок Ранее: На моём телефоне установлено приложение Tick-Tick, это простая гибка тудушка. Через неё создавал список покупок. Но таким голосовым управлением добавляется по одной задаче. Сейчас: В каждой комнате установлен Яндекс со своими мини станциями и создавать списки покупок голосом стало удобно. Например, Вы принимаете душ или делая дела по дому обнаружили отсутствие зубной пасты. Голосовой фразой "Алиса, добавь зубную пасту в список покупок" - зубная паста добавляется в общий список покупок. Не забывайте пуши использовать для других сценариев. Если влажность в доме повысилась, открылась дверь или что-то ещё. Сценарий: После работы направляемся домой Наконец-то можно подготовить квартиру к вашему приходу светодиодной гирлянды на балконе у меня нет.
Слушать утреннее и вечернее шоу Алисы на Станции
Чтобы настроить «Новости колонка Алиса», вам нужно открыть мобильное приложение или сайт Яндекс. «Утреннее шоу» и новости радиостанций доступны во всех умных колонках с поддержкой «Алисы». Умные колонки с голосовым помощником "Алиса" научились проводить утренние шоу, которые подбираются под конкретных пользователей. Чтобы выбрать тематику новостей и подкастов, нужно просто открыть приложение Яндекс и сказать: «Алиса, открой настройки шоу» или «Алиса, открой настройки новостей».
Что умеет «Яндекс-станция»: 17 полезных функций и команд для Алисы
И иногда добавляет к ним подкасты. Звучит живо и увлекательно. Интереснее, чем на многих новостных ТВ-каналах. Для запуска функции достаточно сказать «Алиса, включи утреннее шоу».
Возможно, вам пригодится, особенно если вы интересуетесь, как отключить Дзен: Как вернуть Яндекс и убрать Дзен с главной страницы. А мы теперь посмотрим, как Алиса показывает новости из предварительно выбранных источников. Как Алиса отображает последние новости После того как мы дадим команду «новости», Алиса выдаст заголовки из тех источников, которые мы отобрали. Вот так это будет выглядеть на панели Яндекс.
Браузера: Если вы включаете ленту новостей в телефоне, то отображение будет примерно таким: Удобно, что новости выдаёт списком, и мы можем кликнуть на заинтересовавший нас заголовок, чтобы почитать подробности. В одной из статей я рассказывал, как настроить и включить Яндекс. Новости после 12 сентября 2022 года, когда они перестали отображаться на главной Яндекса и переехали на отдельный домен dzen.
Отличное решение для караоке-вечеринки. Что ещё появилось на ТВ Станциях? Управлять можно голосом: поставить на паузу, продолжить, перемотать назад, выбрать качество или включить субтитры.
Браузер и в нём была включена синхронизация. Возможно, вам пригодится, особенно если вы интересуетесь, как отключить Дзен: Как вернуть Яндекс и убрать Дзен с главной страницы. А мы теперь посмотрим, как Алиса показывает новости из предварительно выбранных источников.
Как Алиса отображает последние новости После того как мы дадим команду «новости», Алиса выдаст заголовки из тех источников, которые мы отобрали. Вот так это будет выглядеть на панели Яндекс. Браузера: Если вы включаете ленту новостей в телефоне, то отображение будет примерно таким: Удобно, что новости выдаёт списком, и мы можем кликнуть на заинтересовавший нас заголовок, чтобы почитать подробности. В одной из статей я рассказывал, как настроить и включить Яндекс.
Вышло апрельское обновление Алисы и умных устройств Яндекса
Шоу и новости доступны в «и», «Станции Мини» и других умных колонках, где есть голосовой помощник «Алиса». Виртуальный ассистент Алиса поставит утреннее шоу: слушайте музыку, новости, подкасты и настраивайтесь на день. Настройте Утреннее шоу для себя: выберите источники новостей, подкасты и даже гороскоп Зайдите в приложение Яндекс и выберите «Устройства»; Нажмите на вкладку «Настройки»; Выберите «Шоу Алисы».
Товары из материала
- Новости — подборка навыков Алисы, голосового помощника от Яндекса.
- Тексты песен любимых исполнителей на «ТВ Станциях»
- Что такое сценарии и чем они отличаются от команд?
- Утреннее шоу Алисы стало персональным 😎
Что нового в апреле у Алисы и умных устройств
Новости, нужно открывать отдельный сайт, потому что на главной ya. Более того, никакого виджета для браузеров разработчики VK пока не предусмотрели. И тогда возникает вопрос: «Читает ли Алиса последние новости так, как она это делала раньше? Да, здесь она может прийти на помощь, и это будет гораздо удобнее, чем открывать Дзен и читать новости там. Только нужно предварительно выполнить некоторые манипуляции. Все объяснения буду сопровождать скриншотами, которые сделал и с телефона, и с ноутбука. Как настроить новости в Алисе Можно дать ей обычную команду «Алиса, настрой новости».
Для решения этой задачи исследователи предложили механизм внимания — идея в том, чтобы рассмотреть всё предложение разом, но сфокусироваться через softmax-слой на небольшом числе «важных» токенов. При генерации каждого нового выходного токена нейросеть смотрит на обработанные токены фонемы для речевого синтеза или символы языка для перевода входа и «решает», насколько каждый из них важен на этом шаге. Оценив важность, сеть учитывает её при агрегировании результатов и получает информацию для генерации очередного токена выхода. Таким образом нейросеть может заглянуть в любой элемент входа на любом шаге и при этом не перегружается информацией, поскольку фокусируется на небольшом количестве входных токенов. Для синтеза важна подобная глобальность, так как интонация сама по себе глобальна и нужно «видеть» всё предложение, чтобы правильно его проинтонировать. На тот момент для синтеза была хорошая seq2seq-архитектура Tacotron 2 — она и легла в основу нашей акустической модели. Мел-спектрограмма Параметрическое пространство можно сжать разными способами. Более сжатые представления лучше работают с примитивными акустическими моделями и вокодерами — там меньше возможностей для ошибок. Более полные представления позволяют лучше восстановить wav, но их генерация — сложная задача для акустической модели. Кроме того, восстановление из таких представлений у детерминированных вокодеров не очень качественное из-за их нестабильности. С появлением нейросетевых вокодеров сложность промежуточного пространства стала расти и сейчас в индустрии одним из стандартов стала мел-спектрограмма. Она отличается от обычного распределения частоты звука по времени тем, что частоты переводятся в особую мел-частоту звука. Другими словами, мел-спектрограмма — это спектрограмма, в которой частота звука выражена в мелах , а не герцах. Мелы пришли из музыкальной акустики, а их название — это просто сокращение слова «мелодия». Строение улитки уха из Википедии Эта шкала не линейная и основана на том, что человеческое ухо по-разному воспринимает звук различной частоты. Вспомните строение улитки в ухе: это просто канал, закрученный по спирали. Высокочастотный звук не может «повернуть» по спирали, поэтому воспринимается достаточно короткой частью слуховых рецепторов. Низкочастотный же звук проходит вглубь. Поэтому люди хорошо различают низкочастотные звуки, но высокочастотные сливаются. Мел-спектрограмма как раз позволяет представить звук, акцентируясь на той части спектра, которая значимо различается слухом. Это полезно, потому что мы генерируем звук именно для человека, а не для машины. Вот как выглядит мел-спектрограмма синтеза текста «Я — Алиса»: У мел-спектрограммы по одному измерению [X на рисунке выше] — время, по другому [Y] — частота, а значение [яркость на рисунке] — мощность сигнала на заданной частоте в определенный момент времени. Проще говоря, эта штуковина показывает, какое распределение по мощностям было у различных частот звука в конкретный момент. Мел-спектрограмма непрерывна, то есть с ней можно работать как с изображением. А так звучит результат синтеза: 3. Новый вокодер Вероятно, вы уже догадались, что мы перешли к использованию нового нейросетевого вокодера. Именно он в реальном времени превращает мел-спектрограмму в голос. Наиболее близкий аналог нашего первого решения на основе нейросетей, которое вышло в 2018 году — модель WaveGlow. Архитектура WaveGlow основана на генеративных потоках — довольно изящном методе создания генеративных сетей, впервые предложенном в статье про генерацию лиц. Сеть обучается конвертировать случайный шум и мел-спектрограмму на входе в осмысленный wav-сэмпл. За счёт случайного шума на входе обеспечивается выбор случайной wav-ки — одной из множества соответствующих мел-спектрограмме. Как я объяснил выше, в домене речи такой случайный выбор будет лучше детерминированного среднего по всем возможным wav-кам. В отличие от WaveNet, WaveGlow не авторегрессионен, то есть не требует для генерации нового wav-сэмпла знания предыдущих. Его параллельная свёрточная архитектура хорошо ложится на вычислительную модель видеокарты, позволяя за одну секунду работы генерировать несколько сотен секунд звука. Главное отличие, за счёт которого HiFi-GAN обеспечивает гораздо лучшее качество, заключается в наборе подсетей-дискриминаторов. Они валидируют натуральность звука, смотря на сэмплы с различными периодами и на различном масштабе. Как и WaveGlow, HiFi-GAN не имеет авторегрессионной зависимости и хорошо параллелится, при этом новая сеть намного легковеснее, что позволило при реализации ещё больше повысить скорость синтеза. Кроме того, оказалось, что HiFi-GAN лучше работает на экспрессивной речи, что в дальнейшем позволило запустить эмоциональный синтез — об этом подробно расскажу чуть позже. Схема HiFi-GAN из статьи авторов модели Комбинация этих трёх компонентов позволила вернуться к параметрическому синтезу голоса, который звучал плавно и качественно, требовал меньше данных и давал больше возможностей в кастомизации и изменении стиля голоса. Параллельно мы работали над улучшением отдельных элементов синтеза: Летом 2019 года выкатили разрешатор омографов homograph resolver — он научил Алису правильно ставить ударения в парах «зАмок» и «замОк», «белкИ» и «бЕлки» и так далее. Здесь мы нашли остроумное решение. В русском языке эти слова пишутся одинаково, но в английском написание отличается, например, castle и lock, proteins и squirrels. Из этого представления легко выделить информацию о том, как произносить омограф, ведь перевод должен различать формы для корректного подбора английского варианта. Буквально на 20 примерах можно выучить классификатор для нового омографа, чтобы по эмбеддингу перевода понимать, какую форму нужно произнести. Летом 2020 года допилили паузер для расстановки пауз внутри предложения. Язык — хитрая штука. Не все знаки препинания в речи выражаются паузами Например, после вводного слова «конечно» на письме мы ставим запятую, но в речи обычно не делаем паузу. А там, где знаков препинания нет, мы часто делаем паузы. Если эту информацию не передавать в акустическую модель, то она пытается её выводить и не всегда успешно. Первая модель Алисы из-за этого могла начать вздыхать в случайных местах длинного предложения. Для этого мы взяли датасет, разметили его детектором активности голоса, сгруппировали паузы по длительности, ввели класс длины паузы, на каждое слово навесили тэг и на этом корпусе обучили ещё одну голову внимания из тех же нейросетевых эмбеддингов, что использовались для детекции омографов. Осенью 2020 года мы перевели на трансформеры нормализацию — в синтезе она нужна, чтобы решать сложные случаи, когда символы читаются не «буквально», а по неким правилам. Например, «101» нужно читать не как «один-ноль-один», а как «сто один», а в адресе yandex. Обычно нормализацию делают через комбинацию взвешенных трансдьюсеров FST — правила напоминают последовательность замен по регулярным выражениям, где выбирается замена, имеющая наибольший вес. Мы долго писали правила вручную, но это отнимало много сил, было очень сложно и не масштабируемо. Тогда решили перейти на трансформерную сеть, «задистиллировав» знания наших FST в нейронку. Теперь новые «правила раскрытия» можно добавлять через доливание синтетики и данных, размеченных пользователями Толоки, а сеть показывает лучшее качество, чем FST, потому что учитывает глобальный контекст.
А утреннее шоу — это такой формат, который позволяет собрать воедино то, что любишь. Несложные манипуляции с настройками — и человек получает именно то, что хочет. Думаю, новую возможность особенно оценят авторы подкастов, у которых появилась ещё одна площадка», — рассказал Андрей Законов, руководитель голосового помощника. Шоу и новости доступны в «Яндекс. Станции», «Станции Мини» и других умных колонках, где есть голосовой помощник «Алиса». Чтобы выбрать тематику новостей и подкастов, нужно просто открыть приложение Яндекс и сказать: «Алиса, открой настройки шоу» или «Алиса, открой настройки новостей».
Тексты песен любимых исполнителей на «ТВ Станциях» Когда играет трек, скажите: «Алиса, покажи текст песни», — и она выведет слова песни на экране «ТВ Станции». И теперь они могут устроить с их помощью караоке прямо у себя дома. Кнопка «Т» в музыкальном плеере даст понять, для каких треков доступен текст. Теперь там доступны «Матч Премьер» и «Матч! Ещё больше видео Любой контент, который найдётся в поиске по видео, сразу воспроизведется в удобном плеере «ТВ Станции».