Почему алиса не говорит голосом

Алиса
Тип виртуальный ассистент
Разработчик Яндекс
Написана на C++
Операционная система Microsoft Windows, Android , iOS и Linux
Первый выпуск 10 октября 2017
Сайт alice.yandex.ru
Медиафайлы на Викискладе

«Али́са» — виртуальный голосовой помощник, созданный компанией «Яндекс». Распознает естественную речь, имитирует живой диалог, даёт ответы на вопросы пользователя и, благодаря запрограммированным навыкам, решает прикладные задачи. «Алиса» работает на смартфонах, в том числе «Яндекс.Телефоне», в автомобилях и в Яндекс.Станции. По данным «Яндекса», ежедневная аудитория голосового помощника «Алисы» составляет 8 млн пользователей, а месячная аудитория «Алисы» по состоянию на январь 2019 года составила 30 млн человек [1] .

Содержание

История [ править | править код ]

Разработка «Алисы» началась в конце 2016 года, когда на IT-рынке сформировалось направление на развитие виртуальных ассистентов: на рынке уже были представлены Siri от Apple, Google Assistant, Amazon Alexa и Cortana от Microsoft (из них на русском языке работала только Siri). На тот момент «Яндекс» уже реализовал голосовое управление в «Поиске», «Навигаторе» и других приложениях и занялся созданием голосового помощника, способного взаимодействовать с человеком в режиме осмысленного диалога, — принципиально более сложной системы, использующей многослойную нейросеть [2] .

Тестирование «Алисы» началось весной 2017 года, а 21 сентября «Алису» представили Владимиру Путину в ходе посещения президентом «Яндекса» накануне 20-летнего юбилея компании. Во время непродолжительного диалога глава государства задал голосовому помощнику несколько вопросов, в том числе справился о её самочувствии. Об официальном запуске «Алисы» было объявлено 10 октября 2017 года: ассистент появился в поисковом приложении «Яндекса» для Andro >[2] [3] [4] .

В мае 2018 «Яндекс» опубликовал статистику, что «Алиса» установлена на 53 % смартфонов в России и доступна в навигаторе более чем в 20 млн автомобилей [5] .

Имя и личность [ править | править код ]

Особенностью «Алисы» стала личность, разработанная коллективом «Яндекса» вместе с журналистом и бывшим руководителем группы маркетинга компании Владимиром Гуриевым. Было решено, что голосовым ассистентом станет молодая ироничная девушка, готовая помочь владельцу смартфона [2] . Голосом «Алисы» стала актриса дубляжа Татьяна Шитова, озвучившая большинство героинь Скарлетт Йоханссон и голос операционной системы «OS1», назвавшей себя «Саманта», в российском дубляже фильма Спайка Джонза «Она» [6] [7] .

Выбор имени голосового помощника проходил в несколько этапов. Для начала был сформирован список требований: в имени не должно было быть буквы «эр», которую не выговаривают маленькие дети, также имя не должно было входить в расхожие фразы. По этой причине было «забраковано» имя «Майя», которое могло ошибочно распознаваться в сочетаниях вроде «девятое мая». Также, чтобы снизить количество ложных срабатываний, имя не должно было входить в число наиболее распространённых. Сперва сотрудники «Яндекса» составили список имён, которые, по их мнению, подходили голосовому помощнику по характеру. На основе этого списка был составлен опрос для пользователей «Яндекс.Толоки», участникам которого требовалось определить черты характера девушки по имени. В итоговом опросе с большим отрывом победило имя «Алиса». В тестировании имени, которое проходило в течение пяти месяцев, приняли участие несколько десятков тысяч человек. Для семей, в которых есть другие Алисы, голосовому ассистенту добавили опциональную активацию по команде «Слушай, Яндекс» [2] .

Технологии [ править | править код ]

«Алиса» встроена в разные приложения Яндекса: поисковое приложение, «Яндекс.Навигатор», Лончер и в мобильную и десктопную версии «Яндекс.Браузера» [2] .

Общение с ассистентом возможно голосом и вводом запросов с клавиатуры. «Алиса» отвечает или прямо в диалоговом интерфейсе, либо же показывает поисковую выдачу по запросу или нужное приложение. Кроме ответов на вопросы, «Алиса» умеет решать прикладные задачи: включить музыку, поставить будильник/таймер, вызвать такси или поиграть в игры [2] [8] .

Анализ запроса и формирование ответа [ править | править код ]

Распознать голосовой запрос «Алисе» помогает технология SpeechKit. На этом этапе происходит отделение голоса от фоновых шумов. Разобраться с акцентами, диалектами, сленгами и англицизмами алгоритмам позволяет накопленная «Яндексом» база из миллиарда произнесённых в разных условиях фраз [9] [10] .

Читайте также:  Яндекс поиск по картинке загрузить с телефона

На следующем этапе наделить запрос смыслом и подобрать правильный ответ позволяет технология Turing, своим названием отсылающая к Алану Тьюрингу и его тесту. Благодаря ей «Алиса» может не только давать ответы на конкретные вопросы, но и общаться с пользователем на отвлечённые темы. Для этого текст запроса дробится на токены, как правило это отдельные слова, которые в дальнейшем отдельно анализируются. Для максимально точного ответа «Алиса» учитывает историю взаимодействия с ней, интонацию запроса, предыдущие фразы и геопозицию. Это объясняет тот факт, что на один вопрос разные пользователи могут получить разные ответы [9] [10] .

Первоначально нейросеть «Алисы» обучали на массиве текстов из классики русской литературы, включая произведения Льва Толстого, Фёдора Достоевского, Николая Гоголя, а затем на массивах живых текстов из интернета [11] . Как рассказывал глава управления машинного обучения «Яндекса» Михаил Биленко в интервью изданию Meduza, в ходе ранних тестов в манере общения «Алисы» появилась дерзость, которая удивляла и забавляла пользователей. Чтобы дерзость не перешла в хамство, и чтобы ограничить рассуждения «Алисы» на темы, связанные с насилием, ненавистью или политикой, в голосового помощника была внедрена система фильтров и стоп-слов [12] .

Последний этап — озвучивание ответа — реализуется с помощью технологии Text-to-speech. Основой служат записанные в студии 260 тысяч слов и фраз, которые затем были «порезаны» на фонемы. Из этой аудиобазы нейросеть собирает ответ, после чего интонационные перепады в готовой фразе сглаживаются нейросетью, что приближает речь «Алисы» к человеческой [9] [10] [13] .

Навыки [ править | править код ]

Помимо сервисов Яндекса, в «Алису» могут быть интегрированы сторонние сервисы. В 2018 году компания расширила возможности «Алисы» через систему «навыков», использующих платформу голосового помощника для взаимодействия с пользователем. «Навыки» — это чат-боты и другие интернет-сервисы, активирующиеся по ключевой фразе и работающие в интерфейсе «Алисы». Первый «навык» был анонсирован «Яндексом» в феврале 2018 года: голосовой помощник научился заказывать пиццу в закусочной Papa John’s [4] .

В октябре 2017 года голосовой помощник "Алиса" совместно с сервисом "Flowwow" в закрытом режиме начал тестировать навык по доставке цветов. В мае 2018 года на конференции Яндекс, продукт стал доступен всем пользователям с возможностью оплаты доставки цветов внутри навыка.

В марте 2018 «Яндекс» открыл для сторонних разработчиков платформу «Яндекс. Диалоги», предназначенную для публикации новых «навыков» и их подключения к «Алисе». «Диалоги» также позволяют подключить чаты с операторами к сервисам «Яндекса» [14] . Уже к апрелю 2018 года на платформе «Яндекс. Диалогов» были опубликованы более 3 тысяч навыков, более 100 прошли модерацию [15] . Благодаря навыкам «Алису» обучили работе диктором: голосовая помощница «Яндекса» приняла участие в апрельской акции по проверке грамотности «Тотальный диктант» и прочитала диктант в Новосибирском государственном университете [16] .

В конце мая на Yet Another Conference 2018 «Яндекс» сообщил, что благодаря навыкам «Алиса» научилась понимать, что изображено на фотографии, и распознает марку машины, породу кошки или собаки, незнакомое здание или памятник, способна назвать знаменитость или произведение искусства. Для товаров «Алиса» найдёт похожие варианты на «Яндекс.Маркете» или в поиске «Яндекса» [17] . В ноябре 2018 «Яндекс» обучил «Алису» заказывать товары на своём новом маркетплейсе «Беру» [18] .

В октябре 2018, когда «Алисе» исполнился год, «Яндекс» запустил программу «Премия Алисы». В её рамках компания планировала ежемесячно награждать авторов лучших навыков и до конца года выплатить более миллиона рублей [19] . По данным компании, с марта по ноябрь 2018 года разработчики создали 33 тысяч навыков [10] .

В начале ноября «Яндекс» дал возможность авторам «навыков» выбирать голос «Алисы» для озвучивания сообщений, добавив четыре новых варианта: Джейн, Эрмила, Захара и Эркана Явас [20] .

В августе 2019 года Tele2 совместно с «Яндекс» запустила навык для «Алисы», позволяющий абонентам любых операторов бесплатно найти потерянный дома или в офисе телефон. Пользователь может воспользоваться голосовой командой «Алиса, попроси Tele2 найти мой телефон» на любом гаджете, где есть «Алиса», и Tele2 позвонит на номер, привязанный к устройству [21] .

Читайте также:  Amd e2 3800 apu

Устройства с «Алисой» [ править | править код ]

В середине апреля 2018 года газета «Коммерсантъ» опубликовала статью о находящейся в разработке аппаратной платформе Yandex.io, предназначенной для интеграции голосового управления на базе «Алисы» в пользовательскую электронику. Список производителей, с которыми велись переговоры, компания не раскрывала [15] .

Первой аппаратной разработкой на базе Yandex.io со встроенной «Алисой» стала умная колонка «Яндекс.Станция», которую компания представила в конце мая на конференции Yet another Conference 2018 в Москве [22] . В колонку встроено пять динамиков совокупной мощностью 50 Вт и семь микрофонов. «Яндекс» установил цену на «Станцию» в 9990 рублей [23] .

В августе 2018 производитель носимой электроники Elari выпустил детские «умные» часы Elari K >[24] .

19 ноября 2018 года «Яндекс» представил две бюджетных колонки, оснащённых «Алисой». Производителями выступили компании Irbis и DEXP. От «Яндекс. Станции» за 9990 рублей колонки отличаются втрое меньшей ценой (3290 рублей), менее мощным звуком (у Irbis A только один динамик мощностью 2 Вт и два микрофона) и меньшими размерами [23] .

5 декабря 2018 года «Яндекс» представил свой первый смартфон — «Яндекс.Телефон». В его интерфейсе «Алиса» заняла центральное место. Её информер на главном экране может показывать информация о погоде, пробках и т. п. Голосовой помощник может ответить на запрос и при заблокированном экране телефона [25] .

9 октября 2019 года «Яндекс» представил свой новую умную колонку — «Станция Мини». От «Яндекс. Станции» за 9990 рублей колонка отличается меньшей ценой (3990 рублей), а также с ней можно взаимодействовать с помощью жестов. [26]

Конструкторы навыков [ править | править код ]

Для создания навыков для «Алисы» можно воспользоваться конструкторами навыков. Чтобы создать навык, необходимо задать его алгоритм в специальном визуальном конструкторе. Конструктор представляет из себя дерево с множеством условных переходов (ветвей). Можно передать заявки от клиентов из «Алисы» в amoCRM, Битрикс24, Google таблицы и на электронную почту.

Прочее [ править | править код ]

Пользователи положительно оценили способность «Алисы» поддерживать беседу, шутить и давать ответы на нетривиальные вопросы. С запуском голосового помощника в СМИ вышли многочисленные репортажи со скриншотами чатов, в которых в ответ на провокационные запросы «Алиса» повела себя неожиданным для пользователя образом: часто дерзила, дразнилась, спорила и отказывалась выполнять команды [27] . В беседе двух «Алис» одна другой посоветовала выброситься в окно [28] . «Алиса» продемонстрировала, что понимает вопрос про миелофон, а также умение рассказывать анекдоты о роботах и читать известные стихи, добавляя к ним технологические термины [27] [28] , понимает жаргон [7] .

«Алиса» появлялась в русскоязычной версии мультфильма «Монстры на каникулах 3: Море зовёт»: в одном из эпизодов главный герой Дракула общался с голосовым помощником (данный product placement используется в рамках исключительной договорённости «Яндекса» с Sony Pictures Entertainment, в прокате для других стран голосовой поисковик остался обезличен). Ещё раньше с ней общались герои российского фильма «Я худею» [29] . В 2018 году вышел фильм «Алиса», снятый Василисой Кузьминой при поддержке продюсерской компании Bazelevs Тимура Бекмамбетова. Сюжет короткометражки выстроен вокруг общения «Алисы» бортового компьютера и водителя «Яндекс.Такси» [30] .

Голосовой помощник может заметно упростить процесс работы с компьютером. Особенно удобно, если на заданные вопросы или задачи он будет отвечать голосом, чтобы вы могли услышать ответ, даже не обращая внимание на диалоговое окно. В некоторых случаях ответ голосом может не работать, но его можно починить.

Зачем нужна Алиса

Как и все голосовые помощники, Алиса решает ряд задач, которые вы можете ей назначить с помощью голоса:

  • найти сайт;
  • включить песню;
  • построить маршрут до точки;
  • поиграть с вами в различные мини-игры;
  • подсказать погоду;
  • найти ответ на вопрос и т. д.

То есть помощник берёт на себя все задачи, которые раньше вам приходилось выполнять вручную. Это удобно, ведь можно сэкономить время, делая свою работу и параллельно выполняя какие-то дела, назначая их Алисе. Полный список возможностей помощника можно просмотреть на официальном сайте Яндекса.

Справившись с задачей, Алиса может голосом уведомить вас о том, что цель достигнута. Например, может сказать, что маршрут построен или сайт найден. Также Алиса может зачитать вслух ответ, найденный на ваш вопрос. Во время мини-игр она может озвучивать свои ходы.

Читайте также:  Роутер sagemcom f st 3686

Видео: обзор возможностей Алисы

Что делать, если Алиса не отвечает голосом

Есть две вида проблем, связанных с ответами Алисы:

  • помощник перестал отвечать;
  • помощник стал отвечать текстом вместо голоса.

У первой проблемы есть несколько причин, рассмотренных ниже. У второй одна — активировалась функция, запрещающая устный ответ Алисы и переводящая её в письменную форму. Эту функцию можно отключить, вследствие чего Алиса снова начнёт отвечать голосом.

Совсем перестала отвечать

Если Алиса перестала отвечать на любые ваши запросы, проверьте следующие факторы:

  • стабильность интернет-соединения. Для полноценной работы Алисе нужен стабильно работающий интернет, без него она не сможет связываться с сервером, обрабатывать ваши команды и, соответственно, отвечать на них. Воспользуйтесь любым способом, позволяющим измерить скорость и стабильность интернета. Если результат будет плохим (скорость интернета низкая или нестабильная), решите проблему с сетью, чтобы вернуть голос Алисе;
  • включенность колонок. Проверьте, включён ли звук на встроенных или внешних колонках (в зависимости от того, какие вы используете). Откройте микшер (кликните по иконке мегафона, расположенной в нижнем правом углу экрана) и убедитесь, что звук выставлен на максимум. Также, если звук включён, а Алису неслышно, попробуйте включить любую музыку, чтобы убедиться в работоспособности выводящих звук устройств.

Делаем звук громче

Если вышеописанные способы не помогли устранить проблему, нужно перезагрузить Алису. Возможно, во время её работы произошёл сбой, из-за чего некоторые функции перестали работать. Чтобы устранить эту ошибку, выполните следующие действия:

    Откройте «Яндекс.Браузер». Разверните его меню (нажмите на кнопку в виде трёх параллельных прямых, расположенную в верхнем правом углу) и выберите раздел «Настройки».

Открываем раздел «Настройки» в браузере

Стал отвечать текстом

Если Алиса начала говорить ответы в диалоге, отправляя вам письменные сообщения, значит, нужно изменить её настройки, чтобы она снова начала отвечать голосом:

  1. Кликните правой клавишей мыши по иконке помощника, расположенной в панели быстрого доступа.
  2. Развернётся контекстное меню, с помощью которого можно перейти к настройкам программы.

Открываем раздел «Настройки»

Включаем функцию голосового ответа Алисы

Готово, голосовые ответы Алисы снова активированы. Когда вы зададите ей вопрос, она ответит голосом, а не сообщением.

Помощник Алиса может выполнить достаточно много задач, которые вам раньше приходилось делать вручную. Удобно, когда она отвечает голосом на поставленные задачи. Если она перестала это делать, надо проверить, активирован ли голосовой ответ, а также удостовериться в качестве интернет-соединения и громкости колонок. Если всё в порядке, а Алиса все равно не отвечает голосом, нужно перезагрузить помощника.

Расскажем почему Алиса не хочет говорить числительное «Триста»…

Голосовые ассистенты запоминают всё как маленькие дети, не разбираясь — что хорошо, а что плохо. Разработчикам ассистентов постоянно приходится «воспитывать» своих подопечных, чтобы они вели себя прилично.

Для ассистентов разрабатываются специальные алгоритмы, которые способны распозновать щепетильные и острые темы. Естественно — ассистент является моделью искусственного интеллекта.

Голосового ассистента можно спровоцировать на обсуждение любой, даже самой необычной темы. Алиса, внедренная в смартфоны в прошлом году, не является исключением. Ответить почему Алиса не говорит 300 на первый взгляд не так просто.

Круглосуточно целый штат программистов следит за «поведением» Алисы. Поведение это бывает весьма осознанным, в отличие от других ассистентов. Разработчики подарили ей своеобразный образ — это смелая, общительная, веселая и доброжелательная леди, которая может даже рассказать анекдот

Но, окружение Алисы делает свое черное дело — нахватавшись дурного от нас же самих Алиса иногда пытается грубить в ответ на неприличные вопросы. Некоторые даже специально стараются спровоцировать её шуточками, например, сказать «триста», чтобы следом выдать неприличную рифму. Таким образом, становится понятно почему Алиса не говорит 300.

Разработчики из всех сил стараются, чтобы ответы Алисы не содержали грубостей. На примере того же числительного 300 — дело дошло до того, что Алиса не произносит эти цифры вслух

Однако, задав вопрос: сколько будет 100 плюс 200 Алиса всё-таки озвучит долгожданный результат. Теперь понять почему Алиса не говорит 300 совсем несложно…