Голосовые интерфейсы сейчас находятся на подъеме. Потребители обращают на них внимание и играют с такими инструментами, как Google Home и Amazon Alexa чтобы понять, как голосовые интерфейсы могут вписаться в их повседневность. Только не подумайте, что это мимолетное увлечение — голосовой интерфейс уже долгое время пробивается к пьедесталу мейнстримной среды.

Проектирование для голосовых интерфейсов включает в себя создание подсказок и ответов, помогающих пользователю понять, какие действия он может предпринять, чтобы упростить выполнение текущей задачи. Мне, как дизайнеру интерактивных коммуникаций приходится очень много писать! Создание диалогов, это как создание информационной архитектуры: в конечном итоге мы стремимся помочь пользователю выполнить его задачу, но существует множество уникальных ситуаций, с которыми нам приходится считаться, чтобы пользователь смог выполнить ее без использования визуального интерфейса.

В это время, UX дизайнеры уже обладают необходимыми навыками для создания голосовых интерфейсов — это не революция, а скорее естественное расширение тех навыков, которые многие из нас давно используют в других цифровых средах. Понимание того, как создавать хорошие дизайны для этой растущей среды, станет неотъемлемой частью роста продуктов и приложений, которые изменят то, как мы общаемся со своими гаджетами.

 

Принципы VUI дизайна

Главная цель голосового дизайна — создание диалогов. Также, как UX дизайнеры создают простые в навигации визуальные интерфейсы, призывают пользователя выполнить какое-либо действие, и убирают с их пути всяческие преграды, голосовые интерфейсы ведут пользователя к выполнению задачи с наименьшим количеством помех и барьеров. Но в случае с голосом, это происходит посредством диалога.

 

Обработка ошибок

Обработка голосовых ошибок — это то, что делает голосовой дизайн уникальным, и непосредственно связанно с тем, что мы думаем о проектировании продуманного и понятного визуального интерфейса.

Обработка ошибок — это основной компонент создания продуманных голосовых взаимодействий. Как пользователь сможет понять ограничения и возможности системы без каких-либо визуальных подсказок? Ответ заключается в правильной обработке ошибок. При создании голосового интерфейса, дизайнер должен предугадывать то, что скажет пользователь. В качестве примера, я использую одну из своих работ.

В ситуации, когда я создаю интерактивный звонок пациентам, которым необходима колоноскопия, я могу ожидать, что когда я спрошу хочет ли пациент назначить колоноскопию прямо сейчас, он может использовать несколько вариантов ответа: да, нет, хватит мне звонить, мне это не нужно, и т.д. На каждый из этих ожидаемых ответов я могут создать свой, и даже подстроиться под вариации. Но в некоторых случаях, пациент может испугаться, или заинтересоваться нашими системами, и начать говорить словами, которые не были мной предусмотрены.

Например, пользователь может сказать что-то вроде «прикольно»

Моя система, конечно же, не знает, что ответить на такое слово, поскольку как дизайнер, я не ожидала, что на вопрос о колоноскопии, пациент может ответить «прикольно». И хотя в этом случае я не смогут ничего сделать, тем не менее, я могу перенаправить пользователя, или обработать его запрос таким образом, чтобы вернуться к изначальной теме.

В крайних случаях, плохо спроектированная система вообще ничего не ответит, или будет просить пользователя повторить вопрос до тех пор, пока он не скажет то, с чем система сможет справиться. Как и в случае с визуальными интерфейсами, дизайнеры должны думать об этих потенциальных ошибках, и помогать пользователям как можно скорее вернуться к выполнению их задачи. В этом случае, моя система ответила бы что-то вроде «Простите, я не расслышала что вы сказали. Вы хотели бы запланировать колоноскопию? Просто ответьте «Да», «Нет», или «Мне это не нужно».

 

Создание грамматики

Еще один важный принцип VUI дизайна — предугадывание ответов пользователя Также это называется создание грамматики. В контексте создания интерактивных звонков для Emmi, я, обычно, задаю пациентам множество вопросов, например: «Болели ли вы в этом году гриппом?» или «хотите ли вы запланировать обследование?». В обоих случаях, можно ожидать вполне прямых ответов. Обычно, люди отвечают «да», «нет», или «я не знаю». Предугадывая такую реакцию, я могу научить свой голосовой интерфейс ожидать эти ответы, а также могу оформить сами вопросы таким образом, чтобы пациент понимал, как нужно на них отвечать.

Но в некоторых случаях, довольно непросто определить какой последует ответ, и пользователь выходит за рамки ожиданий. В множестве случаев, по мере роста доверия пользователя к VUI, пользователь начинает использвоать всё более сложные ответы и фразы, ожидая что система их поймет.

Например, пациентам с сердечными заболевания, я буду задавать более сложные вопросы. В одном случае, я спрошу: «Мокрый ли у вас кашель?», и буду ожидать ответа «да» или «нет», но пользователь может начать отвечать так, как бы он отвечал собеседнику в диалоге, например, он может добавить какие-нибудь слова: «да, мокрый», или «нет, сухой». Предугадывая эти вариации, я могу создать умную систему, которая наиболее удачно имитирует реальные диалоги, и строит доверительные отношения с пользователем.

Другими словами, прослушивая записи взаимодействия пациентов с моим VUI и проводя множество исследований, я могу еще лучше предугадывать варианты ответов, и подготовить к ним мою систему, предотвращая тем самым множество ошибок.

Перевод статьи Брук Хокинс