Fonte: imagem produzida pelo chatGPT com prompts do redator.
Quando a voz traz muitos desafios, podemos confiar em interfaces multimodais para ampliar a nossa comunicação
Redator: Heitor Augusto Colli Trebien
Quais são as vantagens de desenvolvermos interfaces multimodais?
Como lembra Laura (2015), as primeiras interfaces de voz (VUI – voice user interfaces) foram inicialmente desenvolvidas como brinquedos e, posteriormente, empregadas na automação de ligações telefônicas empresariais.
Hoje, essas interfaces assumiram um papel mais amplo, estando presentes em diversos dispositivos e atuando como assistentes domésticos — desde equipamentos especializados, como a Alexa, até geladeiras, celulares, relógios inteligentes e outros wearables (produtos vestíveis).
O interessante desses produtos, como observa Laura (2015), é que a maioria combina diferentes formas de entrada e saída de dados. Em vez de se limitar ao áudio, muitos dispositivos contam com pequenas telas touch, luzes indicadoras, aplicativos complementares e teclados digitais ou compactos.
Essas interfaces multimodais podem gerar desafios de design bastante interessantes, considerando que devem abarcar uma multimodalidade para atingir as expectativas dos usuários.
Quais são os melhores momentos para escolher a entrada por voz?
Laura (2015) observa que, em muitos casos, as empresas adotam o uso de entrada de voz por razões equivocadas. Muitas vezes, os comandos de voz são incluídos apenas por parecerem algo “legal”, prático ou fácil de usar.
Embora essa ideia não esteja inteiramente incorreta, há aspectos importantes que precisam ser avaliados antes de optar pela comunicação por voz.
Muitos desenvolvedores migram para o processamento de linguagem natural (NLP – Natural Language Processing) por acreditarem que os usuários preferem formular perguntas a seguir instruções. Nesse processo, frequentemente removem telas ou botões na tentativa de reduzir a “poluição” visual das interfaces.
No entanto, a principal razão para incorporar a voz como método de entrada ou saída é aprimorar a experiência do usuário, levando em conta seus contextos e necessidades de uso.
Como em qualquer área do design, o design de voz deve responder às necessidades do usuário e buscar resolver um problema. Se a voz se mostrar a melhor solução para esse problema, então seu uso é não apenas válido, mas recomendável.
Alguns contextos de uso da voz
Separamos alguns contextos em que a voz pode ser utilizada:
- Cobranças e negociações, principalmente quando consideramos as ligações (torpedos de voz), por serem mais íntimas.
- Lembretes, para evitar que esqueçamos de fazer algo (na área da saúde isso é muito importante).
- Aviso de lives, pois a voz ajuda no engajamento.
- Conectar funcionários e clientes.
- Publicidade.
- Entre outros contextos.
A voz realmente pode ser usada em várias situações, mas devemos oferecer opções caso ela não seja suficiente ou adequada ao momento.
Se pararmos para pensar, algumas informações são muito fáceis de dizer, mas difíceis de digitar — e o oposto também é verdadeiro. O mesmo vale para a saída de informações.
Exemplos de uso da voz combinada a elementos visuais e textuais
Um exemplo apresentado por Laura (2015) ocorre quando solicitamos à Siri uma lista de restaurantes em São Paulo que servem sushi. Ao realizar essa mesma busca por meio de texto e, em seguida, visualizar os resultados na tela, é possível identificar e comparar os estabelecimentos disponíveis.
No entanto, se a assistente falasse todos os restaurantes que existem em São Paulo, seriam mais de quinhentas opções — o que evidentemente não seria prático. Esse exemplo evidencia como a combinação de entrada por voz e saída visual pode tornar a interação muito mais eficiente.
Outro exemplo é quando utilizamos o Google Maps. Podemos usar voz ou digitação para encontrar o local, mas para dar instruções, o Google fala a rota, para não desviarmos a atenção e a viagem ser mais segura. Neste caso, o input por voz combinado com tela e o output por voz se apresentou mais útil.
Laura (2015) ainda comenta a função do smartwatch, que pode vibrar no seu pulso quando uma curva estiver próxima, adicionando também feedback tátil à experiência.
Como a Velip trabalha com os sistemas de voz?
Oferecemos uma plataforma completa, a Velip One, na qual você pode utilizar SMS, torpedo de voz, WhatsApp Center e agentes de IA de modo integrado.
Assim, você pode usar voz, texto e imagem para interagir com seu cliente e mantê-lo engajado na comunicação com a sua empresa. Fale conosco para uma parceria e veja as vantagens da comunicação automática integrada.
Velip, ecoando sua voz por novos caminhos
Referência
Laura Klein. Design for voice interfaces: Building products that talk. O’Reilly, 5 nov. 2015.
