Fonte: imagem produzida pelo Flow com prompts do redator.
Veja algumas situações em que combinar a entrada por toque e a saída por voz podem ajudar a desenvolver interfaces comunicativas
Redator: Heitor Augusto Colli Trebien
Uma combinação não tão rara: input físico e output por voz
Essa combinação específica de interface pode parecer incomum, mas, como Laura (2015) nos lembra, essa é a forma tradicional de entrada de praticamente todos os aparelhos de som que você já usou.
Sejam rádios, telefones, celulares ou mesmo alguns tokens de lojas, aqueles em que você conversa com o atendente digital através de um suporte.
A entrada física representa o toque, a construção de botões analógicos ou digitais, ou ainda gestos diante de uma câmera. A entrada por meios físicos é especialmente útil quando estamos, por exemplo, em lugares lotados, com muitas pessoas falando. Assim, podemos orientar a máquina sobre o que queremos sem haver confusão.
Como Laura (2015) aponta, o output de áudio pode ser útil para qualquer produto que será usado com certa frequência por um grande número de pessoas não treinadas.
Uma voz humana tranquilizadora dando instruções pode ajudar alguém que, de outra forma, teria dificuldade com um processo como a compra de mantimentos, no qual várias tarefas precisam ser realizadas em uma ordem específica.
Interfaces completas: vamos misturar tudo!
Laura destaca que muitos produtos estão migrando para interfaces multimodais que combinam voz e entradas físicas com saída por tela, áudio e toque.
Aplicativos de navegação, como o Google Maps, talvez sejam um bom exemplo de uma categoria de produtos que combinam bem todos esses canais de comunicação.
Os usuários podem tocar em lugares no mapa, rolar para ver o que há por perto ou digitar um endereço utilizando o toque ou digitação. Ao dirigir, pode-se dizer o nome de um destino sem tirar os olhos da estrada ou as mãos do volante.
A resposta por fala permite que o dispositivo móvel forneça instruções de navegação claras, além de alertas de tráfego, engarrafamento ou radar à frente.
O mapa, por sua vez, mostra curvas e outras informações, que poderão ser vistas em momento oportuno e de modo complementar ao que foi falado.
Aplicativos eficientes: interação multimodal
Para desenvolver um aplicativo que englobe todos os tipos de comunicação, exige uma combinação excepcional de métodos de entrada e saída, cada um contribuindo para a experiência do usuário da forma mais adequada.
Laura explica que cada condição de entrada e saída em um sistema de navegação bem projetado leva em conta o contexto e as necessidades do usuário. Você pode ficar com as mãos e olhos livres quando necessário, mas ainda ter acesso à tela quando ela for útil.
Designs como esse não acontecem por acaso. Eles são cuidadosamente elaborados com base em um profundo entendimento de como e quando os usuários interagem com os produtos.
Sistemas de navegação são usados em carros, então voz e áudio se tornam escolhas práticas. É claro que nem todos os produtos têm usos tão claramente definidos, por isso pode ser desafiador decidir quando interfaces de voz e áudio realmente melhoram a experiência.
Quando vamos alcançar a ficção científica?
Laura menciona que, quanto mais pesquisamos sobre interfaces de voz, mais elas se tornam extraordinárias, e com elas podemos perceber como a comunicação com as pessoas ocorre.
A interface artificial generativa deu um importante passo para o avanço das tecnologias de comunicação artificial. Estamos chegando lá, mas ainda falta muito.
Apesar da revolução que o ChatGPT trouxe, ainda estamos muito longe de ter conversas reais com nossos aplicativos inteligentes — o que não é um problema, afinal, a máquina tem um propósito diferente da comunicação humana.
Alguns obstáculos ainda nos afastam desse futuro: parte deles pode ser resolvida pela tecnologia, enquanto outros só serão superados com o tempo. Alguns talvez nem sejam superados, porquê pensando bem, nem a comunicação humana é perfeita.
Referência
Laura Klein. Design for voice interfaces: Building products that talk. O’Reilly, 5 nov. 2015.
