Veja mais algumas estratégias para ampliar as capacidades da sua interface de voz

Veja mais algumas estratégias para ampliar as capacidades do seu voicebot

Fonte: imagem criada pelo chatGPT com prompts do redator.

 

Redator: Heitor Augusto Colli Trebien

 

No texto Como projetar interfaces de voz? conversamos sobre o desenvolvimento de aplicativos e sistemas baseados na voz, e hoje vamos trazer mais alguns aspectos importantes para o seu produto. 

 

Nunca se esqueça de garantir segurança e privacidade 

 

Hoje, muitas interações por voz acontecem em ambientes privados — como a sala de casa, no quarto, no escritório ou dentro do carro. Craig (2020) ressalta que, no entanto, que é cada vez mais comum as pessoas atenderem ligações de voz na rua, no ônibus, supermercado e em outros lugares públicos, o que pode gerar interferências indesejadas. 

Craig nos traz alguns exemplos e questionamentos do que pode acontecer: como a reserva de um voo ou uma ligação automática de negociação de dívidas por voz. E se, na hora de pagar, você estiver cercado de outras pessoas? Como o sistema poderia perceber que é um momento sensível e proteger seus dados e das pessoas a sua volta? Agora imagine se a conversa envolver informações de saúde protegidas (protected health informationPHI). O risco de exposição de dados pode aumentar segundo as circunstâncias.

Essas situações mostram como segurança e privacidade são prioridades que não podem ser ignoradas. Para ajudar, Craig (2020) reuniu algumas boas práticas que todo sistema de interação por voz deve seguir para proteger seus usuários.

 

Ocultar informações de pagamento

 

Craig (2020) nos dá o exemplo das compras digitais, nas quais é comum mostrar apenas os últimos 4 dígitos do cartão de crédito: **** **** **** 2768. Com reservas de voo e negociação de dívidas, o mesmo pode ser feito. No entanto, como estamos falando de voz, podemos ir além. 

Podemos criar apelidos no processo de cadastramento para mascarar os dados do cartão. Assim, Craig (2020) nos mostra uma opção de fechamento de conversa, pensado no contexto de reservas de voo: 

 

Sistema: Vamos confirmar a sua compra: você está reservando um voo de São Paulo (SP) para Curitiba (PR), no valor de R$ 1.259,00. Quer continuar com o pagamento?
Usuário: Sim.
Sistema: Ok, devo usar seu pagamento padrão, “Cartão Heitor”?
Usuário: Isso.
Sistema: Pronto, reserva confirmada! Seu itinerário e informações de embarque serão enviados para o seu e-mail.

Perceba que, em nenhum momento, os dados do cartão foram revelados. Isso permite que a transação aconteça com segurança, mesmo em locais públicos.

 

Há momento para tudo

 

Craig revela que nem sempre é apropriado usar uma interface de voz em público. Imagine alguém tentando marcar uma consulta médica: só de mencionar o tipo de médico ou clínica, informações pessoais de saúde já podem ser expostas. No entanto, em alguns casos, podemos usar o nome do médico: 

 

Sistema: Posso confirmar sua consulta com o doutor Heitor na segunda-feira? 

Usuário: Na verdade, preciso remarcar para quinta-feira, é possível? 

Sistema: Iremos verificar com o doutor a possibilidade de mudança de horário. Assim que ele confirmar, retornaremos o contato.   

 

Por isso, é fundamental pensar em como sua interface de voz vai lidar com essas situações e se existem possibilidades de integrar mais de um tipo de comunicação, como escrita e imagem. As condições que as pessoas se encontram levantam diversas questões que os desenvolvedores precisam se preocupar: 

 

  • Será que o sistema consegue identificar se o ambiente é privado? Ou captar vozes baixas e sussurros para manter a discrição?

 

Como Craig aponta, muito disso vai depender dos recursos tecnológicos disponíveis. As interfaces de voz têm, sim, seu espaço, mas em alguns casos o mais seguro ainda é recorrer a elementos visuais e a escrita — especialmente quando a situação exige sensibilidade e sigilo.

Mais duas questões surgem:

 

  • Como podemos representar visualmente uma fala ou conteúdo audível?
  • Como criar interfaces de voz fluidas, sem depender demais de pistas visuais?

 

Devemos destacar, antes de dar a resposta, que as interfaces de voz não substituem as de imagem e de escrita. Elas se complementam, e essa relação pode gerar produtos muito melhores, úteis e agradáveis de serem utilizados. 

A resposta simples para as perguntas é: depende do produto, do objetivo e para quem você quer desenvolver o sistema. O surpreendente é que, em muitos casos, realmente as três formas de comunicação se combinam muito bem, para diversos contextos.

 

Elementos visuais para sistemas de voz

 

Como Craig (2020) descreve, a Alexa, da Amazon, e a Siri, da Apple, são bons exemplos de como oferecer feedback visual de forma sutil para mostrar ao usuário que a interação por voz está acontecendo.

Na maioria dos casos, os elementos visuais tendem a ser mínimos — mas funcionam muito bem. Um piscar de luzes, a utilização de diferentes luzes ou um ícone que roda já transmite três mensagens importantes:

 

  • O dispositivo está funcionando.
  • A interface de voz está respondendo (ou vai responder) ao que foi dito.
  • O usuário pode acompanhar o que está acontecendo no momento.

 

Segundo Craig (2020), o feedback visual se torna ainda mais valioso em apps de bate-papo por voz ou em TVs com comando de voz, quando o texto falado aparece na tela. Isso ajuda a confirmar se o que foi dito foi reconhecido corretamente pelo sistema.

 

A voz como elemento em sistemas visuais

 

Para Craig (2020), a voz pode representar uma forma alternativa de interagir com um produto. A Siri no macOS e a Cortana no Windows, por exemplo, são interfaces gráficas, mas seus assistentes virtuais oferecem maneiras únicas de realizar tarefas.

Quando perguntamos à Siri ou à Cortana: “O que está na minha agenda hoje?”, recebemos rapidamente um resumo do calendário. Nesse caso, a voz complementa a interface visual, permitindo que as pessoas executem ações de forma mais ágil. Em vez de abrir o calendário e agendar manualmente, basta pedir ao assistente de voz para fazer isso.

O mesmo raciocínio vale para a integração da voz em aplicativos móveis, como os celulares. Embora o foco principal continue sendo o visual, a voz pode ampliar a nossa experiência. Tarefas rotineiras são rapidamente resolvidas por comandos de voz, solucionando alguns problemas de modo muito mais prático.

 

Nosso sistema multimídia: a Velip One

 

Preparamos uma plataforma completa, integrada à inteligência artificial e multimídia, com suporte para imagem, texto, voz e vídeo. Com a Velip One, você pode se comunicar via WhatsApp, torpedo de voz, SMS e desenvolver agentes de IA. 

Entre em contato para conhecer as vantagens da comunicação automática para a sua empresa. 

 

Velip, ecoando sua voz por novos caminhos.

 

Referência

 

Michael Craig. How to design for voice UI. WixStudio, 28 dez. 2020.