Como considerar a privacidade e a acessibilidade em interfaces de voz?

Como considerar a privacidade e a acessibilidade em interfaces de voz?

Fonte: imagem produzida pelo chatGPT, com prompts do redator.

 

Como proteger a privacidade do usuário, quando toda a comunicação deve ser audível? 

 

Redator: Heitor Augusto Colli Trebien

 

Como ilustrado pela pergunta que abriu este artigo, um dos aspectos mais preocupantes das interfaces de voz, especialmente as que são exclusivamente por voz, é o fato de que tudo pode ser ouvido.

Laura (2015) comenta que isso não é necessariamente um problema quando pedimos para a Alexa tocar algumas músicas de show, mas é bem mais delicado quando abordamos, por exemplo, questões de saúde ou financeiras. 

O mesmo vale para o lugar onde estamos. Quando estamos sozinhos em casa, qualquer coisa pode ser perguntada, agora, se estamos no trabalho ou em locais públicos, os dados sensíveis tornam a pessoa vulnerável. 

Uma estratégia, segundo Laura (2015), é projetar as interfaces de voz com um método alternativo de entrada (input) para qualquer informação sensível, o que exige uma boa classificação, por parte dos desenvolvedores, daquilo que é sensível e daquilo que não é.

 

Acessibilidade: como acessar um sistema por voz?

 

A acessibilidade, de acordo com Laura (2015), também pode ser um problema. Claro, é óbvio que acessamos o sistema por meio da fala, no entanto, o desempenho do sistema de reconhecimento de voz pode cair significativamente ao lidar com falantes não nativos, ruído de fundo ou até uma conexão telefônica ruim, como acontece em algumas ligações URAs (unidades de resposta audível). 

Em algumas situações, precisamos gritar mais alto que a música tocando na Alexa para conseguir abaixar o volume. O ambiente em que você interage com um produto pode ter um impacto enorme na acessibilidade e na facilidade de uso.

Laura aponta que, por outro lado, interfaces de voz melhores e saídas de áudio mais eficazes podem aumentar a acessibilidade de produtos para pessoas com baixa visão ou dificuldade para digitar ou tocar em telas de dispositivos móveis. 

Casas inteligentes podem facilitar tarefas do dia a dia para pessoas com mobilidade reduzida, permitindo o controle de dispositivos sem a necessidade de acesso físico a eles.

 

Desenvolvendo uma melhor acessibilidade e privacidade 

 

A peça-chave para projetar com mais privacidade, segundo Laura (2015) é compreender o que os usuários consideram informações privadas e prever o contexto em que essas informações podem ser usadas. 

Por exemplo, ninguém quer gritar o número do CPF em voz alta no trem. Uma estratégia é oferecer ao usuário a capacidade de alternar entre o modo voz para texto com diferentes formas de entrada (input) e saída (output). 

Quando pensamos na comunicação natural, esse processo é mais intuitivo. Laura menciona que, na prática, quando sussurramos para alguém, a pessoa tende a sussurrar de volta. O ideal seria que os sistemas responsivos conseguissem compreender essa ação e a reproduzisse nos momentos certos. 

 

Compreensão de contexto

 

Nossos dispositivos, infelizmente, ainda não entendem isso, então um sistema de voz sempre responde no mesmo volume. Criar interfaces de voz que levem em consideração o ruído ambiente, a localização e o volume do que foi falado é um desafio. 

No entanto, quando esses problemas são considerados e solucionados (mesmo que em partes), podemos ter uma melhora significativa dos resultados em termos de privacidade.

Uma melhor compreensão de contexto também pode ajudar com questões de acessibilidade. Atualmente, existem tecnologias que se esforçam para se adaptar ao contexto. 

Por exemplo, Laura (2015) citou o SDK (Software Development Kit – Kit de desenvolvimento de software), ferramenta desenvolvida em 2015 pela empresa TRNQL. A máquina busca identificar quando o usuário estava sentado ou andando. 

Quando estamos sentados, o dispositivo libera o teclado como método de entrada, mas quando estamos andando, o padrão muda automaticamente para voz. 

Em outras palavras, se o seu sistema sabe que você está sentado à mesa, entende que você provavelmente prefere digitar. Mas se estiver em movimento, o uso da voz pode ser mais seguro, já que evita que você ande distraído olhando para o celular e acabe sofrendo um acidente.

 

Tomada de decisão relacionada ao contexto

 

À medida que nossos dispositivos pessoais sabem cada vez mais sobre nós — onde moramos, onde trabalhamos, quando estamos no cinema, quando estamos ouvindo música — eles podem tomar decisões mais acertadas sobre como deveríamos interagir com eles. 

É claro que isso pode significar uma troca desconfortável, para alguns usuários, entre privacidade e acessibilidade. Podemos gostar que o celular saiba quando estamos caminhando, mas não necessariamente queremos que ele armazene onde estamos caminhando. 

Fazer boas escolhas faz parte do design de qualquer dispositivo móvel ou pessoal, e as preocupações extras de privacidade associadas à tecnologia de voz e áudio complicam ainda mais esse processo de decisão.

Lembre-se: preocupações com privacidade e acessibilidade são sérias e nunca fáceis de resolver. Você pode causar muito dano se um dispositivo anunciar algo quando não deveria. 

Compreender as preocupações e os contextos dos seus usuários pode ajudá-lo a tomar decisões melhores, que protejam os dados deles e ao mesmo tempo melhorem a experiência.

 

Referência

Laura Klein. Design for voice interfaces: Building products that talk. O’Reilly, 5 nov. 2015.