Fonte: imagem produzida pelo chatGPT com prompts do redator.
Conheça alguns contextos em que o uso de voz automatizada pode facilitar as atividades do dia a dia
Redator: Heitor Augusto Colli Trebien
Interfaces compartilhadas com casas inteligentes
Laura (2015) destaca que o uso mais comum do processamento da voz é em interfaces que não possuem telas. Por exemplo, dispositivos de automação residencial, como a Alexa, o termostato Nest e as lâmpadas Philips Hue têm recursos de automação por voz.
No caso do Nest, existe uma pequena tela que pode auxiliar o usuário, e para a Philips Hue o usuário conta com aplicativos complementares, que podem ser baixados no celular para o usuário controlar a ferramenta.
No entanto, como Laura (2015) aponta, as interfaces de voz para esse tipo de produto são, em muitos aspectos, mais úteis do que os apps. Esse é um dos motivos pelos quais as lâmpadas Philips Hue já vêm com integração ao Amazon Alexa.
Entretanto, Laura (2015) nos lembra que interfaces de voz não são boas em distinguir quem está falando, o que significa que, por padrão, essas interfaces se tornam utilizáveis por qualquer pessoa presente no ambiente. Qualquer um pode controlar a Amazon Alexa no cômodo, o que pode ser um problema para privacidade e segurança.
Ter interfaces de voz para dispositivos domésticos inteligentes torna esses produtos mais acessíveis para todos — seja para pessoas com necessidades especiais, convidados, crianças, pessoas que não são da casa ou qualquer um. O que pode ser benéfico, mas traz outros problemas, o que requer parcimônia e cuidado ao utilizar o dispositivo.
A principal vantagem, como Laura comenta, é que as interfaces de voz permitem que as pessoas controlem os dispositivos sem estar fisicamente próximas a eles. Você pode ajustar ou verificar a temperatura do forno sem sair da sala de estar, ou confirmar se todas as luzes da casa estão apagadas — direto da cama.
Linguagens mais específicas
Laura traz o contexto das várias linguagens disponíveis, que devem ser consideradas ao desenvolvermos interfaces de voz. Algumas linguagens são mais fáceis de digitar do que outras, como quando comparamos a linguagem natural, a matemática e a química, por exemplo.
Permitir que as pessoas falem, em vez de digitar, pode economizar um tempo enorme — especialmente quando consideramos signos e símbolos mais complexos próprios de cada nicho do conhecimento.
Mesmo que você esteja projetando uma interface em algum idioma específico, vale lembrar que certos tipos de informações não são fáceis de apresentar por texto.
Fórmulas matemáticas, notas musicais ou ligações químicas, por exemplo, são fáceis de dizer em voz alta, mas exigem uma notação bastante específica que pode ser trabalhosa de digitar.
Demandas mais complicadas que exigem mais esforço do sistema
Neste contexto, Laura salienta que interfaces de voz são especialmente úteis quando precisamos que o usuário forneça informações complexas — aquelas que envolvem uma condição ou mais para serem realizadas.
Imagine que você quer assistir a um filme hoje à noite. Você pode abrir o guia da sua TV, o catálogo da Netflix ou do Amazon Video e começar a navegar pelas milhares de opções na sua lista, ou usar os filtros disponíveis.
Mas também pode simplesmente dizer:
“Me indique filmes de comédia romântica, com o/a ator/atriz tal, lançados hoje e que sejam de graça. Só me mostre os que têm quatro estrelas ou mais.”
A fala parece ser uma ação muito mais prática para atingir o objetivo, não concorda?
Consultas complexas, com vários critérios e filtros, costumam ser mais fáceis de expressar em linguagem natural — e é exatamente isso, como Laura acentua, que torna o Google tão eficaz, tanto com comandos por voz como por texto. Essa combinação se destaca ainda mais quando estamos usando um dispositivo como uma TV, que normalmente não tem um teclado à mão.
Segurança em ambientes onde mãos e olhos não precisam ou não podem ser usadas
Neste caso, Laura sublinha um dos contextos em que as interfaces de voz já começaram a ser amplamente utilizadas: o dos automóveis. Atualmente, as pessoas interagem com dispositivos enquanto dirigem — seja para usar o GPS, fazer uma ligação ou até mandar uma mensagem. E o ideal é que os motoristas mantenham as mãos no volante e os olhos na estrada.
A entrada por voz e a saída de áudio permitem que essas interações aconteçam de forma um pouco mais segura. Isso não elimina totalmente as distrações ao volante, mas evita que o motorista precise olhar para uma tela — o que, por enquanto, já é um avanço importante até que os carros passem a dirigir sozinhos.
Vale ressaltar que o uso da voz no volante é algo que deve ser usado com equilíbrio, para não causar mais acidentes no trânsito.
Ainda, Laura comenta que o uso da voz não se limita aos carros. Pense, por exemplo, em uma sala de cirurgia. Ninguém quer um médico trocando mensagens enquanto realiza uma operação, mas a presença de dispositivos tecnológicos nos hospitais está crescendo.
Uma interface de voz que permita ao cirurgião acessar rapidamente informações do prontuário, sem tirar as mãos do procedimento, pode evitar acidentes. O médico pode acessar dados mantendo o foco na direção certa.
Sempre que estivermos em situações que exigem resposta rápida ou acesso a informações sem o uso das mãos ou dos olhos, as interfaces de voz e saídas em áudio podem ajudar na segurança e na eficiência do resultado.
Como trabalhamos com a voz na Velip?
Desenvolvemos a plataforma Velip One, integrada à inteligência artificial generativa, permitindo que você realize e receba ligações e mensagens via voz e texto de modo automatizado e massificado, seja por telefone ou WhatsApp.
Nossa plataforma é no code, assim você pode programar os disparos e comunicações com mais facilidade. Você ainda conta com APIs de integração, o que garante conexão com seus sistemas externos. Assim, evitamos perda de dados desnecessários.
Converse conosco para conhecer todas as vantagens de uma comunicação automática para a sua empresa. Vamos fazer uma parceria e fazer a sua voz ser ouvida.
Velip, ecoando sua voz por novos caminhos
Referência
Laura Klein. Design for voice interfaces: Building products that talk. O’Reilly, 5 nov. 2015.
