Fonte: imagem produzida pelo Flow, com a logo da Velip e prompts do redator.
O processamento de linguagem natural (PLN) é uma área em constante transformação. Venha conhecer um pouco do seu histórico no Brasil.
Redator: Heitor Augusto Colli Trebien
Breve histórico do PLN: como esse campo se desenvolveu no Brasil?
O Processamento de Linguagem Natural (PLN), como Caseli e Volpe (2024) explicam, desenvolveu-se paralelamente ao surgimento dos computadores, a partir da década de 1940, com a tradução automática como um dos primeiros desafios a ser superado.
No contexto brasileiro, os estudos na área tiveram início de maneira discreta na década de 1970, conduzidos por pesquisadores ligados à Inteligência Artificial.
Um marco importante foi a realização do primeiro Simpósio Brasileiro de Inteligência Artificial (SBIA), em 1984, em Porto Alegre, no qual diversos trabalhos abordaram temas relacionados ao PLN.
Como Caseli e Volpe destacam, naquele momento as aplicações voltadas ao português ainda eram bastante limitadas, concentrando-se em experimentos simples, como sistemas capazes de responder a perguntas básicas.
Apenas nos anos seguintes formou-se um grupo mais consistente de pesquisadores dedicados ao processamento computacional da língua portuguesa.
O início dos anos 90: um marco para o desenvolvimento da PLN no Brasil
Caseli e Volpe comentam que, no início dos anos 1990, o Processamento de Linguagem Natural passou a contar com pesquisadores atuando em diferentes universidades brasileiras em diferentes estados.
Cientistas da computação e linguistas trabalhavam em instituições como UFRGS, PUCRS e Unisinos (Rio Grande do Sul), PUC-Rio (Rio de Janeiro), Unicamp (São Paulo) e UFPE (Pernambuco).
Em 1993 foi criado o Núcleo Interinstitucional de Linguística Computacional (NILC), no ICMC-USP de São Carlos, que se destacou como um dos grupos pioneiros na área.
Seu primeiro grande desafio foi o desenvolvimento do primeiro corretor ortográfico e gramatical comercial voltado ao português brasileiro, iniciativa que exigiu a integração de profissionais de informática e linguística, responsáveis por impulsionar e difundir o PLN no país.
O primeiro evento dedicado exclusivamente ao PLN voltado ao português europeu e brasileiro ocorreu em 1993, em Lisboa, dando origem ao evento – International Conference on the Computational Processing of Portuguese (PROPOR), que passou a ser realizado alternadamente no Brasil e em Portugal.
Os anos 2000: aprimoramento do campo
Em 2003 foi organizado o Simpósio Brasileiro de Tecnologia da Informação e da Linguagem Humana (STIL), que reúne eventos satélites focados em temas específicos do processamento linguístico, especialmente do português.
Em 2007, a Sociedade Brasileira de Computação criou a Comissão Especial de PLN (CEPLN). Ao longo do tempo, a área se expandiu inicialmente pela formação acadêmica de pesquisadores e, mais tarde, pelo aumento da demanda do setor tecnológico, o que atraiu profissionais de diversas áreas.
Em 2020, foi fundado o grupo Brasileiras em PLN (BPLN), responsável pela organização da obra que estimulou a produção deste artigo. Agora, o PLN faz parte do nosso dia a dia, seja para estudar, trabalhar ou buscar entretenimento.
O boom do PLN no Brasil
Caseli e Volpe comentam que a evolução conjunta de diferentes áreas da computação — como hardware, software, processamento de grandes volumes de dados, aprendizado de máquina e aprendizado profundo — levou o Processamento de Linguagem Natural a um novo patamar.
Em novembro de 2022, esse avanço tornou-se evidente com o lançamento do ChatGPT, um chatbot capaz de interagir em linguagem natural, inclusive em português, e realizar tarefas variadas, como a escrita de códigos de programação e de textos variados.
Seu alto nível de desempenho linguístico chamou a atenção e gerou preocupações na comunidade de Inteligência Artificial e PLN, além de provocar debates em diversos setores da sociedade.
Surgiram questionamentos sobre os limites da IA, os impactos no mercado de trabalho, a concentração de poder em poucas empresas e as possíveis consequências para países em desenvolvimento.
Esse contexto ampliou o interesse pelas pesquisas e atividades da área, especialmente em PLN, da qual o ChatGPT é um exemplo representativo.
Como o campo se encontra atualmente?
Caseli e Volpe mencionam que a comunidade brasileira de Processamento de Linguagem Natural concentrou esforços na criação de recursos linguístico-computacionais e no desenvolvimento de aplicações voltadas ao português.
No início, essas aplicações eram interfaces simples, capazes de compreender algumas perguntas preestabelecidas em linguagem natural. Mas, com o tempo, surgiram ferramentas mais sofisticadas, como corretores de texto, tradutores automáticos, sumarizadores, classificadores de documentos e sistemas de reconhecimento e síntese de fala.
As soluções da contemporaneidade estão voltadas à análise de conteúdos das redes sociais, utilizando a linguagem para compreender perfis de usuários, identificar tendências, opiniões, sentimentos e até notícias falsas, o que trouxe novos e complexos desafios à área.
Essa expansão fez com que o PLN passasse a impactar fortemente diversos setores, como educação, saúde, direito, finanças, comunicação, comércio, segurança e governança.
Nesse contexto, o papel dos especialistas também se transformou: se antes o foco estava na formalização do conhecimento tecnológico e linguístico, hoje o principal desafio é a preparação, seleção e anotação de dados linguísticos para o treinamento de modelos computacionais, garantindo qualidade, diversidade e correção das informações.
Além disso, tornaram-se essenciais as atividades de avaliação crítica dos recursos e sistemas produzidos, bem como a reflexão sobre suas limitações, impactos e implicações éticas.
Onde a Velip se encontra neste cenário?
A Velip considera todos esses aspectos para pensar nas tecnologias de comunicação automática. Nosso objetivo é acompanhar e aprimorar as inovações tecnológicas para construirmos um futuro baseado em boas-práticas e aplicação tecnológica de ponta.
Pensamos sobre o PLN em todos os nossos serviços, desde torpedo de voz, WhatsApp, API de telefonia, SMS e Agentes de IA. Cada ferramenta exige uma estratégia, e nossa equipe está sempre pronta para estudar novas possibilidades de implementação tecnológica.
Referência
CASELI, H. M.; VOLPE, M. G. (org.). Processamento de Linguagem Natural: Conceitos, Técnicas e Aplicações em Português– 2a. Edição. São Carlos : BPLN, 2024. Disponível em: https://brasileiraspln.com/livro-pln/2a-edicao.
