Vamos falar sobre processamento de linguagem natural?

Vamos falar sobre processamento de linguagem natural?

Fonte: imagem produzida pelo Flow, com a logo da Velip e prompts do redator. 

 

O processamento de linguagem natural (PLN) é uma área em constante transformação. Venha conhecer um pouco do seu histórico no Brasil.

 

Redator: Heitor Augusto Colli Trebien 

 

Breve histórico do PLN: como esse campo se desenvolveu no Brasil? 

 

O Processamento de Linguagem Natural (PLN), como Caseli e Volpe (2024) explicam, desenvolveu-se paralelamente ao surgimento dos computadores, a partir da década de 1940, com a tradução automática como um dos primeiros desafios a ser superado. 

No contexto brasileiro, os estudos na área tiveram início de maneira discreta na década de 1970, conduzidos por pesquisadores ligados à Inteligência Artificial. 

Um marco importante foi a realização do primeiro Simpósio Brasileiro de Inteligência Artificial (SBIA), em 1984, em Porto Alegre, no qual diversos trabalhos abordaram temas relacionados ao PLN. 

Como Caseli e Volpe destacam, naquele momento as aplicações voltadas ao português ainda eram bastante limitadas, concentrando-se em experimentos simples, como sistemas capazes de responder a perguntas básicas. 

Apenas nos anos seguintes formou-se um grupo mais consistente de pesquisadores dedicados ao processamento computacional da língua portuguesa.

 

O início dos anos 90: um marco para o desenvolvimento da PLN no Brasil

 

Caseli e Volpe comentam que, no início dos anos 1990, o Processamento de Linguagem Natural passou a contar com pesquisadores atuando em diferentes universidades brasileiras em diferentes estados. 

Cientistas da computação e linguistas trabalhavam em instituições como UFRGS, PUCRS e Unisinos (Rio Grande do Sul), PUC-Rio (Rio de Janeiro), Unicamp (São Paulo) e UFPE (Pernambuco). 

Em 1993 foi criado o Núcleo Interinstitucional de Linguística Computacional (NILC), no ICMC-USP de São Carlos, que se destacou como um dos grupos pioneiros na área. 

Seu primeiro grande desafio foi o desenvolvimento do primeiro corretor ortográfico e gramatical comercial voltado ao português brasileiro, iniciativa que exigiu a integração de profissionais de informática e linguística, responsáveis por impulsionar e difundir o PLN no país.

O primeiro evento dedicado exclusivamente ao PLN voltado ao português europeu e brasileiro ocorreu em 1993, em Lisboa, dando origem ao evento – International Conference on the Computational Processing of Portuguese (PROPOR), que passou a ser realizado alternadamente no Brasil e em Portugal. 

 

Os anos 2000: aprimoramento do campo 

 

Em 2003 foi organizado o Simpósio Brasileiro de Tecnologia da Informação e da Linguagem Humana (STIL), que reúne eventos satélites focados em temas específicos do processamento linguístico, especialmente do português. 

Em 2007, a Sociedade Brasileira de Computação criou a Comissão Especial de PLN (CEPLN). Ao longo do tempo, a área se expandiu inicialmente pela formação acadêmica de pesquisadores e, mais tarde, pelo aumento da demanda do setor tecnológico, o que atraiu profissionais de diversas áreas. 

Em 2020, foi fundado o grupo Brasileiras em PLN (BPLN), responsável pela organização da obra que estimulou a produção deste artigo. Agora, o PLN faz parte do nosso dia a dia, seja para estudar, trabalhar ou buscar entretenimento.

 

O boom do PLN no Brasil

 

Caseli e Volpe comentam que a evolução conjunta de diferentes áreas da computação — como hardware, software, processamento de grandes volumes de dados, aprendizado de máquina e aprendizado profundo — levou o Processamento de Linguagem Natural a um novo patamar. 

Em novembro de 2022, esse avanço tornou-se evidente com o lançamento do ChatGPT, um chatbot capaz de interagir em linguagem natural, inclusive em português, e realizar tarefas variadas, como a escrita de códigos de programação e de textos variados. 

Seu alto nível de desempenho linguístico chamou a atenção e gerou preocupações na comunidade de Inteligência Artificial e PLN, além de provocar debates em diversos setores da sociedade. 

Surgiram questionamentos sobre os limites da IA, os impactos no mercado de trabalho, a concentração de poder em poucas empresas e as possíveis consequências para países em desenvolvimento. 

Esse contexto ampliou o interesse pelas pesquisas e atividades da área, especialmente em PLN, da qual o ChatGPT é um exemplo representativo.

 

Como o campo se encontra atualmente? 

 

Caseli e Volpe mencionam que a comunidade brasileira de Processamento de Linguagem Natural concentrou esforços na criação de recursos linguístico-computacionais e no desenvolvimento de aplicações voltadas ao português. 

No início, essas aplicações eram interfaces simples, capazes de compreender algumas perguntas preestabelecidas em linguagem natural. Mas, com o tempo, surgiram ferramentas mais sofisticadas, como corretores de texto, tradutores automáticos, sumarizadores, classificadores de documentos e sistemas de reconhecimento e síntese de fala. 

As soluções da contemporaneidade estão voltadas à análise de conteúdos das redes sociais, utilizando a linguagem para compreender perfis de usuários, identificar tendências, opiniões, sentimentos e até notícias falsas, o que trouxe novos e complexos desafios à área.

Essa expansão fez com que o PLN passasse a impactar fortemente diversos setores, como educação, saúde, direito, finanças, comunicação, comércio, segurança e governança. 

Nesse contexto, o papel dos especialistas também se transformou: se antes o foco estava na formalização do conhecimento tecnológico e linguístico, hoje o principal desafio é a preparação, seleção e anotação de dados linguísticos para o treinamento de modelos computacionais, garantindo qualidade, diversidade e correção das informações. 

Além disso, tornaram-se essenciais as atividades de avaliação crítica dos recursos e sistemas produzidos, bem como a reflexão sobre suas limitações, impactos e implicações éticas. 

 

Onde a Velip se encontra neste cenário?

 

A Velip considera todos esses aspectos para pensar nas tecnologias de comunicação automática. Nosso objetivo é acompanhar e aprimorar as inovações tecnológicas para construirmos um futuro baseado em boas-práticas e aplicação tecnológica de ponta. 

Pensamos sobre o PLN em todos os nossos serviços, desde torpedo de voz, WhatsApp, API de telefonia, SMS e Agentes de IA. Cada ferramenta exige uma estratégia, e nossa equipe está sempre pronta para estudar novas possibilidades de implementação tecnológica.

 

Referência

CASELI, H. M.; VOLPE, M. G. (org.). Processamento de Linguagem Natural: Conceitos, Técnicas e Aplicações em Português– 2a. Edição. São Carlos : BPLN, 2024. Disponível em: https://brasileiraspln.com/livro-pln/2a-edicao.