O que é a língua e como ela pode ser usada em computação?

O que é a língua e como ela pode ser usada em computação?

Fonte: imagem produzida pelo Flow, com prompts do redator.

 

Redator: Heitor Augusto Colli Trebien

 

Afinal, o que é a língua?

 

A língua, como Caseli e Volpe (2024) destacam, é uma das principais características que diferenciam os seres humanos, pois nos permite representar a realidade e nos comunicar de formas muito elaboradas e simbólicas. 

Para a criança, desenvolver a capacidade de criar significados, se expressar e ser compreendida é um grande avanço. 

Nos primeiros anos de vida, o bebê aprende gradualmente a se comunicar em sua língua materna. 

Mais tarde, por volta dos sete anos, a criança também passa a usar a escrita, utilizando símbolos para registrar e transmitir aquilo que deseja.

 

A língua escrita

 

Caseli e Volpe (2024) explicam que, em PLN, a nossa escrita é compreendida como uma sequência de caracteres representados graficamente, que produzem significados para nós. 

Essa língua escrita é chamada de texto, para diferenciá-la da oralidade, que recebe o nome de fala. 

Na linguística textual, reconhecemos tanto texto escrito como falado, entretanto, em PLN o termo ‘texto’ costuma se referir principalmente à escrita, enquanto a fala indica a comunicação oral.

 

Quais são as áreas da linguística que se debruçam sobre a língua? 

 

Na linguística, temos algumas áreas de destaque que organizam o estudo da língua, elas são: 

 

  • Fonética: sons da língua.
  • Fonologia: valor desses sons em certa comunidade.
  • Morfologia: formação das palavras.
  • Sintaxe: a relação que as palavras estabelecem entre si. 
  • Semântica: significado que as palavras e seu conjunto criam.
  • Pragmática: considera o significado em contexto de uso. 
  • Discurso: analisa o texto em sua totalidade, considerando as partes e o valor ou intuito total do texto produzido como um discurso. 

 

Como Caseli e Volpe discutem, a língua pode ser entendida como um conjunto de níveis ou aspectos interligados, e cada nível é estudado por uma área da Linguística. 

No centro estão a fonética e a fonologia, que analisam os sons, a sua organização e o seu valor em uma dada comunidade. 

Em seguida vem a morfologia, que estuda como os morfemas (menor unidade com significado dentro de uma palavra) formam palavras. 

Depois, a sintaxe investiga como as palavras se organizam e se relacionam para formar frases e orações. 

A semântica, por sua vez, trata do significado de palavras e frases, enquanto a pragmática observa como usamos essas frases em situações reais para alcançar objetivos comunicativos. 

Por fim, o discurso se dedica ao texto como um todo, examinando as relações entre partes do texto e sua estrutura/organização geral.

 

Conhecimento em linguística computacional: integração das subáreas 

 

Como Caseli e Volpe ressaltam, é importante entender que, na prática, as estratégias computacionais costumam integrar os conhecimentos de várias subáreas ao mesmo tempo. 

Cada língua possui características próprias que determinam desde como os caracteres podem ser combinados para formar palavras com significado até as regras que organizam as frases, isto é, sua sintaxe. 

Um exemplo é o processamento morfossintático feito por um etiquetador (tagger), que usa informações morfológicas e sintáticas para identificar a categoria gramatical (PoS) de cada palavra.

Essa classificação e organização pode ser usada em um sistema maior, como um chatbot, para que ele possa realizar um atendimento ao cliente. 

Podemos classificar um ‘s’ como um ‘sim’, comum em conversas do WhatsApp (Pragmática). Quando o sistema aprende essa correlação de significados, consegue responder com mais precisão e segurança. 

 

Referências

 

CASELI, H. M.; VOLPE, M. G. (org.). Processamento de Linguagem Natural: Conceitos, Técnicas e Aplicações em Português– 2a. Edição. São Carlos: BPLN, 2024. Disponível em: https://brasileiraspln.com/livro-pln/2a-edicao.