A formação das palavras e a divisão silábica no português brasileiro e sua conexão com o PLN
Fonte: imagem produzida pelo Flow, com prompts do redator.
A compreensão das sílabas e da morfologia das palavras pode nos ajudar a construir um sistema artificial?
Redator: Heitor Augusto Colli Trebien
Caseli e Volpi (2024) iniciam a discussão retomando a noção de fonema, a menor unidade sonora de uma língua. Os fonemas podem ser comparados a tijolos usados na construção de uma casa. Sozinhos, eles não têm muito significado, mas, quando organizados e combinados, formam estruturas maiores, como sílabas e palavras, que passam a ter sentido em uma língua.
A sílaba é uma unidade intermediária entre os fonemas e as palavras, desempenhando um papel importante tanto na produção como na percepção da fala.
No português, as sílabas geralmente se organizam em torno das vogais, que funcionam como o “centro” da sílaba. Por exemplo, na palavra “casa” (/ka.za/), há duas sílabas porque existem duas vogais.
Separação silábica
Caseli e Volpe (2024) comentam que, para separar corretamente uma palavra em sílabas, é preciso decidir a qual sílaba cada consoante pertence, considerando que a vogal é o ponto central.
Essa é uma estratégia mais simplificada, e sempre devemos considerar o som da palavra para confirmar se a divisão faz sentido. Procuramos o núcleo da sílaba (geralmente a vogal) como o ponto de maior sonoridade. Ao redor desse núcleo, os sons tendem a diminuir gradualmente em intensidade.
Na máquina, investigamos a frequência do som silábico nas palavras. Tomemos como exemplo o torpedo de voz, que pode ser dito “torpê de voz”.
O sistema, mesmo que não capte o último som “do”, compreende por frequência e contexto que torpê refere-se à torpedo e não ao adjetivo torpe [tórpe] (vil, asqueroso, que ataca os bons costumes), por exemplo.
Para esse entendimento ocorrer, além da transcrição fonética, também realiza-se uma transcrição de classes gramaticais. Assim, o sistema prevê o que vamos dizer pela formação das palavras e por sua junção (sintaxe).
Como as sílabas são compreendidas no PLN?
Caseli e Volpe compreendem as sílabas como estruturas organizadas internamente à palavra. Ou seja, cada sílaba não é apenas um conjunto de sons, mas possui partes com funções específicas.
Vamos entender isso com o exemplo da sílaba “trans” (/trans/), muito utilizada na palavra transferência ou transbordo. Nela, há um som central, chamado de núcleo — o “coração” da sílaba.
Ao redor desse núcleo, no caso a letra “a”, aparecem outros sons consonantais em posições definidas. A parte inicial da sílaba, aqui é o tr (fricativa), é chamada de ataque. Os ataques normalmente são formados por consoantes.
Já a rima é a parte que inclui o núcleo e os sons que vêm depois dele (ns – nasal). Esses sons finais são chamados de coda. Em alguns casos mais complexos, quando há muitas consoantes no final, a última pode ser considerada um apêndice, ou seja, algo que fica fora da estrutura principal da sílaba. No exemplo “trans”, podemos dividir assim:
- Ataque: /tr/
- Núcleo: /a/
- Coda: /ns/
- Rima: núcleo + coda = /ans/
O prefixo trans remete à atravessar, passar de um lugar para outro. O sistema compreende que transferir ou transbordo significa passar a conversa para um ser humano, por exemplo.
Como as palavras se formam a partir das sílabas?
Caseli e Volpe (2024) apontam o conceito de palavra, que costuma parecer simples para os falantes. Uma palavra pode ser entendida como uma unidade de significado reconhecida por uma comunidade de fala.
Ela pode ser combinada com outras palavras seguindo regras da língua, de acordo com sua classe gramatical (como substantivo, verbo, etc.).
A palavra na fala
Na fala, existe um desafio importante: as palavras não aparecem separadas como na escrita. Quando falamos, os sons se unem de forma contínua, sem espaços claros entre uma palavra e outra.
Só percebemos separações quando há alguma pausa, seja por um erro ou hesitação (disfluência) ou por uma pausa intencional para organizar a fala. Isso pode causar estranhamento, porque estamos acostumados, pela leitura, a ver palavras separadas por espaços. Por exemplo, a frase escrita:
“Me fale sobre torpedo de voz”
na fala pode soar como algo contínuo, parecido com:
“Mifalisobritorpedevoz”
Ou seja, os sons se conectam e formam um fluxo único, sem pausas evidentes entre as palavras.
Em vez de pausas claras, o que geralmente acontece na fala são quebras prosódicas (pronúncia), que ajudam a organizar o enunciado. Essas quebras não são exatamente “silêncios”, mas mudanças na entonação e no ritmo da fala.
Existem dois tipos principais:
- Quebras não-terminais (/): indicam que a fala ainda vai continuar (como uma pequena pausa ou mudança de entonação dentro da frase).
- Quebras terminais (//): indicam que o enunciado terminou (como o ponto final na escrita). O silêncio pode ser um bom exemplo, assim como os gestos. Mas o gesto, por enquanto, não pode ser captado.
A fala em seu idioma
Caseli e Volpe (2024) sublinham que a noção sobre como as palavras são formadas e como elas se combinam são facilmente percebidos por falantes nativos.
Algumas dessas características dizem respeito às palavras consideradas isoladamente. Outras envolvem grupos de palavras que se parecem entre si, seja pela forma ou pelo significado. Esse tipo de relação é chamado de paradigmática.
As propriedades paradigmáticas incluem, por exemplo:
- a classe gramatical da palavra (se é substantivo, verbo, etc.),
- sua morfologia (como ela pode mudar de forma),
- e sua formação, como no caso de palavras compostas.
Por outro lado, existem propriedades que dizem respeito a como as palavras se organizam em conjunto dentro de frases ou enunciados. Essas são chamadas de propriedades sintagmáticas, e tratam de como as palavras se combinam para construir sentido na comunicação.
Aqui, entramos na análise sintática, que também ajuda a compreender sistemas artificiais de fala e produção de texto. De modo similar, a automação calcula a frequência de utilização das palavras e de como elas se ligam, produzindo falas e escritas coerentes.
Para um sistema funcionar de maneira adequada, seja um sistema mais simples de completar palavras ou um ChatGPT, precisamos organizar o modo de organização e classificação da língua, para o sistema poder produzí-la.
Referência
CASELI, H. M.; VOLPE, M. G. (org.). Processamento de Linguagem Natural: Conceitos, Técnicas e Aplicações em Português– 2a. Edição. São Carlos: BPLN, 2024. Disponível em: https://brasileiraspln.com/livro-pln/2a-edicao.
Quer automatizar sua comunicação?
Conheça a plataforma Velip e transforme o atendimento da sua empresa.
Falar com especialista