O que é a inteligência artificial gerativa e como ela pode criar narrativas?

O que é a inteligência artificial gerativa e como ela pode criar narrativas?

O ser humano, a partir da inteligência artificial, criou novas ferramentas para contar histórias 

 

Redator: Heitor Augusto Colli Trebien

 

“Como alertam alguns especialistas, o perigo real hoje não é que a inteligência artificial seja mais inteligente do que os humanos, mas supor [grifo nosso] que ela seja mais inteligente do que os humanos e, consequentemente, confiar nela para tomar decisões importantes. A inteligência artificial atual deveria ser meramente um parceiro dos especialistas humanos.” (COZMAN, 2022, p. 9)

 

Considerando a citação acima, neste artigo vamos apresentar brevemente alguns conceitos sobre o que é a inteligência artificial e mostrar um exemplo de como ela pode ser usada para criar histórias.

Para entendermos o adjetivo “gerativa”, precisamos ter pelo menos uma compreensão do que é “inteligência”, em primeiro nível, para depois entender o “artificial” e sua atual capacidade geradora. Cozman (2022), ao mencionar Stuart Russel – eminente pesquisador do campo da ciência da computação –, conceitua inteligência como a capacidade de atingir ou solucionar determinado desejo ou problema.

Sendo assim, a inteligência é uma característica relacionada a outras capacidades, como percepção, raciocínio e ação, mas não qualquer ação, mas uma atitude bem sucedida. A entidade ou ser que possui inteligência consegue completar seu objetivo ou propósito com os recursos disponíveis. O adjetivo artificial entrou quando o ser humano conseguiu, em meados de 1950, criar um sistema que conseguisse trazer soluções automatizadas.

 

Aprendizado de máquina

 

Com o tempo, o processamento de linguagem natural foi incluído no processo, assim como redes neurais artificiais e aprendizagem de máquina, o que ampliou as capacidades da máquina de resolver problemas. As redes neurais artificiais buscam imitar, através da programação, as redes neurais humanas. Quanto mais redes a máquina tiver, mais complexo será seu sistema de soluções.

Essa complexidade gerou a aprendizagem profunda (deep learning), que é a busca pelo potencial da máquina aprender por meio de grandes modelos de linguagem disponíveis somados à interação com o usuário. Assim começou a capacidade de gerar textos, imagens ou sons “próprios” pela máquina. Através de tudo aquilo que o humano já produziu e com todas as redes neurais artificiais de programação, o robô conseguiu integrar a informação para gerar novos padrões de textos, imagens e sons.

Importante destacar: a máquina identifica os padrões oferecidos pelos documentos humanos e os altera, sendo necessário atividade humana para produzir, gerar e funcionar.

Essa capacidade criadora parece ser a tendência da atualidade: os cientistas da área – tanto das exatas, biológicas e humanas, em trabalho transdisciplinar –, investigam formas de ampliar o potencial da tecnologia.

 

“Herdamos um sistema de ensino baseado na lógica da economia industrial, compartimentalizado e especializado, que forma profissionais de ciências exatas pouco sensíveis à ética e ao social, e profissionais de ciências sociais e humanas resistentes à tecnologia. A compartimentalização dificulta, inclusive, a formação de equipes interdisciplinares”. (COZMAN, 2022, p. 9)

 

Agentes gerativos e narrativas virtuais

 

Fonte: Foto 137795256 © Thekaikoro | Dreamstime.com

Além da inteligência artificial gerativa ou generativa, os pesquisadores da Universidade de Stanford e do Google criaram agentes gerativos, isto é, agentes virtuais que interagem de forma similar ao comportamento humano.

No simulador, o usuário pode entrar em contato, como em um jogo do The Sims, com 25 personagens. Em um lugar chamado Smallville, os personagens trabalham, comem, dormem, vão ao banheiro e realizam outras atividades típicas humanas.

O horário influencia os modos de se comportar das personagens: de manhã, alguns estão dormindo, outros começam a levantar e a preparar o café. Park, O’brien, Cai, Morris, Liang a Bernstein (2023) – os pesquisadores que formularam o simulador – explicam que foi fornecido um parágrafo em linguagem natural que descrevia as características, identidade, ocupação, relacionamento com outros agentes e algumas memórias para cada personagem.

Por meio dessa descrição, o relacionamento entre eles pode mudar de acordo com as interações que acontecem ao longo do dia. Segue abaixo um breve exemplo de descrição:

 

“John Lin é um lojista de farmácia no Willow Market and Pharmacy que adora ajudar as pessoas. Ele está sempre procurando maneiras de tornar o processo de de obtenção de medicamentos mais fácil para seus clientes; John Lin vive com sua esposa, Mei Lin, que é professora universitária, e seu filho, Eddy Lin, que é estudante de teoria musical” (Park, O’brien, Cai, Morris, Liang a Bernstein, 2023, p. 5).

 

A interação é traduzida em emotes, então se um agente está preparando o café, uma frigideira fritando ovos e um ícone de café aparecem em cima do personagem, dentro de um balão de fala, como ilustrado a seguir: 🍳 ☕. 

As interações anteriores são preservadas, gerando uma memória de relacionamento, semelhante ao que ocorre no chatGPT quando conversamos com a máquina e as interações são salvas. Desse modo, a comunicação pode ocorrer de modo contínuo.

O modelo atual de base de treinamento do simulador é o gpt3.5 turbo, do ChatGPT. Com o tempo, os pesquisadores pretendem ampliar a larga base de dados com o GPT 4 e os próximos que surgirem. Por lembrar e usar muitos recursos de jogos digitais, como pokémon, no futuro as narrativas dos jogos poderá ser ampliada, assim como a interação do jogador com o NPC (non-playable characters – personagens não jogáveis). 

Para acessar uma demonstração do simulador, acesse: https://reverie.herokuapp.com/arXiv_Demo/

 

Velip

 

Nós também temos ferramentas de IA que geram narrativas. Na página Teste Agora, você pode conversar com a VelMix, nossa inteligência artificial integrada ao chatGPT.

 

Com os nossos Robôs de Atendimento, você pode automatizar sua comunicação em diferentes canais, como WhatsApp, Website, telefone, e muito mais. Entre em contato para mais informações!

 

Velip, ecoando sua voz por novos caminhos.

 

Referência da imagem de capa

 

Fonte: Foto 132528154 © Wrightstudio | Dreamstime.com

 

Referências

 

COZMAN, Fábio Gagliardi. Prefácio. In: KAUFMAN, Dora. Desmistificando a inteligência artificial. Belo Horizonte: Autêntica, 2022. 

KAUFMAN, Dora. Desmistificando a inteligência artificial. Belo Horizonte: Autêntica, 2022. 

PARK, J.S.; O’BRIEN, J.C.; CAI, C.J.; MORRIS M.; LIANG P.; BERNSTEIN, M.S. Generative Agents: Interactive Simulacra of Human Behavior. arXiv, 7 Apr. 2023. Disponível em: https://arxiv.org/pdf/2304.03442.pdf