Agentes conversacionais

17/05/2024

Imagem gerada por IA (Copilot)

Agentes conversacionais são, talvez, a principal aplicação para um modelo de linguagem. Ao menos no contexto do uso popular, os agentes conversacionais permitem expressar com plenitude a capacidade de processamento de linguagem natural da inteligência artificial quando implementado a partir de modelos de linguagem.

Do ponto de vista computacional, agentes conversacionais são sistemas de alta complexidade. Esses sistemas precisam ter a capacidade interpretar e gerar enunciados em linguagem natural que considerem o fluxo de uma conversa, ou seja, precisam lidar com histórico, intenções, fluidez do discurso e, para serem de fato interessantes, precisam expressar algum tipo de personalidade.

Historicamente, os agentes conversacionais têm sido estudados dentro da inteligência artificial a partir de diferentes pontos de vista e implementados com diferentes recursos teóricos. Por conta do advento dos grandes modelos de linguagem e sua respectiva competência para lidar com a língua natural, atualmente os agentes conversacionais são fortemente baseados nessa tecnologia.

O grupo KEML estuda os agentes conversacionais há algum tempo. O grupo teve sua pesquisa iniciada a partir da proposição do agente BLAB (Blue Amazon Brain), em 2020. O projeto original era construir um agente conversacional capaz de interagir com usuários trazendo informação e resolução de problemas associados ao domínio da costa brasileira – chamada de Amazônia Azul pela Marinha do Brasil. Neste contexto, o grupo desenvolveu uma arquitetura de um agente conversacional dotado de várias capacidades. No ciclo evolutivo desse agente conversacional, um módulo de orquestração foi implementado para tomada de decisão sobre que funcionalidade do agente deveria ser acionada em determinados contextos da conversa sobre a Amazônia Azul.

Atualmente, o grupo KEML se dedica à produção de agentes conversacionais ou sistemas relacionados (como Question & Answering Systems) baseados em grandes modelos de linguagem associados a estruturas baseadas em conhecimento. A ideia é propor diferentes estilos de agentes conversacionais que possam servir como base para teste de grandes modelos de linguagem associados a mecanismos de representação de conhecimento, como grafos de conhecimento e ontologias.

Os resultados associados à pesquisa em agentes conversacionais estão representados principalmente pelos sistemas e recursos:

  • BLAB (Blue Amazon Brain): um sistema que conta com uma interface de diálogo suportada por uma arquitetura de orquestração para uso de diferentes mecanismos respondedores de perguntas em um contexto de produção de diálogo.
  • Blabinha: um sistema orientado à tarefa e à domínio, também voltado para a exploração de conteúdo sobre a Amazônia Azul, porém constituindo-se de um diálogo gameficado suportado por modelos de linguagem da família GPT e por engenharia de prompt.
  • Cocoruta (sistema): um Question & Answering  System orientado ao domínio da Amazônia Azul e baseado em documentos legais (leis, regulamentações, portarias, decretos, projetos de lei etc).
  • Cocoruta (corpus): um conjunto de documentos legais composto por cerca de 200.000 documentos extraídos de repositórios oficiais brasileiros, organizado via uma hierarquia de metadados e formato para processamento computacional.
  • Cocoruta (conjunto de dados de perguntas e respostas): um conjunto de perguntas e respostas construído sobre o corpus Cocoruta, via aplicação de um grande modelo de linguagem (GEMINI).
  • Pirá: um conjunto de perguntas e respostas bilingue, construído e avaliado por trabalho humano, sobre um corpus de resumos de artigos científicos e trechos de relatório da ONU respectivamente sobre a Amazônia Azul e o Oceano Global.

Conheça um pouco mais ….

    • Pirozelli, P.; José, M. M.; Silveira, I. C.; Nakasato, F.; Peres, S. M.; Brandão, A. A. F.; Costa, A. H. R.; Cozman, F. G. Benchmarks for Pirá 2.0, a Reading Comprehension Dataset about the Ocean, the Brazilian Coast, and Climate Change. In the Data Intelligence (MIT Press Direct 2024), 2024. v.6. p.29-63. https://doi.org/10.1162/dint_a_00245
    • Matos, V. B.; Grava, R.; Tavares, R.; José, M. M.; Pirozelli, P.; Brandão, A. A. F.; Peres, S. M.; Cozman, F. G. Coordination within Conversational Agents with Multiple Sources. In Proceedings of the 20th Nacional Meeting on Artificial and Computational Intelligence, (ENIAC 2023), Belo Horizonte, 2023. p. 939-953. ISSN 2763-9061. https://doi.org/10.5753/eniac.2023.234533
    • Outras publicações aqui!