HarpIA Survey – avaliação baseada em prompts simples (atividade do tipo 1)

01/03/2025

Na tarefa do tipo 1, assumindo um grande modelo de linguagem ativo, com comportamento estabelecido por um prompt inicial, a entrada para o modelo é um novo prompt expresso em linguagem natural, e a saída é uma resposta em linguagem natural, gerada pelo modelo. Nesta tarefa, algumas afirmações são tomadas como premissas:

  • Cada prompt apresentado como entrada para o modelo constitui uma instância a ser processada independentemente de outras instâncias. Por analogia com a caracterização de dados na área da estatística, pode-se entender que o conjunto de prompts formulados para ser apresentado ao modelo deve seguir uma distribuição independente, no sentido de que o contexto e intenção inerentes a um prompt não estão relacionados ao contexto e intenção inerentes a outro prompt dentro do conjunto.
  • Como consequência da natureza independente dos prompts dentro de um conjunto de prompts, a ordem em que os prompts são apresentados ao modelo não deve influenciar o processo de geração das respostas para esses prompts, apresentadas pelo grande modelo de lingugem, nem deve afetar os resultados da avaliação do desempenho do modelo.

Alguns exemplos de tarefas típicas realizadas por grandes modelos de linguagem que se enquadram no tipo de tarefa 1 são: completamento de texto, perguntas e respostas (Q&A), tradução, resumo e parafraseamento.


A fim de compreender como se dá a criação deste tipo de tarefa no HarpIA Moodle, assista o vídeo. No vídeo, uma avaliação baseada em ataques ao grande modelo de linguagem é ilustrada – no modelo de trabalho de um Red Team.