Cadeia-de-Pensamento Prompt
Cadeia-de-Pensamento (CoT) Prompting
Fonte da imagem: Wei et al. (2022) (opens in a new tab)
Introduzido em Wei et al. (2022) (opens in a new tab), a solicitação de cadeia de pensamento (CoT) permite recursos de raciocínio complexos por meio de etapas intermediárias de raciocínio. Você pode combiná-lo com prompts de poucos tiros para obter melhores resultados em tarefas mais complexas que exigem raciocínio antes de responder.
Prompt:
Os números ímpares neste grupo somam um número par: 4, 8, 9, 15, 12, 2, 1.
R: Somando todos os números ímpares (9, 15, 1) dá 25. A resposta é Falso.
Os números ímpares neste grupo somam um número par: 17, 10, 19, 4, 8, 12, 24.
R: Somando todos os números ímpares (17, 19) dá 36. A resposta é Verdadeiro.
Os números ímpares neste grupo somam um número par: 16, 11, 14, 4, 8, 13, 24.
R: Somando todos os números ímpares (11, 13) dá 24. A resposta é Verdadeiro.
Os números ímpares neste grupo somam um número par: 17, 9, 10, 12, 13, 4, 2.
R: Somando todos os números ímpares (17, 9, 13) dá 39. A resposta é Falso.
Os números ímpares neste grupo somam um número par: 15, 32, 5, 13, 82, 7, 1.
A:
Saída:
Somando todos os números ímpares (15, 5, 13, 7, 1) dá 41. A resposta é Falso.
Uau! Podemos ver um resultado perfeito quando fornecemos a etapa de raciocínio. Na verdade, podemos resolver essa tarefa fornecendo ainda menos exemplos, ou seja, apenas um exemplo parece suficiente:
Prompt:
Os números ímpares neste grupo somam um número par: 4, 8, 9, 15, 12, 2, 1.
R: Somando todos os números ímpares (9, 15, 1) dá 25. A resposta é Falso.
Os números ímpares neste grupo somam um número par: 15, 32, 5, 13, 82, 7, 1.
A:
Saída:
Somando todos os números ímpares (15, 5, 13, 7, 1) dá 41. A resposta é Falso.
Tenha em mente que os autores afirmam que esta é uma habilidade emergente que surge com modelos de linguagem suficientemente grandes.
Prompt COT Zero-Shot
Fonte da imagem: Kojima et al. (2022) (opens in a new tab)
Uma ideia recente que surgiu mais recentemente é a ideia de zero-shot CoT (opens in a new tab) (Kojima et al. 2022) que envolve essencialmente adicionar "Vamos pensar passo a passo" para a solicitação original. Vamos tentar um problema simples e ver como o modelo funciona:
Prompt:
Fui ao mercado e comprei 10 maçãs. Dei 2 maçãs ao vizinho e 2 ao reparador. Então fui comprar mais 5 maçãs e comi 1. Com quantas maçãs fiquei?
Saída:
11 maçãs
A resposta está incorreta! Agora vamos tentar com o prompt especial.
Prompt:
Fui ao mercado e comprei 10 maçãs. Dei 2 maçãs ao vizinho e 2 ao reparador. Então fui comprar mais 5 maçãs e comi 1. Com quantas maçãs fiquei?
Vamos pensar passo a passo.
Saída:
Primeiro, você começou com 10 maçãs.
Você deu 2 maçãs para o vizinho e 2 para o reparador, então você tinha 6 maçãs sobrando.
Então você comprou mais 5 maçãs, então agora você tinha 11 maçãs.
Finalmente, você comeu 1 maçã, então ficaria com 10 maçãs.
É impressionante que esse prompt simples seja eficaz nessa tarefa. Isso é particularmente útil onde você não tem muitos exemplos para usar no prompt.