Directional Stimulus Prompting

Li и др., (2023) (opens in a new tab) предлагают новую технику формулировки запросов для более эффективного направления работы LLM при генерации желаемого саммари.

Обучается настраиваемая модель языковой политики для генерации стимулов/подсказок. Заметно увеличение использования обучения с подкреплением для оптимизации LLM.

На приведенном ниже изображении показано сравнение направленной стимулирующей формулировки запросов с обычной. LM может быть небольшой и оптимизирована для генерации подсказок, направляющих работу черного ящика LM.

Источник изображения: Li и др., (2023) (opens in a new tab)

Полный пример скоро будет представлен!

Active-Prompt Program-Aided Language Models