Directional Stimulus Prompting
Li и др., (2023) (opens in a new tab) предлагают новую технику формулировки запросов для более эффективного направления работы LLM при генерации желаемого саммари.
Обучается настраиваемая модель языковой политики для генерации стимулов/подсказок. Заметно увеличение использования обучения с подкреплением для оптимизации LLM.
На приведенном ниже изображении показано сравнение направленной стимулирующей формулировки запросов с обычной. LM может быть небольшой и оптимизирована для генерации подсказок, направляющих работу черного ящика LM.
Источник изображения: Li и др., (2023) (opens in a new tab)
Полный пример скоро будет представлен!