Yönlendirici Uyarı İstemi

Li ve diğerleri., (2023) (opens in a new tab), LLM'nin istenen özeti oluşturmasını daha iyi yönlendiren yeni bir istem tekniği önerir.

Ayarlanabilir bir politika LM'i, uyarıyı/ipucunu oluşturmak üzere eğitilir. RL'nin, LLM'leri optimize etmek için daha fazla kullanıldığını görüyoruz.

Aşağıdaki şekil, Yönlendirici Uyarı İstemi'nin standart istem ile nasıl karşılaştırıldığını gösterir. Politika LM'i küçük olabilir ve bir siyah kutu dondurulmuş LLM'yi yönlendiren ipuçlarını oluşturmak üzere optimize edilebilir.

Resim Kaynağı: Li ve diğerleri., (2023) (opens in a new tab)

Tam örneği yakında gelecek!

Aktif-İstem Program-Aided Language Models