Çok Modlu CoT İstemi

Çok Modlu CoT İstemi

Zhang ve diğerleri (2023) (opens in a new tab) yakın zamanda bir çok modlu düşünce zinciri istemleme yaklaşımı önerdi. Geleneksel CoT dil modalitesine odaklanır. Buna karşın, Çok Modlu CoT metni ve görüntüyü iki aşamalı bir çerçeve içine alır. İlk adım, çok modlu bilgilere dayalı olarak mantıklı bir dayanak oluşturmaktır. Bunu, bilgi içeren üretilmiş dayanakları kullanmanın avantajlarından yararlanan ikinci aşama, yanıt çıkarımı, takip eder.

Çok modlu CoT modeli (1B), ScienceQA benchmark'ında GPT-3.5'ı geride bırakır.

MCOT

Görüntü Kaynağı: Zhang ve diğerleri (2023) (opens in a new tab)

Daha fazla bilgi için: