Öğretimle Ayarlanmış Dil Modellerini Ölçeklendirme
Yenilikler Neler?
Görsel Kaynağı: Talimatla İnce Ayarlama Ölçeklendirmesi (opens in a new tab)
Bu makale, talimatla ince ayarlama (opens in a new tab) ayarlama ölçeklendirmesinin faydalarını araştırır ve nasıl bir dizi modelde (PaLM, T5), istem ayarlama durumlarında (sıfır örnekli, az örnekli, CoT) ve ölçüm noktalarında (MMLU, TyDiQA) performansı arttırdığını analiz eder. Bu, aşağıdaki yönlerle incelenir: görevlerin sayısını ölçekleme (1.8K görev), model boyutunu ölçeklendirme ve düşünceyle bağlantılı verilerle ince ayarlama (kullanılan 9 veri seti).
İnce Ayarlama Süreci:
- 1.8K görev talimat olarak ifade edildi ve modeli ince ayarlamak için kullanıldı
- Hem örnekli hem de örneksiz, hem CoT'lu hem de CoT'suz kullanılır
İnce ayarlama görevleri ve bekleme modundaki görevler aşağıda gösterilmiştir:
Yetenekler & Ana Sonuçlar
- Talimatla ince ayarlama, görev sayısı ve model boyutu ile iyi bir şekilde ölçeklendirilir; bu, görev sayısını ve model boyutunu daha da ölçeklendirmenin gerekliliğini düşündürür
- CoT veri setlerini ince ayarlama sürecine dahil etmek, akıl yürütme görevlerinde iyi performans sağlar
- Flan-PaLM, çok dilli yetenekleri iyileştirdi; tek atışlık TyDiQA'da %14.9 oranında iyileşme; az temsil edilen dillerde aritmetik akıl yürütme üzerinde %8.1 iyileşme
- Plan-PaLM ayrıca açık uçlu jenerasyon sorularında da iyi performans gösterir, bu da kullanılabilirliğin iyileştirildiğine dair iyi bir göstergedir
- Sorumlu AI (RAI) ölçüm noktalarında performansı iyileştirir
- Flan-T5 talimatla ayarlanmış modeller güçlü az örnekli yetenekler gösterir ve T5 gibi genel kullanıma açık kontrol noktalarını aşar
İnce ayarlama görevlerinin sayısını ve model boyutunu ölçeklendirme sonuçları: model boyutunu ve ince ayarlama görevlerinin sayısını ölçeklendirmek, performansı iyileştirmeye devam etmesi beklenir, ancak görev sayısını arttırmanın azalan getirisi vardır.
Görsel Kaynağı: Öğretimle Ayarlanmış Dil Modellerini Ölçeklendirme (opens in a new tab)
CoT olmayan ve CoT verileriyle ince ayarlama sonuçları: Ortaklaşa, CoT olmayan ve CoT verileri üzerinde ince ayarlama yapıldığında, yalnızca birinde ince ayar yapmaya kıyasla her iki değerlendirmede de performans artar.
Görsel Kaynağı: Öğretimle Ayarlanmış Dil Modellerini Ölçeklendirme (opens in a new tab)
Ayrıca, kendine tutarlılık CoT ile birleştirildiğinde birkaç ölçüm noktasında SoTA sonuçları elde eder. CoT + kendine tutarlılık, ayrıca matematik problemleri içeren ölçüm noktalarında (örn., MGSM, GSM8K) sonuçları önemli ölçüde iyileştirir.
Görsel Kaynağı: Öğretimle Ayarlanmış Dil Modellerini Ölçeklendirme (opens in a new tab)
CoT'lu ince ayarlama, BIG-Bench görevlerinde "adım adım düşünelim" ifadesiyle aktive olan sıfır örnekli akıl yürütme yeteneğini kilidini açar. Genel olarak, sıfır örnekli CoT Flan-PaLM, ince ayarlama olmadan sıfır örnekli CoT PaLM'i aşar.
Görsel Kaynağı: Öğretimle Ayarlanmış Dil Modellerini Ölçeklendirme (opens in a new tab)
Aşağıda PaLM ve Flan-PaLM için sıfır örnekli CoT'nin görülmemiş görevlerdeki bazı uygulamaları bulunmaktadır.
Görsel Kaynağı: Öğretimle Ayarlanmış Dil Modellerini Ölçeklendirme (opens in a new tab)
Aşağıda daha fazla sıfır örnekli istem örneği bulunmaktadır. PaLM modelinin tekrarlarla ve sıfır örnekli ayarlarda talimatlara yanıt vermede zorlandığını gösterir; Flan-PaLM ise iyi bir performans sergiler. Az örnekli durumlar bu hataları hafifletebilir.
Görsel Kaynağı: Öğretimle Ayarlanmış Dil Modellerini Ölçeklendirme (opens in a new tab)
Aşağıda, Flan-PALM modelinin farklı türden zorlu açık uçlu sorulara yönelik daha fazla sıfır örnekli yeteneklerini gösteren bazı örnekler bulunmaktadır:
Görsel Kaynağı: Öğretimle Ayarlanmış Dil Modellerini Ölçeklendirme (opens in a new tab)
Görsel Kaynağı: Öğretimle Ayarlanmış Dil Modellerini Ölçeklendirme (opens in a new tab)
Görsel Kaynağı: Öğretimle Ayarlanmış Dil Modellerini Ölçeklendirme (opens in a new tab)
[Hugging Face Hub'daki Flan-T5 modellerini] deneyebilirsiniz. (https://huggingface.co/google/flan-t5-xxl (opens in a new tab)).