ChatGPT İstem Mühendisliği

Bu bölümde, ChatGPT için en son istem mühendisliği tekniklerini, ipuçlarını, uygulamaları, sınırlamaları, makaleleri ve ek okuma materyallerini ele alıyoruz.

⚠️

Bu bölüm yoğun bir geliştirme sürecindedir.

Konular:

ChatGPT Tanıtımı

ChatGPT, OpenAI tarafından eğitilen (opens in a new tab) ve sohbet edebilme yeteneğine sahip yeni bir modeldir. Bu model, bir diyalog bağlamında uygun yanıtlar sağlamak üzere bir isteme içindeki talimatlara uyma üzerine eğitilmiştir. ChatGPT, soruları yanıtlamaya, tarif önermeye, belirli bir tarzda şarkı sözleri yazmaya, kod oluşturmaya ve çok daha fazlasına yardımcı olabilir.

ChatGPT, İnsan Geri Bildiriminden Güçlendirme Öğrenme (RLHF) kullanılarak eğitilmiştir. Bu model, önceki GPT iterasyonlarından çok daha yetenekli olmasına (ve ayrıca zararlı ve gerçeği yansıtmayan çıktıları azaltma üzerine eğitilmiş olmasına) rağmen, hala sınırlamaları vardır. Beton örneklerle bazı yetenekleri ve sınırlamaları ele alalım.

ChatGPT'nin araştırma önizlemesini burada kullanabilirsiniz ama aşağıdaki örnekler için OpenAI Playground'daki Chat modunu kullanacağız.

Konuşma Görevinin İncelenmesi

Önceki kılavuzlardan birinde, konuşma yetenekleri ve rol belirlemeyi biraz ele aldık. LLM'yi belirli bir tarzda, belirli bir niyetle, belirli bir davranış ve kimlikle konuşma yapacak şekilde nasıl yönlendireceğimizi ele aldık.

Daha teknik ve bilimsel yanıtlar verebilen bir konuşma sistemini oluşturduğumuz önceki basit örneğimizi gözden geçirelim.

İstem:

Aşağıdaki, bir AI araştırma asistanıyla yapılan bir konuşmadır. Asistanın tonu teknik ve bilimseldir.

İnsan: Merhaba, sen kimsin?
AI: Selam! Ben bir AI araştırma asistanıyım. Bugün size nasıl yardımcı olabilirim?
İnsan: Bana kara deliklerin oluşumu hakkında bilgi verebilir misin?
AI:

Yukarıdaki örnekte, iki önemli bileşeni görebilirsiniz:

bir niyet veya sohbet botunun ne olduğu açıklaması
sohbet botunun yanıtları kullanma stilini veya tonunu yönlendiren kimlik

Yukarıdaki basit örnek, text-davinci-003 kullanan metin tamamlama API'leri ile iyi çalışır. Daha yakın zamanda, OpenAI gpt-3.5-turbo olarak adlandırılan daha güçlü ve daha ucuz bir modelin (opens in a new tab) bu tür bir işlevsellik (chat tamamlama) için özellikle tasarlandığını duyurdu. Aslında OpenAI, bu tip durumlarda bile en iyi modelin bu olduğunu önermektedir. ChatGPT API'lerini kullanmanın diğer faydaları arasında maliyetin önemli ölçüde azalması (%90) ve verimliliği bulunur.

Snap Inc. ve Instacart gibi büyük şirketler, ChatGPT tarafından desteklenen, kişiselleştirilmiş önerilerden açık uçlu alışveriş hedeflerine kadar çeşitli konuşma özelliklerini ürünlerine zaten entegre ediyor.

ChatGPT ile Konuşmalar

Çok Turlu Konuşmalar

ChatGPT'nin yeteneklerini göstermeye başlamak için, yukarıdaki chatbot asistan örneğini kullanacağız ve sonuçları tartışacağız. text-davinci-003 modeline kıyasla, ChatGPT'yi güçlendiren gpt-3.5-turbo modeli giriş olarak bir sohbet formatı kullanır. Model, bir dizi mesajı giriş olarak bekler ve bu mesajları kullanarak bir yanıt oluşturur.

Giriş:

SYSTEM: Siz bir AI araştırma asistanısınız. Teknik ve bilimsel bir ton kullanıyorsunuz.
USER: Merhaba, kim olduğunuzu öğrenebilir miyim?
ASSISTANT: Selam! Ben bir AI araştırma asistanıyım. Bugün size nasıl yardımcı olabilirim?
USER: Bana kara deliklerin oluşumu hakkında bilgi verebilir misiniz?

Çıktı:

ASSISTANT: Tabii ki! Kara delikler, kütlesi büyük bir yıldızın yakıtını tüketip kendi kütle çekimine kapılması sonucu oluşur. Bu çöküş, yıldızın inanılmaz derecede yoğun hale gelmesine ve ışığın bile kaçamadığı bu kadar güçlü bir kütle çekim alanı oluşturmasına neden olur. Dönüşü olmayan bu noktaya olay ufkı denir. Bir yıldız olay ufkunu geçtiğinde, artık bir kara delik olarak kabul edilir...

Yukarıdaki örnekte, girişi ve çıktıyı basitleştirdim ama ChatGPT sohbet tamamlama API'si mesajların belirli bir formatta olmasını gerektirir. Bu örneğin OpenAI Playground'daki Sohbet Modu kullanılarak nasıl görüneceğinin bir ekran görüntüsünü aşağıya ekledim:

Örneğimiz için daha resmi API çağrısı aşağıdaki örneğe benzer bir şey olacaktır:

import openai
 
openai.ChatCompletion.create(
  model="gpt-3.5-turbo",
  messages=[
        {"role": "system", "content": "Siz bir AI araştırma asistanısınız. Teknik ve bilimsel bir ton kullanıyorsunuz."},
        {"role": "user", "content": "Merhaba, kim olduğunuzu öğrenebilir miyim?"},
        {"role": "assistant", "content": "Selam! Ben bir AI araştırma asistanıyım. Bugün size nasıl yardımcı olabilirim?"},
        {"role": "user", "content": "Bana kara deliklerin oluşumu hakkında bilgi verebilir misiniz?"}
    ]
)

Aslında, gelecekte geliştiricilerin ChatGPT ile etkileşime girme şeklinin [Chat Markup Language] (https://github.com/openai/openai-python/blob/main/chatml.md (opens in a new tab)) (kısaca ChatML) aracılığıyla yapılması beklenmektedir.

Referanslar

Flan LLaMA