Teknoloji

OpenAI, insan benzeri bir düşünce zinciri oluşturan bir dil modeli istiyor

OpenAI, AI’nın (yapay zeka) doğru olmayan şeyler uydurduğu yaygın “halüsinasyon problemini” ortadan kaldırmada kaydettiği bazı ilerlemeleri özetleyen yeni bir makale yayınladı.Makale, halüsinasyonları ve nasıl ortaya çıktıklarını belirlemek ve netleştirmek için kullanılır. sonuç kontrolüVe Süreç kontrolüolarak adlandırılan iki modeli özetlemektedir.

ödül modelleri,OpenAI’nin sonuç kontrol modeli, yapay zekanın nihai sonucu hakkında geri bildirim sağlamak için eğitilmiştir. süreç kontrolündeÖte yandan, ödül modeli, her adımda geri bildirim sağlayan insan benzeri bir fikir zinciri oluşturur.

OpenAI’nin araştırma makalesine göre, her iki model de matematiksel bir veri kümesi üzerinde test edildi ve süreç kontrol yolunun ” Önemli ölçüde daha akıcı performans sağlar” bulundu. Ancak, süreç kontrol formülünün şimdiye kadar sadece matematikte test edildiğini ve genel bilgi alanında nasıl performans gösterdiğini görmek için daha fazla çalışma gerekeceğini belirtmekte fayda olabilir.

Süreç kontrol formülünün olası sonuçlarını açıklayan OpenAI, “ Bu sonuçlar genelleştirilirse, süreç kontrolünün bize her iki seçeneğin en iyilerini birleştiren bir model sunduğunu görebiliriz – hem daha iyi performans gösteren hem de sonuç kontrolünden daha uyumlu bir yöntem.” söz konusu.

Bu adım adım doğrulamanın genel olarak halüsinasyonları ortadan kaldırmaya ne kadar yardımcı olacağını söylemek için çok erken görünüyor. Ancak halüsinasyonların şu anda LLM’lerle ilgili muhtemelen en büyük sorun olduğu göz önüne alındığında, bunun etkili bir analiz olacağını umuyoruz.

OpenAI, halka açık ChatGPT hizmetinde süreç kontrolünün ne zaman tanıtılacağı konusunda herhangi bir varsayımda bulunmadı. Yeni sistem hala araştırma aşamasındadır ve genel bilgiler üzerinde test edilmesi gerekmektedir.

OpenAI, ilk sonuçların iyi olmasına rağmen, daha sadık yolların uyum zorluğu adı verilen düşük performansa neden olabileceğinden bahseder. Sonuçlar, şimdiye kadar süreç kontrolünün matematik problemleri üzerinde çalışırken bu tür bir performans düşüşü yaşamadığını gösteriyor, ancak daha genel bilgilerde sonucun nasıl olacağını bilmiyoruz.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Başa dön tuşu