Haber

Anthropic, Geliştirilmiş Dürüstlük Özellikleriyle Claude Opus 4.8'i Yayınladı

Anthropic, şirketin önceki sürümlere kıyasla önemli ölçüde daha "dürüst" olduğunu konumlandırdığı yeni bir yapay zeka modeli olan Claude Opus 4.8'i yayınladı.

Şirketin hedeflediği temel sorun, yapay zeka sistemlerinde iyi belgelenmiş bir sorun: Sonuçlara acelece varmak ve altında yatan kanıt zayıf olsa bile çıktıları kesin bir şekilde olgu olarak sunma eğilimi. Anthropic'e göre, şirket modellerini her zaman "dürüst olmaya" eğitti ve kanıtlarla desteklenemeyecek şeyleri söylemekten kaçınma talimatları da buna dahil.

Erken test kullanıcıları, Opus 4.8'in önceki modellere kıyasla kendi çalışmalarındaki belirsizlikleri işaret etme olasılığının daha yüksek olduğunu, belirsiz sonuçları kesin cevaplar olarak sunmak yerine bu belirsizlikleri ifade etmeyi tercih ettiğini bildirdi. Anthropic'in dahili değerlendirmelerinde, yeni model desteklenmeyen iddialarda bulunma olasılığı açısından selefine kıyasla yaklaşık dört kat daha düşük performans gösteriyor.

Şirket bu iyileştirmenin arkasındaki spesifik teknik değişiklikleri açıklamasa da, yayın, büyük dil modellerinin en kalıcı eleştirilerinden biri olan hakikat yanılsaması ve aşırı özgüvenli iddialar eğilimini ele almaya yönelik devam eden çabaları temsil ediyor.

Kaynaklar