Yapay zeka dünyasında rekabet: Claude-3 vs ChatGPT-4

Son Güncelleme:

OpenAI'ın GPT-4 tabanlı modeli, Anthropic tarafından geliştirilen Claude-3 Opus modelinin gerisinde kaldı. LMSys Chatbot Arena Leaderboard'a göre Claude-3 Opus, en yüksek puanı alarak liderlik koltuğuna oturdu. İşte en iyi yapay zeka modelleri listesi ve Claude Opus'un rekor kırması.

Yapay zeka dünyasında kıyasıya rekabet devam ediyor. OpenAI'ın GPT-4 tabanlı modeli son zamanların en güçlü modeli olarak gösterilse de, yeni testler bunun geride kaldığını ortaya koydu. Peki en iyi yapay zeka modeli hangisi?


Claude-3 vs ChatGPT-4: En iyi yapay zeka modeli


Yapay zeka sistemlerinin performansını takip eden LMSys Chatbot Arena Leaderboard, Anthropic tarafından geliştirilen Claude-3 Opus modelinin en yüksek puan aldığını ortaya koydu. Bu da uzun yıllardır lider olan GPT-4'ün geride kaldığını gösteriyor.

Liderlik Tablosu, "sohbet savaşları" sırasında jüriler tarafından değerlendirildi. Farklı konulardan çeşitli komutlar girerek sohbet botlarını test eden jüriler, karşılaştırma için Elo derecelendirme sistemini kullandı.


23342342342


Claude-3 Opus, son derecelendirme güncellemesinde 1253 Elo puanıyla zirveye yerleşti. İkinci ve üçüncü sırada ise sırasıyla 1251 ve 1248 puanlarıyla OpenAI GPT-4 önizleme modelleri yer aldı.


Sıralamanın geri kalanında ise Google Gemini Pro modeli 1203 puanla dördüncü, Anthropic'in daha önceki Claude-3 Sonnet modeli 1198 puanla beşinci oldu. Ayrıca Çinli şirket Alibaba'nın Qwen1.5 modeli ise 1148 ile dokuzuncu sırada yer aldı.


İşte en iyi yapay zeka modeli listesi:


Claude 3 Opus – 1253


GPT-4-1106-preview – 1251


GPT-4-0125-preview – 1248


Bard (Gemini Pro) – 1203


Claude 3 Sonnet – 1196


GPT-4-0314 – 1193


Claude 3 Haiku – 1181


GPT-4-0613 – 1174


Mistral-Large-2402 – 1153


Qwen1.5-72B-Chat – 1153


GPT-4 geçen yıl piyasaya sürüldüğünde oldukça yüksek bir standart belirlemişti. Ancak Anthropic geliştiricileri, model eğitimlerinde GPT-4'ü aşmayı başarmış gibi duruyor. Claude Opus, sohbet savaşında +5/-5'lik skor elde ederek rekor da kırdı.

Kaynak: Shiftdelete