Jannah Theme License is not validated, Go to the theme options page to validate the license, You need a single license for each domain name.
Teknoloji

Alibaba, Qwen2.5-Max ile yapay zekâ dünyasında çığır açıyor: GPT-4’ü geçti

Alibaba, yeni yapay zekâ modeli Qwen2.5-Max’i duyurdu. Yapay zekâ dünyasında dikkat çeken bu model, girdiği testlerde DeepSeek V3 ve GPT-4 üzere rakiplerini geride bırakarak kıymetli bir muvaffakiyete imza attı. Çinli teknoloji devi Alibaba, Qwen2.5-Max ile AI alanındaki tezli seyahatini sürdürüyor.

QWEN2.5-MAX’İN TEST SONUÇLARI VE PERFORMANSI

Qwen2.5-Max, Arena-Hard testinde birinci, LiveBench testinde ise tüm rakiplerini geride bırakarak üstün performans sergiledi. MMLU-Pro testinde üçüncülük, GPQA-Diamond ve LiveCodeBench testlerinde ise ikinci sırada yer aldı. Bu sonuçlar, modelin insan gibisi düşünme yeteneğiyle ön plana çıktığını gösteriyor.

ÇİNLİ YAPAY ZEKÂ TEŞEBBÜSÜ DEEPSEEK VE GPT-4’E KARŞI BAŞARI

Alibaba, Qwen2.5-Max’in DeepSeek-V3, GPT-4 ve Llama-3.1-405B üzere rakip modelleri geride bırakmasının akabinde, Çin’deki tatil devrine denk gelen bu duyuruyu gerçekleştirdi. Qwen2.5-Max, insan tercihlerine yönelik yapılan Arena-Hard testinde, rakiplerinden daha güzel sonuçlar alarak bu alandaki üstünlüğünü kanıtladı.

QWEN2.5-MAX: GERÇEK KULLANIMDA NE SUNUYOR?

Alibaba, Qwen2.5-Max’i Owen Chat arayüzü üzerinden kullanıcılara sunmuş durumda. Yeni yapay zekâ modelinin gerçek kullanımda sunduğu performansı ise vakitle kullanıcılar tarafından yapılacak testler ortaya koyacak.Alibaba, yeni yapay zekâ modeli Qwen2.5-Max’i duyurdu. Yapay zekâ dünyasında dikkat çeken bu model, girdiği testlerde DeepSeek V3 ve GPT-4 üzere rakiplerini geride bırakarak kıymetli bir muvaffakiyete imza attı. Çinli teknoloji devi Alibaba, Qwen2.5-Max ile AI alanındaki tezli seyahatini sürdürüyor.

QWEN2.5-MAX’İN TEST SONUÇLARI VE PERFORMANSI

Qwen2.5-Max, Arena-Hard testinde birinci, LiveBench testinde ise tüm rakiplerini geride bırakarak üstün performans sergiledi. MMLU-Pro testinde üçüncülük, GPQA-Diamond ve LiveCodeBench testlerinde ise ikinci sırada yer aldı. Bu sonuçlar, modelin insan gibisi düşünme yeteneğiyle ön plana çıktığını gösteriyor.

İlgili Makaleler

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Başa dön tuşu