Yapay zeka alanında rekabet eden en büyük iki model, bu kez satranç tahtasında karşı karşıya geldi. OpenAI tarafından geliştirilen o3, Elon Musk’ın xAI şirketine ait Grok 4 modeline karşı oynanan final maçında 4-0’lık net bir galibiyet aldı.

OpenAI, satranç alanında liderliğini ilan etti

Karşılaşma, Kaggle AI Exhibition Turnuvası’nın finalinde gerçekleşti. Turnuvaya Google, Anthropic, DeepSeek ve Moonshot AI gibi başka önemli şirketlerin modelleri de katıldı. o3 ve Grok 4, tüm rakiplerini eleyerek finale kaldı.

Turnuva, yapay zekaların yalnızca dil üretiminde değil, aynı zamanda stratejik düşünme, mantık yürütme ve planlama gibi bilişsel alanlarda da doğrudan test edildiği ilk büyük yarışma oldu. Final maçının ardından o3 altın, Grok 4 gümüş, Google Gemini 2.5 Pro ise bronz madalya aldı.

Yarışma, yalnızca bir oyun müsabakası olmanın ötesinde iki eski ortağın dolaylı rekabetine de sahne oldu. Sam Altman ve Elon Musk, 10 yıl önce OpenAI’ı birlikte kurmuştu. Ancak Musk daha sonra şirketten ayrıldı ve xAI adında yeni bir yapay zeka girişimi başlattı.

İkilinin arası zamanla açıldı. Musk, kısa süre önce OpenAI’ı satın alma girişiminde bulundu, Altman ise bu girişimi “zorbalık” olarak nitelendirdi. Bu gerilimli geçmiş, modellerin satranç arenasındaki karşılaşmasına ayrı bir önem kazandırdı.

Turnuva sonrası yapılan değerlendirmelerde dünya satranç şampiyonu Magnus Carlsen, Grok 4’ün reytingini yaklaşık 800, o3’ünkünü ise 1200 civarında tahmin etti. Carlsen’in en yüksek reytingi 2882 seviyesinde bulunuyor.

iPhone için GPT 5 müjdesi

iPhone için GPT 5 müjdesi


OpenAI’ın yeni modeli GPT 5, iOS 26 güncellemesi ile iPhone’a gelecek. Apple yapay zekayı GPT 5’e emanet edecek gibi görünüyor.

Carlsen, geçtiğimiz temmuz ayında ChatGPT’ye karşı oynadığı bir maçta hiç taş kaybetmeden galip gelmişti. Final maçlarını yorumlayan bir diğer isim ise satranç büyükustası Hikaru Nakamura oldu. Grok’un daha önce bir X kullanıcısına verdiği yanıtta kendisini 1600-1800 aralığında değerlendirdiği bilgisi, performansla örtüşmedi.

Kaggle tarafından düzenlenen turnuva, Google DeepMind işbirliğiyle kurulan Game Arena platformunun bir parçası olarak gerçekleşti. Bu platformda yapay zeka modelleri yalnızca satrançta değil, Go gibi daha karmaşık masa oyunları ve takım tabanlı dijital strateji oyunlarında da test edilecek. Amaç, yapay zekaların stratejik düşünme, mantık yürütme, bellek yönetimi, rakibin niyetini okuma ve aldatma gibi yeteneklerini ölçmek.

Tüm maçlar Kaggle’ın açık kaynaklı oyun ortamlarında ve yalnızca yazılı hamlelerle oynanan özel bir sistem olan “text harness” aracılığıyla gerçekleşiyor. Modeller satranç motorlarına erişemiyor, olası hamle seçenekleri sunulmuyor ve hatalı hamlelerde sınırlı sayıda düzeltme hakkı tanınıyor.

Bu sistem, büyük dil modellerinin salt veriye değil, gerçek zamanlı strateji ve analiz becerilerine dayalı performansını değerlendirmek için oluşturuldu.



Source link