OpenAI ve Google DeepMind, Uluslararası Matematik Olimpiyatı’nda Altın Madalya Kazandı

Yapay zekâ artık yalnızca sohbet etmekle kalmıyor, zorlu matematik problemlerini de çözebiliyor. OpenAI ve Google DeepMind, Uluslararası Matematik Olimpiyatı’nda (IMO) yarışma koşullarında gösterdikleri performansla altın madalya seviyesine ulaştı. Üstelik bu başarı, ilk kez tamamen doğal dilde verilen sorularla sağlandı.

Zorlu sınavda insan koşullarında test edildiler

IMO, dünyanın dört bir yanından lise öğrencilerinin katıldığı, en prestijli ve zorlayıcı matematik yarışmalarından biri olarak kabul ediliyor. Katılımcılar iki güne yayılan sınavda, her biri 4,5 saat süren oturumlarda toplam altı problemi çözmeye çalışıyor.

Google DeepMind ve OpenAI, bu yıl ilk kez, herhangi bir ön işleme gerek kalmadan, doğrudan doğal dilde verilen sorularla bu yarışmada test edildi. Önceki yıllarda, sorular insanlar tarafından makineye uygun formatlara dönüştürülmek zorundaydı. Bu yıl ise modeller, insanlarla aynı şartlarda yarıştı.

Gemini ve Strawberry ile altın başarı

Google DeepMind, matematik alanına özel olarak geliştirilen Gemini with Deep Think modelini kullandı. Bu model, yalnızca doğrusal bir düşünce zinciri yerine, birden fazla çözüm yolunu paralel değerlendirerek 35 puan toplamayı başardı – bu da altın madalya düzeyine denk geliyor.

OpenAI cephesi de boş durmadı. Sosyal medya platformu X üzerinden yapılan açıklamada, kendi modellerinin de 35 puanla altın madalya seviyesine ulaştığı belirtildi. Ayrıca OpenAI araştırmacısı Alexander Wei, sonuçları ayrıntılı biçimde yayımladı. Wei’nin paylaşımında bir çilek emojisi dikkat çekti. Geçmişte OpenAI’nin matematik yetenekleri güçlü bir model üzerinde çalıştığı ve bu modele “Strawberry” adını verdiği biliniyordu.

DeepMind CEO’sundan eleştiri geldi

DeepMind CEO’su Demis Hassabis, OpenAI’nin bu duyuruyu resmi IMO sonuçları açıklanmadan önce yapmasını eleştirdi. Hassabis’e göre, öğrencilerin emeklerine gölge düşürülmemesi adına sonuçlar bağımsız uzmanlarca incelendikten sonra açıklanmalıydı.

AGI yolunda önemli bir adım

Matematik, genel yapay zekânın (AGI) geliştirilmesinde kritik bir alan olarak görülüyor. Karmaşık problemleri çözebilme, mantık yürütme ve farklı yöntemlerle sonuca ulaşabilme yetileri, bu alandaki ilerlemeleri daha da anlamlı kılıyor. Bu sonuçlar, yapay zekânın eğitim, bilim ve araştırma alanlarında insan seviyesine yaklaşmaya başladığını gösteriyor.

yapay zekâ matematik olimpiyatı
“OpenAI ve Google DeepMind, Matematik Olimpiyatı’nda altın madalya seviyesinde başarı elde etti.”

Her iki şirket de, modellerinin eğitiminde özenle seçilmiş matematiksel problem setleri ve çözümlerden faydalandıklarını belirtiyor. Henüz insanları tamamen geçememiş olsalar da, elde edilen sonuçlar yapay zekânın sınırlarını zorladığını açıkça ortaya koyuyor.