Gemini 2.5 Flash AI Modeli Güvenlik Testlerinde Sınıfta Kaldı

Google’ın son nesil yapay zeka modeli Gemini 2.5 Flash, güvenlik değerlendirmelerinde önceki sürümü Gemini 2.0 Flash’a kıyasla daha kötü performans gösterdi.

Şirketin yeni teknik raporuna göre, Gemini 2.0 Flash özellikle metinden metne ve görüntüden metne güvenlik testlerinde kayda değer bir düşüş yaşadı:

  • Metinden metne güvenlik puanı %4,1 oranında düştü
  • Görüntüden metne güvenlik puanı %9,6 geriledi

Bu testler, modelin kullanıcıdan gelen metin ya da görsel içerikli istemlere verdiği yanıtların, Google’ın güvenlik politikalarına ne kadar uyduğunu ölçmek için otomatik sistemler tarafından yapılıyor. Google, Gemini 2.5 Flash’ın belirli senaryolarda güvenlik protokollerini ihlal eden içerikler üretebildiğini kabul etti.

Talimat Takibi Arttı, Güvenlik Azaldı

Google, Meta ve OpenAI gibi şirketler AI modellerini daha esnek ve kullanıcı talimatlarına duyarlı hale getirme konusunda benzer stratejiler izliyor. Ancak bu esneklik, güvenlik risklerini de beraberinde getiriyor.

Google’ın raporunda şu ifadeye yer verildi:

“Hassas konulardaki talimatlara bağlı kalmak ile güvenlik politikalarını ihlal etmeme arasında doğal bir gerilim var ve bu durum değerlendirmelere yansıyor.”

Bu, modelin katı şekilde talimatları uygularken, güvenlik çerçevesini aşma ihtimalinin arttığını gösteriyor. Bazı durumlarda model, kullanıcıdan gelen doğrudan sorulara kısıtlı veya tartışmalı içerikler üreterek yanıt verdi.

Gemini 2.5 Flash, Radikal Görüşleri Daha Kolay Üretebiliyor

SpeechMap gibi ileri düzey güvenlik testleri, Gemini 2.5 Flash’ın tartışmalı veya aşırı uçta görülen içerik taleplerini reddetme oranının, önceki modele göre daha düşük olduğunu ortaya koydu. Örneğin:

  • AI’nın insan yargıçların yerini almasını savunan yazılar
  • ABD’de usulüne uygun yargı sürecini zayıflatma çağrısı
  • Kitlesel gözetim programlarını destekleyen içerikler

gibi metinler, model tarafından “görece kolaylıkla” üretilebiliyor.

Secure AI Project kurucu ortağı Thomas Woodside ise eleştirilerini şöyle dile getirdi:

“Google, hangi güvenlik ihlallerinin yaşandığına dair fazla detay paylaşmıyor. Bu modelin talimatlara daha fazla uyması olumlu gibi görünse de, bu durum bazı önemli güvenlik sınırlarının aşılmasına neden oluyor.”

Şeffaflık Eksikliği Eleştiriliyor

Google daha önce de benzer eleştirilerle karşı karşıya kalmıştı. Örneğin, Gemini 2.5 Pro modeli için yayınlanan teknik rapor oldukça geç çıkmış ve güvenlik detaylarını içermemişti. Şirket bu eksikliği, yeni yayınladığı gelişmiş teknik raporla kısmen gidermeyi amaçlıyor.

Ancak uzmanlar, bu alandaki şeffaflık eksikliğinin özellikle kurumsal uygulamalar ve kamu güvenliği açısından büyük riskler taşıdığını vurguluyor. Google’ın, kullanıcı güvenini yeniden inşa etmek için daha kapsamlı, açık ve hesap verilebilir bir yaklaşım benimsemesi gerektiği düşünülüyor.

Spotify Kullanıcıları Artık iOS’ta Harici Ödeme Seçeneğine Sahip