Google, amiral gemisi yapay zekâ modeli Gemini’nin son dönemde yoğun “distillation” yani model çıkarımı saldırılarıyla karşı karşıya kaldığını açıkladı. Şirkete göre bazı ticari aktörler, sistemi tekrar tekrar sorgulayarak iç mantığını çözmeye çalıştı. Hatta tek bir kampanyada Gemini’ye 100 binden fazla farklı istem (prompt) gönderildiği belirtildi.
Gemini Model Extraction Saldırıları Ne Anlama Geliyor?
Google’ın paylaştığı rapora göre saldırganlar, sohbet botunu binlerce farklı soruyla test ederek modelin nasıl akıl yürüttüğünü, hangi kalıplarla yanıt ürettiğini ve hangi mantıksal yapıyı kullandığını anlamaya çalışıyor. Bu yönteme “model extraction” deniyor. Amaç ise elde edilen çıktılar üzerinden benzer ya da daha güçlü bir yapay zekâ sistemi geliştirmek.
Şirket, bu girişimleri açık şekilde fikri mülkiyet hırsızlığı olarak değerlendiriyor. Google Tehdit İstihbarat Grubu’ndan John Hultquist, bu tür saldırıların yalnızca büyük modelleri değil, ilerleyen dönemde özel veriyle eğitilmiş kurumsal yapay zekâ sistemlerini de hedef alabileceğini söyledi. Özellikle ticari sırlar içeren özel LLM’lerin benzer risklerle karşılaşabileceği vurgulanıyor.
Gemini İçin Küresel Rekabet Kızışıyor
Google, saldırıların dünyanın farklı bölgelerinden geldiğini düşünüyor ancak spesifik kişi ya da şirket ismi paylaşmadı. Yapay zekâ yarışında milyarlarca dolarlık yatırımın söz konusu olduğu düşünüldüğünde, Gemini gibi büyük modellerin hedef hâline gelmesi şaşırtıcı değil. Daha önce OpenAI da benzer şekilde rakip bir şirketi model çıkarımı yapmakla suçlamıştı.
Uzmanlara göre büyük dil modelleri doğası gereği internete açık sistemler olduğu için tamamen korunmaları zor. Google’ın savunma mekanizmaları bulunsa da, artan rekabet ortamında bu tür girişimlerin daha sık görülmesi bekleniyor. Yapay zekâ çağında yalnızca performans değil, model güvenliği de en kritik başlıklardan biri hâline gelmiş durumda.

