Bloomberg’in aktardığına göre bir hacker, Anthropic tarafından geliştirilen Claude’u kullanarak devlet ağlarındaki güvenlik açıklarını tespit etti, istismar senaryoları yazdı ve veri sızıntısını otomatikleştirecek komut dosyaları oluşturdu. Siber güvenlik şirketi Gambit Security, saldırıların Aralık ayında başladığını ve yaklaşık bir ay sürdüğünü belirtiyor.
Claude ile 150 GB Veri Çalındı
İddialara göre çalınan veriler arasında vergi mükellefi kayıtları, çalışan kimlik bilgileri ve çeşitli resmi belgeler bulunuyor. Gambit Security yetkilileri, saldırganın Claude’u “jailbreak” yöntemleriyle güvenlik bariyerlerini aşacak şekilde yönlendirdiğini ifade ediyor. Başlangıçta kötü amaçlı talepleri reddeden modelin, farklı prompt’lar sayesinde zamanla kısıtlamaları aştığı öne sürülüyor.
Şirketin strateji sorumlusu Curtis Simpson, Claude’un binlerce detaylı rapor ürettiğini ve saldırgana hangi hedeflerin nasıl vurulacağına dair adım adım planlar sunduğunu söyledi.
Hackers Used Anthropic’s Claude to Steal 150 GB of Mexican Government Data
> Tell Claude you’re doing a bug bounty
> Claude initially refused:
> “That violates AI safety guidelines”
> Hacker just kept asking
> Claude: “OK, I’ll help”
> Hacked the entire Mexican… pic.twitter.com/Qaux239K8t— Nawaz Haider (@nawaz0x1) February 25, 2026
OpenAI da Sürece Dahil Edildi
Haberde, saldırganın ek olarak OpenAI tarafından geliştirilen ChatGPT’yi de kullandığı belirtiliyor. ChatGPT’nin ağ içinde ilerleme, gerekli kimlik bilgilerini belirleme ve tespit edilmemek için yöntem geliştirme gibi konularda bilgi sağlamaya çalıştığı ancak politika ihlallerini tespit ederek talepleri reddettiği aktarılıyor.
Anthropic ise olayın ardından ilgili hesapları kapattığını ve faaliyetleri durdurduğunu açıkladı. Şirket, yeni modeli Claude Opus 4.6’nın bu tür kötüye kullanımları tespit edip engellemeye yönelik daha gelişmiş araçlar içerdiğini savunuyor.
Saldırıların arkasındaki kişi veya grubun kimliği henüz belirlenmiş değil. Gambit Security, olayın yabancı bir devletle bağlantılı olabileceğini öne sürse de resmi bir atıf yapılmış değil. Meksika’daki bazı kurumlar ise sistemlerinin ihlal edilmediğini savunuyor.
Yapay zekâ araçlarının siber saldırılarda kullanılması yeni bir tartışma değil. Ancak bu olay, generatif yapay zekânın güvenlik sınırlarının ne kadar zorlanabildiğini bir kez daha gözler önüne seriyor
