Google, Yapay Zeka Maliyetlerini Kontrol Altına Almak İçin Gemini 3.5 Flash'ı Sundu
Ancak bu dinamik hızla değişiyor. Pichai'ye göre, Gemini 3.5 Flash ile diğer seçkin modelleri birlikte kullanan şirketler önemli tasarruf sağlayabilir.

Şirketler yapay zeka hizmetlerine ödedikleri tutarlardan alarm vermeye başladı. Google, bu soruna yanıt olarak yeni bir modelini öne çıkarıyor: Gemini 3.5 Flash. Seçkin performansını korurken daha düşük maliyet sunmak üzere tasarlanan bu sistem, yapay zeka sektöründeki tartışmaların ağırlık merkezi değiştiğini gösteriyor.
İçindekiler ›
Maliyetin Merkezde Olduğu Yeni Dönem
Geçtiğimiz üç yılda yapay zeka rekabeti, en güçlü modeli geliştiren şirketin galip gelmesine dayanıyordu. Ancak bu dinamik hızla değişiyor. Gemini 3.5 Flash gibi yeni araçlar ortaya çıktıkça, farklı laboratuarların sunduğu yetenekler arasındaki fark kapanıyor. İşte tam bu noktada, bir modelin ne kadar hızlı ve verimli çalıştığı ön plana çıkıyor. Google Başkanı Sundar Pichai, şirketlerin durumuyla ilgili açık bir uyarı yaptı: Mayısın ortasında birçok kuruluş yıllık token bütçesini çoktan tüketmişti. Pichai'ye göre, Gemini 3.5 Flash ile diğer seçkin modelleri birlikte kullanan şirketler önemli tasarruf sağlayabilir.
Über, Oracle gibi dev teknoloji şirketleri zaten bu sorunu yaşıyor. Über'in operasyon müdürü, kentin her köşesinde kullanılan yapay zeka araçlarının maliyetini artık haklı kılması güçleştiğini söyledi. Girişim yatırımcılarından Chamath Palihapitiya da benzer endişe paylaştı ve yazılım geliştirme aracı Cursor'ı kullanmaktan vazgeçmek zorunda kaldıklarını, çünkü token harcamasının çok yüksek olduğunu belirtti.
Google'ın Yıllık Veri ve Rakip Stratejileri
Pichai, Google'ın yapay zeka ürünlerinin aylık kullanımının geçen seneye kıyasla yedi kat arttığını açıkladı. Toplamda 3.2 katrilyon token aylık seviyeye ulaştı. En kritik veri ise Google Bulut'un en büyük müşterileriydi: eğer bu kurumlar yapay zeka işlemlerinin yüzde 80'ini Gemini 3.5 Flash ve diğer seçkin modellerle yapsa, yıllık 1 milyar doları geçen tasarruf elde edebilirdi.
Aynı dönemde, rakip şirketler token maliyetini artırarak gelir elde etmeye çalışıyor. Bu hamle müşterileri alternatif arayışına itmesi işte Google'ın beklediği alan. Synovus Trust'tan analist Dan Morgan, yapay zeka ajanların giderek karmaşıklaşması ve uzun süreli işlemlerin standart hale gelmesinin birçok organizasyonda "fatura şokuna" yol açtığını yorumladı.
Gemini Uygulamasında Limitler Yeniden Düzenlendi
Google, sadece modele yatırım yapmadı. Gemini uygulamasının kullanım sınırlarını da yeniden tasarladı. İlk başta hızlı geri tepki alan bu sistem, daha sonra kullanıcı şikayetlerine yanıt olarak kısımlar değiştirildi. Yeni yapıda "hesaplanan kullanım" adı verilen metrik, yazı isteğinin karmaşıklığı, kullanılan araçlar ve konuşma uzunluğu dikkate alınıyor. Örneğin sade bir metin sorgusu, video veya kodlama görevinden çok daha az hesaplama gücü tüketeceği için quota'yı az etkileyecek.
Gemini 3.1 Pro kullanıcıları için Google, tekli istemlerin tüketebileceği quota üst sınırını belirledi. Böylece büyük dosyalar içeren karmaşık yönergeler, bütün hakkı tüketmeyecek. Ayrıca başarısız istekler quota'dan düşülmeyecek, hata Google'ın sorumluluğu olarak tanımlandı. Gemini 3.1 Flash-Lite modeli tamamen ücretsiz hale geldi. Sağlam araştırma yapan "Deep Research" gibi ağır görevler daha fazla hesaplama gerektirdiği için kullanıcılar, yeni dashboard üzerinden hangi işin ne kadar harcadığını görebilecek.
Google neden Gemini 3.5 Flash'ı sundu?+
Gemini 3.5 Flash ile ne kadar tasarruf sağlanabilir?+
Diğer yapay zeka şirketleri neden maliyetleri artırıyor?+
Gemini uygulamasındaki yeni limit sistemi nasıl çalışıyor?+
Bülten Aboneliği
Haftada bir, teknoloji ve dijital dünyadan seçtiklerimiz e-postanda. Spam yok, sadece içerik.
