Genel

Google’dan Yeni Nesil Yapay Zekâ: Gemini 2.5 Computer Use

Google, yapay zekâ alanındaki yarışta çıtayı bir kez daha yükseltti. Şirket, “Gemini 2.5 Computer Use” adını verdiği yeni modelini tanıtarak, yapay zekâların artık yalnızca metin üretmekle kalmayıp, insan benzeri bilgisayar kullanımı becerilerine sahip olabileceğini gösterdi. Bu yeni model, bir tarayıcı üzerinden gerçek zamanlı olarak gezinebiliyor, formları doldurabiliyor ve internet üzerinde belirli görevleri otomatik şekilde yerine getirebiliyor.

Gemini 2.5, Google’ın bir süredir üzerinde çalıştığı AI Mode ve Project Mariner projelerinin bir devamı niteliğinde. Şirket, bu modelle yapay zekâ ajanlarının “otonom” hale gelmesini, yani doğrudan kullanıcı müdahalesi olmadan karmaşık görevleri tamamlayabilmesini hedefliyor. Bu hamle, OpenAI’nin kısa süre önce duyurduğu ChatGPT Agent sistemine güçlü bir rakip olarak görülüyor.

Tarayıcı Üzerinden Gerçek Eylemler

Gemini 2.5 Computer Use, şimdilik yalnızca internet tarayıcısı üzerinde işlem yapabiliyor. Ancak bu bile, yapay zekâ yeteneklerinde büyük bir sıçrama anlamına geliyor. Model, metin yazma, bağlantı tıklama, sürükle-bırak işlemleri ve sekme açma gibi toplam 13 farklı kullanıcı eylemini destekliyor. Başka bir deyişle, yapay zekâ artık sadece yanıt veren bir sistem değil; kendi başına “hareket eden” bir dijital yardımcı haline geliyor.

Google, bu yeteneklerin, özellikle web tabanlı görevleri olan geliştiriciler ve işletmeler için devrim niteliğinde olacağını söylüyor. Model; e-posta formu doldurma, ürün araştırması yapma, web sayfalarından veri çekme ve hatta basit oyunları oynama gibi çok çeşitli görevleri başarıyla yerine getirebiliyor.

Şirketin tanıtım videolarında, Gemini 2.5’in “2048 oyununu oyna” ya da “Trend konuları ara” gibi komutlara doğrudan yanıt verdiği ve bu görevleri gerçek bir kullanıcı gibi tamamladığı görülüyor. Bu performans, modelin yalnızca dil anlama kabiliyetine değil, aynı zamanda bağlamsal eylem planlama ve görsel arayüzle etkileşim becerilerine de sahip olduğunu gösteriyor.

Geliştiricilere Açık ve Canlı Demolarla Destekleniyor

Google, Gemini 2.5’i sadece kapalı bir sistem olarak tutmuyor. Model, geliştiriciler için AI Studio ve Vertex AI platformları üzerinden erişime açılacak. Ayrıca, Browserbase aracılığıyla da canlı demoların izlenebileceği belirtiliyor. Böylece yapay zekâ meraklıları, modelin internet üzerindeki etkileşimlerini anlık olarak gözlemleyebilecek.

Teknoloji analistlerine göre Gemini 2.5, Google’ın yapay zekâ stratejisinde yeni bir dönemi başlatabilir. Şirket, son aylarda özellikle OpenAI ve Anthropic gibi rakiplerle rekabette hızlanmış durumda. Gemini 2.5’in, hem internet performansı hem de mobil görev yürütme alanlarında rakiplerinden daha verimli sonuçlar verdiği ifade ediliyor.

Google, uzun vadede bu teknolojiyi tarayıcı sınırlarının ötesine taşıyarak, masaüstü düzeyinde tam kontrol sağlayan otonom sistemlere dönüştürmeyi planlıyor. Bu da, gelecekte yapay zekâların yalnızca “danışman” değil, doğrudan “icracı” ajanlar haline gelmesinin önünü açabilir.

Gemini 2.5 Computer Use, yapay zekânın insana daha yakın davranışlar sergileyebildiği yeni bir çağın kapısını aralıyor. Google’ın bu adımı, yapay zekânın gelecekte hem dijital dünyada hem de günlük yaşamda aktif bir yardımcı rolü üstleneceğini gösteriyor.

5mid’den daha fazla haber okumak için buraya tıklayabilirsiniz.

DeepSeek, Yeni Yapay Zekâ Modeli “V3.2-exp”i Tanıttı

author
Yapay zeka ve teknolojik alandaki gelişmeleri takip edip, en önemli olanları 5mid'de paylaşıyorum.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir