Google, yapay zeka altyapısında ihtilal niteliğinde bir adım atarak yeni jenerasyon özel TPU (Tensor Süreç Birimi) mimarisini duyurdu. Şirketin yedinci kuşak TPU’su olan Ironwood, bilhassa Gemini modellerinin gelişmiş gereksinimlerine karşılık vermek için tasarlandı. Google, bu işlemcinin simüle edilmiş akıl yürütme üzere ileri düzey misyonları mümkün kıldığını belirtiyor. Teknoloji devi bu periyodu “çıkarım çağı” (age of inference) olarak isimlendiriyor.
Google, yeni jenerasyon Gemini modellerinden bahsederken sadece model mimarisinden değil, bu modellerin performansını mümkün kılan altyapıdan da kelam ediyor. Bu altyapının merkezinde ise artık Ironwood yer alıyor. Şirket, bu işlemciyle birlikte “ajan benzeri” yapay zeka sistemlerinin güç kazanacağını tabir ediyor. Bu cins sistemler, kullanıcı ismine bilgi toplayabilen, karar alabilen ve çıktılar üretebilen yapılar olarak tanımlanıyor. Özcesi Google, yapay zekanın yalnızca yanıtlayan değil, proaktif biçimde harekete geçen bir yapıya evrildiğini duyuruyor.
Donanımsal güç gösterisi
Ironwood, şimdiye kadarki en güçlü ve ölçeklenebilir TPU olarak tanıtıldı. Her bir çip saniyede 4.614 TFLOPs’a kadar çıkarım (inference) süreç kapasitesine sahip. Bu çipler, Google’ın geliştirdiği yeni kuşak Inter-Chip Interconnect (ICI) üzerinden direkt birbiriyle irtibat kurabiliyor. Üstelik bu işlemciler, sıvı soğutmalı yapılarıyla 9.216 adete kadar kümelenerek çalışabiliyor. Bu dev yapı, toplamda 42,5 Exaflops’luk hesaplama gücüne ulaşabiliyor. Google, Ironwood’un sadece kendi projelerinde değil, bulut tabanlı yapay zeka projeleri geliştiren yazılımcılar için de büyük avantaj sağlayacağını söylüyor. Geliştiriciler, bu yeni jenerasyon işlemcileri iki farklı yapılandırmada kullanabilecek: 256 çiplik sunucular ya da tam kapasiteyle çalışan 9.216 çiplik dev kümeler. Ironwood çipleri sırf süreç gücüyle değil, bellek kapasitesiyle de dikkat çekiyor. Her bir TPU, 192 GB bellekle donatılmış. Bu, bir evvelki kuşak olan Trillium (TPU v6) ile karşılaştırıldığında 6 katlık bir artış manasına geliyor. Bellek bant genişliği de 7,2 Tbps ile 4,5 kat güzelleştirilmiş durumda. Ek olarak firma, Ironwood’un watt başına performans açısından Trillium’a kıyasla iki kat daha verimli olduğunu vurguluyor.
Hatta Google, Ironwood’a o kadar güveniyor ki birtakım tartışmalı kıyaslamalar bile yapmaktan geri durmuyor. Şirket, Ironwood’un dünyanın en güçlü üstün bilgisayarı olarak bilinen El Capitan’ın misal sistem segmentlerinden 24 kat süratli olduğunu argüman ediyor. Google bu kıyaslamayı FP8 üzerinden yapıyor lakin 1,7 Exaflops sunan El Capitan’da bu takviye yok.
Google’ın Ironwood’u son devirdeki bir trendin sürat kesmeden devam edeceğini de gösteriyor: Nvidia’dan bağımsızlaşmak. Nvidia, dalda hala tartışmasız monopol olsa da Amazon’un Trainium, Inferentia ve Graviton çipleri; Microsoft’un Maia 100 üzere tahlilleri ve son olarak Ironwood, teknoloji devlerinin şirket içi tahlillere büyük ehemmiyet verdiğini gösteriyor.