Tüketim — Çin çim biçme robotlarına geçici anti-damping vergisi yok
Tüketim — Çin beyaz eşya sektöründe mayıs verileri zayıf, şirketler strateji değiştiriyor Öne Çıkan Noktalar — AB, Çinli çim biçme robotlarına geçici
Google'ın TurboQuant sıkıştırması KV cache belleğini 6 kata kadar küçültebiliyor. Önemli bir teknolojik adım oldu, bellek hisselerini de düşürüyor.
Google malum TurboQuant adını verdiği bir sıkıştırma teknolojisi tanıttı. Büyük dil modellerinin KV cache belleğini bazı senaryolarda 6 kata kadar sıkıştırabiliyor.
KV cache denen şey, dil modellerinin uzun bağlam pencerelerinde konuşma geçmişini tuttuğu bellek alanı. Bağlam penceresi büyüdükçe alan da büyüyor, ciddi bellek tüketiyor.
İlk bakışta Micron için kötü haber gibi duyor. Nitekim hisselere negatif tesir etti.
Fakat Bloomberg Intelligence analistleri diyor ki model ağırlıkları hala GPU belleğinde durmak zorunda, sıkıştırma onlara dokunmuyor. Dolayısıyla yüksek bant genişlikli bellek, yani HBM talebi devam.
Hesabınız yoksa lütfen abone olun.
Hemen Abone Ol