🔌 Modül 5 · Çip Donanımı · Bölüm 5.15 · 11 dk okuma

Termal ve Paketleme Derinliği

Modül 5'i kapayan derin dalış — soğutma + paket + Y100 ufku.

Bu bölümde öğreneceklerin

  • Modül 5'in 14 bölümünü tek bir uçtan uca tasarım vakasında topla
  • Y100 termal yönetim ihtiyaçlarını detayla (microfluidic, vapor chamber)
  • 3D istif paketleme zorluklarını ve çözümleri söyle
  • Sürdürülebilirlik ve geri dönüşüm tasarımını tartış
  • Modül 6'ya (yazılım yığını) köprü kur

Açılış: Modül 5'in Tüm Hattı

Modül 5 boyunca 14 bölüm: paradigma → memristör → crossbar → mimari → DAC/TDC/TIA → MUX/ECC → compute → gürültü → güç/termal → IR drop → paket → nesil karşılaştırma. Bu bölüm hepsini tek bir derin dalışla bağlar: Y100 termal + paketleme tasarımı.

Sonra Modül 6 (yazılım yığını) başlar — donanım hazır, şimdi kod.

Sezgi: Y1'den Y100'e Termal Sıçrama

NesilTDPHeat densitySoğutma
Y13 W / 1 cm²3 W/cm²Pasif
Y1030 W / 2 cm²15 W/cm²Heat sink
Y100100 W / 4 cm²25 W/cm²Aktif fan / sıvı
Y1000100 W / 8 cm² (3D)12.5 W/cm² ama 3D-densityMikroakışkan

Heat density CPU’lardan (~50-100 W/cm²) az, ama 3D istif kompakt → soğutma kritik.

Formalizm: Termal Modelleme ve Paketleme

L1 · Başlangıç

Termal direnç ağı:

Çipten ortama ısı yolu:

  • Junction → die: RjdR_{j-d} ~0.5°C/W (Si yüksek iletken).
  • Die → heat spreader: RdsR_{d-s} ~1°C/W (TIM, thermal interface material).
  • Heat spreader → ambient: RsaR_{s-a} değişken (soğutmaya göre).

Toplam: Rja=Rjd+Rds+RsaR_{j-a} = R_{j-d} + R_{d-s} + R_{s-a}.

Y1: Rja15R_{j-a} \approx 15°C/W (pasif). Y100: Rja1R_{j-a} \approx 1°C/W (sıvı) gerek.

Mikroakışkan soğutma:

Çipin üzerine ince kanallar (10-100 µm). Sıvı (su veya soğutucu) pompalanır, ısı transfer edilir.

Tasarım:

  • Kanal genişliği: 50 µm.
  • Akış hızı: 1 m/s.
  • Toplam akış: 1 mL/s.
  • Rsa0.1R_{s-a} \approx 0.1°C/W → 100 W chip için ΔT=10\Delta T = 10°C.

Tuckerman & Pease 1981 klasik. Modern reborn (2D AI çiplerinde).

L2 · Tam

3D istif termal sorunu:

İki die üst üste → alt die ısısını üst üzerinden çıkaramaz. Hot spot.

Çözüm:

  • TSV ile paralel ısı yolu (Cu kondüksiyon).
  • Die arası TIM optimize.
  • Sıvı çoklu-katman akışı.

Y100 8-katman 3D → her katman 12.5 W disipe → toplam 100 W. Üst katman normal soğutma; alt katmanlar sıvı kanal.

Vapor chamber:

Alternatif: vakum kapsül içinde su. Buharlaşma + yoğunlaşma ile yüksek ısı transferi. Apple M-series MacBook’ta var. Y10/Y100 aday.

Heat spreader malzemeleri:

  • Cu (klasik): k = 400 W/m·K.
  • Diamond: k = 2000 W/m·K (5×!). Y1000 deneysel.
  • Graphene: yüksek anizotropik k. Henüz pratik değil.
L3 · Derin

Y100 paketleme detayı:

Heterojen 3D entegrasyon:

  • 8 SIDRA die katmanı (CoWoS interposer üzerinde).
  • 4 HBM3 stack yan tarafta.
  • Photonic die altta.
  • Tümü 50 mm × 50 mm paket.

TSV (Through-Silicon Via): 5-10 µm çaplı. Her die ~10K TSV. Yüksek bandwidth.

Yıkım/üretim:

3D istif test zor. Bir die başarısız → tüm istif çöp. Çözüm: pre-test her die.

Y100 yield optimistic: %50. Maliyet artar.

Sürdürülebilirlik:

SIDRA üretim:

  • 1 wafer ~$1000-5000.
  • 1 çip ~$100-2000 (yield + test).
  • E-waste: 3D istif geri dönüşüm zor.

Tasarım stratejisi: socket-able paketleme (Y100 hedefi), iyi-die’lar yenileniyor.

Termal-aware compiler:

Compute engine + Y10+ compiler model’i thermal map’a göre dağıt. Hot spot’lar minimize.

Kriyojenik (Y1000):

4 K (sıvı helyum) operasyonu:

  • Süperiletken metal (R = 0).
  • Termal gürültü çok düşük.
  • Endüstri henüz erken.

NIST, IBM Quantum + AI hibrid sistemleri inceliyor.

Sonuç:

Termal ve paketleme SIDRA’nın “donanımsal dış kabuğu”. Modül 5 ne kadar iyi tasarımlanmışsa, paketleme + soğutma çıktının fiziksel sınırını çizer.

Deney: Y100 Sıvı Soğutma Tasarımı

Hedef: Y100 100 W, T_die < 70°C.

Sıvı:

  • Su veya 3M Novec 7100.
  • Akış hızı: 0.5 L/min.
  • Inlet T: 25°C.

Hesap:

Q=m˙cpΔTQ = \dot{m} c_p \Delta T

Su: cp=4180c_p = 4180 J/kg·K, ρ=1000\rho = 1000 kg/m³.

m˙=0.5\dot{m} = 0.5 L/min × 1000 / 60 = 8.3 g/s.

100 W = 8.3e-3 × 4180 × ΔT\Delta TΔTwater=2.9\Delta T_{water} = 2.9°C.

Toutlet=25+2.9=27.9T_{outlet} = 25 + 2.9 = 27.9°C.

Heat exchanger (chip ↔ water): R_th = 0.5°C/W → TdieTwater=100×0.5=50T_{die} - T_{water} = 100 \times 0.5 = 50°C.

Tdie=Twater+50=27+50=77T_{die} = T_{water} + 50 = 27 + 50 = 77°C.

Hedef 70°C → biraz aşıldı. Daha iyi heat exchanger veya daha yüksek akış hızı.

R_th = 0.3°C/W (vapor chamber + sıvı): Tdie=27+30=57T_{die} = 27 + 30 = 57°C. OK!

Pompa enerjisi:

Pompa ~5 W. Toplam datacenter güç: 100 W chip + 5 W pompa + chiller PUE 1.5 → 150 W per chip.

1000 Y100 datacenter: 150 kW. 1 yıl: 150 × 8760 = 1.3 GWh. CO₂: 1.3 × 0.4 = 520 ton.

Yine de GPU datacenter (1000 H100 = 700 kW) %80 daha az.

Modül 5 Kapanış Sınavı

Modül 5’in 14 bölümünü test eder.

1/8SIDRA'nın von Neumann bottleneck çözümü nedir?

Bütünleştirici Laboratuvar: Y10 Çip Tasarım Kararları

Sen SIDRA tasarım takımısın. Y10 spec belirleme:

Veriler (Y1 olgun, Y10 hedef belirleniyor):

  • Y10 hedef pazar: edge + datacenter.
  • TDP bütçesi: 30 W maks.
  • Üretim hacmi: 1M çip/yıl, mini-fab.

Kararlar:

(a) Crossbar boyutu: 256² (Y1 aynı, daha çok crossbar) vs 512² (yeni). Hangisi?

(b) Hücre sayısı: 10B hedefi. Crossbar başına 262K (512²) → 40K crossbar. Veya 65K (256²) → 154K crossbar. Hangi sayı?

(c) ADC vs TDC: Y1 ADC + Y10 hibrit TDC?

(d) 3D-stack: ne zaman başlamalı? 4 katman vs 8 katman?

(e) Eğitim desteği: son katman analog backward mı, hiç yok mu?

(f) Pazar fiyat hedefi: 500/c\cipmi500/çip mi 2000/çip mi?

Çözümler

(a) 512² crossbar. Daha büyük model layer’ları sığar (BERT-base attention 768 → 512² 1.5 crossbar yerine 6 crossbar 256²). Throughput artar. IR drop dezavantajı kompansasyonla yönetilir.

(b) 40K × 512² crossbar tercih. Daha az ADC, daha az kontrol overhead.

(c) TDC standart. ADC alan + güç tasarrufu için. Y1’de prototype yapılmıştır, Y10 production.

(d) 4 katman 3D başlangıç. 8 katman çok zor üretim. 4 katman üretim olgun, density 4×.

(e) Son katman analog backward. Hibrit eğitim: transfer learning, fine-tuning. Tam eğitim Y100’e bırak.

(f) **500/c\cip.Edgecihazhedefgenis\cpazar.Datacenterdahayu¨ksekmargin(500/çip.** Edge cihaz hedef geniş pazar. Datacenter daha yüksek margin (2000 mümkün ama hacim az).

Sonuç Y10 spec: 14 nm CMOS + 70 nm cell + 1S1R 3D 4-katman + TDC + 40K crossbar 512² + 10B memristor + 300 TOPS + 30 W + hibrit eğitim + $500.

Tape-out 2028, üretim 2029.

Modül 5 Özet Kartı

14 bölümde gördüklerimiz:

  • 5.1 Nöromorfik paradigma (CIM).
  • 5.2 Memristör fiziği.
  • 5.3 Crossbar dizisi.
  • 5.4 YILDIRIM mimarisi (4-seviye hiyerarşi).
  • 5.5 DAC + ISPP programlama.
  • 5.6 TDC zaman-okuma.
  • 5.7 TIA sense devresi.
  • 5.8 MUX, decoder, ECC.
  • 5.9 Compute engine + DMA.
  • 5.10 Gürültü modelleri.
  • 5.11 Güç + termal yönetim.
  • 5.12 IR drop.
  • 5.13 Sinyal zinciri + paket.
  • 5.14 Y1/Y10/Y100 evrim.
  • 5.15 Termal + paket derinlik (bu).

Modül 5 mesajı: SIDRA YILDIRIM = bütünleşik nöromorfik AI çip platformu. Donanım + analog devre + paket + soğutma birlikte tasarlanır.

Vizyon: Donanımdan Yazılıma Geçiş

Modül 5 donanım. Modül 6 yazılım: bu donanımı nasıl programlarız?

  • Driver: Linux kernel modülü, PCIe iletişim.
  • Firmware: SIDRA üzerinde RISC-V kontrol.
  • Compiler: PyTorch model → SIDRA assembly.
  • SDK: geliştirici API.
  • Simulator: digital twin testleri için.

Modül 6 SIDRA’yı kullanılabilir yapar. Donanım tek başına yeterli değil — yazılım yığını ürünleştirir.

Türkiye için: Yazılım Türkiye’nin güçlü yanı. SIDRA donanımı + Türk yazılım mühendisliği = pratik AI ürünleri.

Daha İleri

  • Bir sonraki modül: 🚧 6.1 · İşletim Sistemi ve PCIe Sürücü Temelleri — Yakında
  • Önceki: 5.14 — Y1 / Y10 / Y100 Karşılaştırması
  • Mikroakışkan soğutma: Tuckerman & Pease, IEEE EDL 1981; modern review: Bar-Cohen, Annu. Rev. Heat Transfer 2017.
  • 3D çip termal: Loh, 3D-stacked memory architectures…, ISCA 2008.
  • Heterojen entegrasyon: Lau, Heterogeneous Integrations, Springer 2018.
  • Modül 4 özet: 4.8 — Lineer Cebir Lab.