🔌 Modül 5 · Çip Donanımı · Bölüm 5.11 · 10 dk okuma

Enerji ve Termal Yönetim

3 W bütçesinde nasıl kalınır — DVFS, soğutma, güç dağıtımı.

Bu bölümde öğreneceklerin

  • Y1 güç bütçesini bileşen bileşen ayır
  • DVFS (Dynamic Voltage and Frequency Scaling) prensibini açıkla
  • Termal direnç ve soğutma stratejilerini hesapla
  • Power gating ve clock gating tasarımı detayla
  • Y10 → Y100 güç ölçeklenebilirlik sorunlarını söyle

Açılış: 3 W = Bir LED Ampul

Y1’in TDP (Thermal Design Power) 3 W. Bir LED ampul kadar. H100 bunun 233 katı (700 W).

Bu 3 W:

  • Enerji ekonomisi (edge cihaz: pil ömrü).
  • Sıcaklık (chip 60°C civarında, soğutma kolay).
  • Bütçe disiplin (her CU’nun payı belli).

Bu bölüm Y1’in 3 W bütçesini nasıl koruduğunu, DVFS’in nasıl çalıştığını, ve sıcaklığı nasıl yönettiğini anlatır.

Sezgi: Üç Güç Stratejisi

Statik güç:

Transistör sızıntısı (off durumunda hâlâ akar). 28 nm CMOS Y1 için 50 mW (%2 TDP). Yönetilebilir.

Dinamik güç:

CMOS switching: P=αCV2fP = \alpha C V^2 f.

  • α\alpha: aktivite faktörü (~%5-30).
  • CC: switching kapasitör.
  • VV: voltaj.
  • ff: saat hızı.

Y1 dinamik güç: ~2 W (TDP’nin büyük çoğu).

Crossbar güç:

Memristör read enerjisi (statik DC). Aktif crossbar başı ~10 mW.

Y1 strateji:

  1. DVFS: aktivite az → frekans + voltaj düşür → enerji azalır.
  2. Power gating: boşta CU’ları kapat (sıfır güç).
  3. Clock gating: sadece aktif blokların saati çalış.

Formalizm: Güç Hesabı ve Termal

L1 · Başlangıç

Y1 güç bütçesi:

BileşenGüçPay
Crossbar (analog)0.5 W17%
ADC1.0 W33%
DAC0.8 W27%
Compute engine0.3 W10%
SRAM + DMA0.2 W7%
Clock + I/O0.2 W7%
Toplam3.0 WTDP

Aktivite faktörü:

Inference’ta tüm blok değil, kısmi aktivite. Tipik %30 aktivite → 3 W. %100 aktivite (worst case) → 10 W (TDP’yi aşar, throttle).

DVFS (Dynamic Voltage Frequency Scaling):

ModFrekansVoltajGüçPerformans
Idle100 MHz0.6 V100 mW~1%
Düşük250 MHz0.7 V500 mW25%
Orta500 MHz0.8 V1.5 W50%
Yüksek1 GHz1.0 V3 W100%

Güç V²f ile orantılı → düşük V büyük tasarruf. Modern CPU/GPU’da standart.

Power gating:

İdle CU’ya güç kesilir. Boşta sıfır güç. Yeniden aç ~1 µs. Y1 16 cluster’da bağımsız gating.

L2 · Tam

Termal yönetim:

Çip 3 W → ısı yayılır. Soğutma yetersizse sıcaklık artar → memristör drift hızlanır → ECC tolerance düşer.

Termal direnç:

ΔT=PRth\Delta T = P \cdot R_{th}

  • PP: güç (W).
  • RthR_{th}: termal direnç (°C/W).
  • ΔT\Delta T: sıcaklık artışı (oda sıcaklığı üstüne).

Y1 soğutma seçenekleri:

SoğutmaRthR_{th}ΔT\Delta T @ 3WCihaz örneği
Pasif (heat spreader)15 °C/W45°CCep telefonu
Küçük heat sink8 °C/W24°CLaptop
Aktif fan3 °C/W9°CEmbedded server
Sıvı0.5 °C/W1.5°CDatacenter

Y1 için pasif heat spreader yeterli (45°C @ 25°C oda = 70°C). Memristör 85°C’a kadar OK.

Y10 (30 W) → küçük heat sink. Y100 (100 W) → aktif fan. Y1000 sıvı.

Throttling:

Sıcaklık 80°C’a yaklaşırsa frekans düşür → güç azal → sıcaklık düşer. Geri besleme.

Tipik throttle: 80°C → DVFS Yüksek → Orta. 90°C → Düşük. 100°C → kritik shutdown.

Sıcaklık sensörleri:

Y1 her cluster’da 4 thermal sensor (16 toplam). On-chip kalibre. Compute engine sürekli okur.

L3 · Derin

Voltaj regülatörü:

Çip iç voltajları 0.6-1.0 V. Dış güç 1.8 V veya 3.3 V. LDO (Low Dropout Regulator) veya switching converter ara.

Y1: switched capacitor regulator + bandgap reference. Çıkış 0.6/0.8/1.0 V seçilebilir (DVFS).

Verim:

LDO: V_out / V_in = %33 (1.0 V çıkış, 3.3 V giriş). Düşük. Switching: %85-90. Daha iyi.

Y1 switching converter kullanır.

Power delivery network (PDN):

3 W çekmek için ~3 A @ 1 V. Kalın metal hatlar. PDN tipik üst 5 katmanı kullanır (M16-M20).

IR drop in PDN: 100 mV droop (1 V’ta %10) tolerable. Decoupling capacitors (~1 nF/mm²) helps.

Boot-time power-up:

Çip açılışı: voltajlar yükselir, saat ağacı stabilize, kalibre, model yükle. ~1 saniye.

Düşük-güç modlar:

  • Active: tam çalışma, 3 W.
  • Idle: clock gated, sadece SRAM aktif, ~50 mW.
  • Sleep: çoğu blok off, periyodik wake, ~5 mW.
  • Deep sleep: sadece RTC, ~0.5 mW (memristör non-volatile, model kaybolmaz).

Mobil cihazda deep sleep çoğu zaman → batarya ömrü uzar.

Termal modeling:

Çip thermal map: hot spots ADC + DAC bölgesinde. Compiler hot spot’lar arası iş dağıtır (load balancing).

Spread heat over chip → uniform temperature → memristor drift uniform.

Y100 termal: 100 W, 1 cm², heat density ~10 W/cm² → cooling kritik. Microfluidic cooling (Modül 5.15).

Deney: Y1 Power Profile

Senaryo: GPT-2 inference, %30 aktivite ortalaması.

Anlık güç profili:

FazAktif blokGüç
Token inputDMA + L30.5 W
Embedding lookup1 cluster1.5 W
Layer 1 attention4 CU2.0 W
Layer 1 FFN4 CU2.5 W
Layer 2-12 sırayla4 CU/seq2.5 W ortalama
Output projection1 cluster1.0 W
Token outputDMA + L30.5 W

Ortalama: ~2 W per token (1 µs süresince).

1000 token (1 ms): 2 W × 1 ms = 2 mJ. Soğutma kolay.

Worst case (sürekli max):

Tüm 16 cluster + tüm CU’lar aktif → ~10 W. TDP 3W’ı aşar → throttle: frekans 1 GHz → 500 MHz, güç 4 W → hâlâ aşar → 250 MHz, 1.5 W. Performans yarı.

Sıcaklık:

  • Pasif soğutma 15°C/W → 3 W × 15 = 45°C üstü oda.
  • 25°C oda + 45°C = 70°C die. Memristör 85°C limiti içinde.

1 saat sürekli: 3 W × 3600 s = 10.8 kJ enerji. Pil cinsinden: 18650 hücresi (3.6 V × 3 Ah = 39 kJ) ile 3.6 saat sürekli. Mobil senaryoda %10 aktivite → 36 saat.

Kısa Sınav

1/6Y1 TDP nedir?

Laboratuvar Görevi

Edge cihaz batarya ömrü hesabı.

Cihaz:

  • SIDRA Y1 (3 W TDP, %10 aktivite ortalama) + ARM CPU (1 W) + sensors (0.5 W).
  • Pil: 4000 mAh @ 3.7 V = 14.8 Wh = 53 kJ.

Kullanım senaryoları:

(a) %100 SIDRA aktif (sürekli inference): pil ömrü? (b) %10 SIDRA aktif (always-on listening): pil ömrü? (c) %1 SIDRA + idle (deep sleep çoğu zaman): pil ömrü? (d) Karşılaştırma: aynı cihaz GPU yerine: 700 W * %1 = 7 W batarya yetersiz. (e) SIDRA-tabanlı akıllı kulaklık batarya hedefi?

Çözümler

(a) 3 W (SIDRA) + 1 W (CPU) + 0.5 W (sensor) = 4.5 W. 14.8 / 4.5 = 3.3 saat. Sürekli AI çalıştırma kısa.

(b) 0.3 W (SIDRA %10) + 1 W + 0.5 W = 1.8 W. 14.8 / 1.8 = 8.2 saat. Konuşma asistanı için iyi.

(c) 0.03 W (SIDRA %1) + 0.05 W (CPU sleep) + 0.1 W (sensor) = 0.18 W. 14.8 / 0.18 = 82 saat = 3.4 gün. Akıllı saat tipi sürekli wear.

(d) GPU 7 W + sistem 1.5 W = 8.5 W → 1.7 saat. SIDRA 8.2 saat = 5× daha uzun.

(e) SIDRA Y1 tabanlı kulaklık 24 saat batarya ömrü hedefi gerçekçi (always-on speech recognition + translation).

Özet Kart

  • Y1 TDP: 3 W.
  • Güç bütçesi: ADC %33, DAC %27, crossbar %17, compute %10.
  • DVFS: 4 mod, V²f tasarruf.
  • Soğutma: Y1 pasif, Y10 heat sink, Y100 aktif/sıvı.
  • Power gating: boş bloklar off.
  • Sıcaklık: Y1 ~70°C (limit 85°C).
  • Pil ömrü: edge cihaz 8-80 saat (aktiviteye göre).

Vizyon: Sürdürülebilir AI Çağı

  • Y1: 3 W → mobil/edge.
  • Y3: 10 W → laptop, smart camera.
  • Y10: 30 W → workstation, datacenter blade.
  • Y100: 100 W → datacenter (sıvı soğutma).
  • Y1000: 100 W ama 100× performans → fotonik + 3D istif.

Türkiye için: Edge AI cihazları yeni pazar. SIDRA-tabanlı 24-saat-pil cihazları 2027-2028’den itibaren ürünleştirilebilir. ASELSAN, BİLGEM, üniversite startupları bu alanın öncüsü olabilir.

Daha İleri