Enerji ve Termal Yönetim
3 W bütçesinde nasıl kalınır — DVFS, soğutma, güç dağıtımı.
Önkoşul
Bu bölümde öğreneceklerin
- Y1 güç bütçesini bileşen bileşen ayır
- DVFS (Dynamic Voltage and Frequency Scaling) prensibini açıkla
- Termal direnç ve soğutma stratejilerini hesapla
- Power gating ve clock gating tasarımı detayla
- Y10 → Y100 güç ölçeklenebilirlik sorunlarını söyle
Açılış: 3 W = Bir LED Ampul
Y1’in TDP (Thermal Design Power) 3 W. Bir LED ampul kadar. H100 bunun 233 katı (700 W).
Bu 3 W:
- Enerji ekonomisi (edge cihaz: pil ömrü).
- Sıcaklık (chip 60°C civarında, soğutma kolay).
- Bütçe disiplin (her CU’nun payı belli).
Bu bölüm Y1’in 3 W bütçesini nasıl koruduğunu, DVFS’in nasıl çalıştığını, ve sıcaklığı nasıl yönettiğini anlatır.
Sezgi: Üç Güç Stratejisi
Statik güç:
Transistör sızıntısı (off durumunda hâlâ akar). 28 nm CMOS Y1 için 50 mW (%2 TDP). Yönetilebilir.
Dinamik güç:
CMOS switching: .
- : aktivite faktörü (~%5-30).
- : switching kapasitör.
- : voltaj.
- : saat hızı.
Y1 dinamik güç: ~2 W (TDP’nin büyük çoğu).
Crossbar güç:
Memristör read enerjisi (statik DC). Aktif crossbar başı ~10 mW.
Y1 strateji:
- DVFS: aktivite az → frekans + voltaj düşür → enerji azalır.
- Power gating: boşta CU’ları kapat (sıfır güç).
- Clock gating: sadece aktif blokların saati çalış.
Formalizm: Güç Hesabı ve Termal
Y1 güç bütçesi:
| Bileşen | Güç | Pay |
|---|---|---|
| Crossbar (analog) | 0.5 W | 17% |
| ADC | 1.0 W | 33% |
| DAC | 0.8 W | 27% |
| Compute engine | 0.3 W | 10% |
| SRAM + DMA | 0.2 W | 7% |
| Clock + I/O | 0.2 W | 7% |
| Toplam | 3.0 W | TDP |
Aktivite faktörü:
Inference’ta tüm blok değil, kısmi aktivite. Tipik %30 aktivite → 3 W. %100 aktivite (worst case) → 10 W (TDP’yi aşar, throttle).
DVFS (Dynamic Voltage Frequency Scaling):
| Mod | Frekans | Voltaj | Güç | Performans |
|---|---|---|---|---|
| Idle | 100 MHz | 0.6 V | 100 mW | ~1% |
| Düşük | 250 MHz | 0.7 V | 500 mW | 25% |
| Orta | 500 MHz | 0.8 V | 1.5 W | 50% |
| Yüksek | 1 GHz | 1.0 V | 3 W | 100% |
Güç V²f ile orantılı → düşük V büyük tasarruf. Modern CPU/GPU’da standart.
Power gating:
İdle CU’ya güç kesilir. Boşta sıfır güç. Yeniden aç ~1 µs. Y1 16 cluster’da bağımsız gating.
Termal yönetim:
Çip 3 W → ısı yayılır. Soğutma yetersizse sıcaklık artar → memristör drift hızlanır → ECC tolerance düşer.
Termal direnç:
- : güç (W).
- : termal direnç (°C/W).
- : sıcaklık artışı (oda sıcaklığı üstüne).
Y1 soğutma seçenekleri:
| Soğutma | @ 3W | Cihaz örneği | |
|---|---|---|---|
| Pasif (heat spreader) | 15 °C/W | 45°C | Cep telefonu |
| Küçük heat sink | 8 °C/W | 24°C | Laptop |
| Aktif fan | 3 °C/W | 9°C | Embedded server |
| Sıvı | 0.5 °C/W | 1.5°C | Datacenter |
Y1 için pasif heat spreader yeterli (45°C @ 25°C oda = 70°C). Memristör 85°C’a kadar OK.
Y10 (30 W) → küçük heat sink. Y100 (100 W) → aktif fan. Y1000 sıvı.
Throttling:
Sıcaklık 80°C’a yaklaşırsa frekans düşür → güç azal → sıcaklık düşer. Geri besleme.
Tipik throttle: 80°C → DVFS Yüksek → Orta. 90°C → Düşük. 100°C → kritik shutdown.
Sıcaklık sensörleri:
Y1 her cluster’da 4 thermal sensor (16 toplam). On-chip kalibre. Compute engine sürekli okur.
Voltaj regülatörü:
Çip iç voltajları 0.6-1.0 V. Dış güç 1.8 V veya 3.3 V. LDO (Low Dropout Regulator) veya switching converter ara.
Y1: switched capacitor regulator + bandgap reference. Çıkış 0.6/0.8/1.0 V seçilebilir (DVFS).
Verim:
LDO: V_out / V_in = %33 (1.0 V çıkış, 3.3 V giriş). Düşük. Switching: %85-90. Daha iyi.
Y1 switching converter kullanır.
Power delivery network (PDN):
3 W çekmek için ~3 A @ 1 V. Kalın metal hatlar. PDN tipik üst 5 katmanı kullanır (M16-M20).
IR drop in PDN: 100 mV droop (1 V’ta %10) tolerable. Decoupling capacitors (~1 nF/mm²) helps.
Boot-time power-up:
Çip açılışı: voltajlar yükselir, saat ağacı stabilize, kalibre, model yükle. ~1 saniye.
Düşük-güç modlar:
- Active: tam çalışma, 3 W.
- Idle: clock gated, sadece SRAM aktif, ~50 mW.
- Sleep: çoğu blok off, periyodik wake, ~5 mW.
- Deep sleep: sadece RTC, ~0.5 mW (memristör non-volatile, model kaybolmaz).
Mobil cihazda deep sleep çoğu zaman → batarya ömrü uzar.
Termal modeling:
Çip thermal map: hot spots ADC + DAC bölgesinde. Compiler hot spot’lar arası iş dağıtır (load balancing).
Spread heat over chip → uniform temperature → memristor drift uniform.
Y100 termal: 100 W, 1 cm², heat density ~10 W/cm² → cooling kritik. Microfluidic cooling (Modül 5.15).
Deney: Y1 Power Profile
Senaryo: GPT-2 inference, %30 aktivite ortalaması.
Anlık güç profili:
| Faz | Aktif blok | Güç |
|---|---|---|
| Token input | DMA + L3 | 0.5 W |
| Embedding lookup | 1 cluster | 1.5 W |
| Layer 1 attention | 4 CU | 2.0 W |
| Layer 1 FFN | 4 CU | 2.5 W |
| Layer 2-12 sırayla | 4 CU/seq | 2.5 W ortalama |
| Output projection | 1 cluster | 1.0 W |
| Token output | DMA + L3 | 0.5 W |
Ortalama: ~2 W per token (1 µs süresince).
1000 token (1 ms): 2 W × 1 ms = 2 mJ. Soğutma kolay.
Worst case (sürekli max):
Tüm 16 cluster + tüm CU’lar aktif → ~10 W. TDP 3W’ı aşar → throttle: frekans 1 GHz → 500 MHz, güç 4 W → hâlâ aşar → 250 MHz, 1.5 W. Performans yarı.
Sıcaklık:
- Pasif soğutma 15°C/W → 3 W × 15 = 45°C üstü oda.
- 25°C oda + 45°C = 70°C die. Memristör 85°C limiti içinde.
1 saat sürekli: 3 W × 3600 s = 10.8 kJ enerji. Pil cinsinden: 18650 hücresi (3.6 V × 3 Ah = 39 kJ) ile 3.6 saat sürekli. Mobil senaryoda %10 aktivite → 36 saat.
Kısa Sınav
Laboratuvar Görevi
Edge cihaz batarya ömrü hesabı.
Cihaz:
- SIDRA Y1 (3 W TDP, %10 aktivite ortalama) + ARM CPU (1 W) + sensors (0.5 W).
- Pil: 4000 mAh @ 3.7 V = 14.8 Wh = 53 kJ.
Kullanım senaryoları:
(a) %100 SIDRA aktif (sürekli inference): pil ömrü? (b) %10 SIDRA aktif (always-on listening): pil ömrü? (c) %1 SIDRA + idle (deep sleep çoğu zaman): pil ömrü? (d) Karşılaştırma: aynı cihaz GPU yerine: 700 W * %1 = 7 W batarya yetersiz. (e) SIDRA-tabanlı akıllı kulaklık batarya hedefi?
Çözümler
(a) 3 W (SIDRA) + 1 W (CPU) + 0.5 W (sensor) = 4.5 W. 14.8 / 4.5 = 3.3 saat. Sürekli AI çalıştırma kısa.
(b) 0.3 W (SIDRA %10) + 1 W + 0.5 W = 1.8 W. 14.8 / 1.8 = 8.2 saat. Konuşma asistanı için iyi.
(c) 0.03 W (SIDRA %1) + 0.05 W (CPU sleep) + 0.1 W (sensor) = 0.18 W. 14.8 / 0.18 = 82 saat = 3.4 gün. Akıllı saat tipi sürekli wear.
(d) GPU 7 W + sistem 1.5 W = 8.5 W → 1.7 saat. SIDRA 8.2 saat = 5× daha uzun.
(e) SIDRA Y1 tabanlı kulaklık 24 saat batarya ömrü hedefi gerçekçi (always-on speech recognition + translation).
Özet Kart
- Y1 TDP: 3 W.
- Güç bütçesi: ADC %33, DAC %27, crossbar %17, compute %10.
- DVFS: 4 mod, V²f tasarruf.
- Soğutma: Y1 pasif, Y10 heat sink, Y100 aktif/sıvı.
- Power gating: boş bloklar off.
- Sıcaklık: Y1 ~70°C (limit 85°C).
- Pil ömrü: edge cihaz 8-80 saat (aktiviteye göre).
Vizyon: Sürdürülebilir AI Çağı
- Y1: 3 W → mobil/edge.
- Y3: 10 W → laptop, smart camera.
- Y10: 30 W → workstation, datacenter blade.
- Y100: 100 W → datacenter (sıvı soğutma).
- Y1000: 100 W ama 100× performans → fotonik + 3D istif.
Türkiye için: Edge AI cihazları yeni pazar. SIDRA-tabanlı 24-saat-pil cihazları 2027-2028’den itibaren ürünleştirilebilir. ASELSAN, BİLGEM, üniversite startupları bu alanın öncüsü olabilir.
Daha İleri
- Bir sonraki bölüm: 5.12 — Metal Hatlar ve IR Drop
- Önceki: 5.10 — Gürültü Modelleri
- Termal yönetim: Pedram, Power Aware Design Methodologies, Springer.
- DVFS: Hennessy & Patterson, Computer Architecture, Bölüm 1.
- Mikroakışkan soğutma: Tuckerman & Pease, IEEE EDL 1981 (klasik).