Sinyal Zinciri ve Paketleme
Memristörden chip pin'ine — uçtan uca veri yolu.
Önkoşul
Bu bölümde öğreneceklerin
- Tam sinyal zincirini (memristör → TIA → ADC → compute → DMA → PCIe) tanımla
- PCIe arayüzünün bant genişliği ve gecikme özelliklerini açıkla
- Çip paketleme teknolojilerini (BGA, FC-BGA, CoWoS) karşılaştır
- Y1 paketleme seçimini ve elektriksel/termal sonuçlarını söyle
- Sinyal bütünlüğü, ESD koruma ve I/O kontrolünü kısaca anla
Açılış: Memristörden Pin'e Yol
Bir SIDRA inference: voltaj uygulanır → akım çıkar → sayıya dönüşür → CPU’ya gider. Bu yol sinyal zinciri.
Aynı zamanda çip pinlerinden dış dünyaya bağlanır: PCIe, güç, sıcaklık sensörü, JTAG. Paketleme bu fiziksel ara yüzdür.
Bu bölüm uçtan uca yolu özetler.
Sezgi: Veri Akışı
Memristör hücresi (analog G)
↓ (Ohm: I = G·V)
WL/BL kavşağı (akım)
↓ (KCL: sütun toplamı)
TIA (akım → voltaj)
↓
ADC veya TDC (analog → dijital)
↓
Compute Engine (aktivasyon, bias, norm)
↓
L1 → L2 → L3 SRAM (DMA)
↓
PCIe controller (16 GB/s)
↓
PCIe pinleri (BGA paketleme)
↓
PCIe slot (host CPU)Her katman önceki sürümlerde detaylanmıştı. Bu bölüm paketleme tarafına bakar.
Formalizm: PCIe ve Paketleme
PCIe 5.0 spec (Y1):
- 4 lane.
- 32 GT/s per lane (Giga Transfer/s).
- Net bandwith: 16 GB/s bidirectional.
- Latency: 100-500 ns (round-trip CPU ↔ chip).
Y1 PCIe paketi:
PCIe TLP (Transaction Layer Packet):
- Header (3-4 DW = 12-16 byte).
- Data payload (256-4096 byte tipik).
- Overhead: ~5%.
Tipik inference: input 1 KB → 1 PCIe transaksiyon. 100 ns’de tamamlanır.
Paketleme türleri:
| Tür | Pin sayısı | Hız | Termal | Maliyet |
|---|---|---|---|---|
| QFP (legacy) | 100-200 | düşük | düşük | ucuz |
| BGA | 500-2000 | orta | orta | orta |
| FC-BGA | 500-3000 | yüksek | iyi | pahalı |
| CoWoS (TSMC) | 5000+ | çok yüksek | çok iyi | çok pahalı |
Y1 seçimi: FC-BGA (Flip-Chip Ball Grid Array).
- ~1500 pin (PCIe + power + I/O).
- 30 mm × 30 mm paket.
- Termal: heat spreader üst yüzeyde.
FC-BGA detayları:
Flip-chip: die “yüzü aşağı” paketlenir. Bumps (lehim toplar) substrat’a bağlanır. Substrat üzerinde ball grid array → PCB’ye lehimlenir.
Avantaj:
- Kısa elektriksel yol (yüksek hız).
- Direkt güç dağıtımı (bump üzerinden).
- Termal: heat spreader die’a doğrudan bağlanır.
Y1 paket içi:
- Die: 10 mm × 10 mm.
- Substrat: 30 mm × 30 mm.
- Heat spreader: 25 mm × 25 mm.
- Ball pitch: 0.5 mm → ~50 × 50 = 2500 grid.
Sinyal bütünlüğü (Signal Integrity, SI):
Yüksek hız PCIe (32 GT/s) için:
- Karakteristik empedans: 100 Ω differential.
- Eye diagram: BER < 10⁻¹².
- Equalization: pre-emphasis + decision feedback.
Y1 PCIe arayüzü on-chip equalization içerir.
ESD (Electrostatic Discharge) protection:
Pin başı ESD diodes (HBM 2 kV class). Statik yük → toprak’a yönlendirilir, çip korunur.
Power delivery (PDN):
Y1 3 W @ 1 V = 3 A. Bumps üzerinden dağıtılır (~100 power bump). Decoupling cap on-package + on-die.
Heterojen paketleme (Y10+ hedef):
CoWoS (Chip-on-Wafer-on-Substrate) — TSMC patent. Çoklu die bir interposer üzerinde:
- SIDRA (logic + crossbar).
- HBM (high-bandwidth memory).
- I/O die.
Y10 hedef: SIDRA + 1 GB HBM3 stack. Bandwidth 1 TB/s.
3D istif (Y100):
İki SIDRA die üst üste. TSV (Through-Silicon Via) ile bağlı.
Yoğunluk 2×, bandwith 2×, ama soğutma daha zor.
PCB tasarım:
Y1 PCB:
- 8-12 katman.
- PCIe slot (CPU bağlantı).
- Güç regülatörleri (12 V → 1 V switching).
- Saat osilatör.
- USB JTAG (debug).
PCB tipik 100 mm × 60 mm. Datacenter add-in card form factor.
Yield ve test:
Wafer testi:
- Die sortlama (probe card).
- Yield ~%75.
- Iyi die’lar paketlenir.
- Paket testi: %95 başarı.
Net pakete-edilen ürün: 0.75 × 0.95 = %71 final yield.
Üretim hattı (Modül 7’de detay):
- Wafer: TSMC (28 nm CMOS).
- BEOL memristör: SIDRA atölyesi (UNAM).
- Paketleme: ASE veya Amkor (Tayvan).
- Test: SIDRA atölyesi.
Yıllık üretim hedefi:
Y1 yılda ~10K-100K çip (atölye kapasitesi). Y10 milyonlar (mini-fab kurulumla). Y100 onlarca milyon (tam fab).
Deney: Tam Sinyal Zinciri Süre Analizi
GPT-2 1 token inference end-to-end:
| Aşama | Süre |
|---|---|
| 1. CPU input prep | 100 ns |
| 2. PCIe transfer (in) | 50 ns |
| 3. Y1 L3 → L2 → L1 DMA | 50 ns |
| 4. 12 layer MVM + compute | 5 µs |
| 5. Y1 L1 → L2 → L3 DMA | 50 ns |
| 6. PCIe transfer (out) | 50 ns |
| 7. CPU post-process | 100 ns |
| Toplam | ~5.4 µs |
Inference: 5 µs. Wrap (PCIe + DMA + CPU): 0.4 µs. PCIe overhead %7.
İçinde: Y1 net 4.9 µs, dış 0.4 µs. PCIe efficient.
Throughput:
Tek thread sıralı: 5.4 µs/token = 185K token/s.
Pipelined (16 paralel cluster): 16× = 3M token/s.
H100 batch 32: ~10M token/s. SIDRA Y1 batch 16: 3M token/s. 3× yavaş ama 200× az enerji.
Kısa Sınav
Laboratuvar Görevi
Y1 paketleme seçenekleri analizi.
Seçenekler:
- QFP (300 pin, ucuz, düşük hız).
- BGA (1500 pin, orta).
- FC-BGA (1500 pin, yüksek hız, iyi termal). Y1 seçimi.
- CoWoS (5000 pin, çok pahalı). Y10 hedefi.
Sorular:
(a) PCIe 5.0 × 16 lane (toplam 64 GB/s) için kaç pin? (b) Y1 termal disipasyon (3 W) için ne tür heat spreader? (c) Y10 (30 W) için paket değişimi? (d) Y100 (100 W) için CoWoS + sıvı soğutma toplam maliyet? (e) Türkiye’de paketleme hattı kurulabilir mi?
Çözümler
(a) PCIe 5.0 × 16 lane = 64 differential pair × 2 (TX/RX) × 2 (diff) = 256 pin sadece PCIe için. + güç + I/O + diğer = ~1200 pin toplam. FC-BGA gerekli.
(b) 3 W → küçük heat spreader (10 mm² Cu plate yeterli). Pasif soğutma yeter (R_th ~15°C/W).
(c) Y10 30 W → büyük heat spreader + heat sink. Paket aynı (FC-BGA), ama heat sink ekstra.
(d) Y100 CoWoS: ~100/sistem. Toplam çip+soğutma: ~1B kapital.
(e) Türkiye’de paketleme: ASELSAN, BİLGEM düşük-pin BGA paketlemesi yapar. FC-BGA ileri seviye, henüz Türkiye’de yok ama 5-10 yıl içinde mümkün. Yatırım ~$50M-100M (orta-büyük fab tek line).
Özet Kart
- Sinyal zinciri: memristör → TIA → ADC → compute → DMA → PCIe.
- Y1 PCIe: 5.0 × 4 lane = 16 GB/s.
- Paketleme: FC-BGA, ~1500 pin, 30×30 mm.
- Termal: flip-chip heat spreader, R_th 15°C/W.
- ESD koruma: her pin diodes.
- Y10 hedef: CoWoS + HBM3 (1 TB/s).
- Y100: 3D istif + sıvı.
- Inference end-to-end: Y1 ~5.4 µs/token (~7% overhead).
Vizyon: Heterojen Entegrasyon Çağı
- Y1: Tek-die FC-BGA.
- Y3: SIDRA + sensör chiplet (kamera AI).
- Y10: SIDRA + HBM3 CoWoS.
- Y100: SIDRA + photonic + HBM 3D istif.
- Y1000: Wafer-scale (Cerebras tarzı) + bio-uyumlu.
Türkiye için: Heterojen paketleme mini-fab altyapısı gerektirir. ASELSAN ile işbirliği + ulusal yatırım Y10 dönemi için gerçekçi.
Daha İleri
- Bir sonraki bölüm: 5.14 — Y1 / Y10 / Y100 Karşılaştırması
- Önceki: 5.12 — Metal Hatlar ve IR Drop
- Paketleme: Lau, Heterogeneous Integrations, Springer 2018.
- PCIe spec: PCI-SIG resmi dokümantasyon.
- CoWoS: Yu et al., TSMC presentations.