Ohm + Kirchhoff = Analog MVM
İki yasayla bir matris çarpımı — SIDRA'nın fizik-cebir köprüsü.
Bu bölümde öğreneceklerin
- Ohm yasası I = G·V'nin çarpma işlemi olduğunu tek-hücre seviyesinde göster
- Kirchhoff akım yasasının (KCL) toplama işlemi olduğunu açıkla
- İki yasanın birlikte tek bir crossbar'da N×N MVM ürettiğini denklem denklem türet
- Bir 3×3 SIDRA crossbar üzerinde elle MVM hesabı yap
- Analog MVM'in temel hata kaynaklarını (programlama, gürültü, drift, IR drop) say
Açılış: 1827 + 1845 = 2026 SIDRA
İki temel elektrik yasası, neredeyse 200 yıllık:
- Ohm yasası (1827): veya .
- Kirchhoff akım yasası, KCL (1845): Bir düğüme giren akım = çıkan akım.
İki cümle. İkisi de lise fiziğinden tanıdık. Ama bu iki yasa bir araya getirildiğinde, modern AI’ın en yoğun matematiksel işlemini (matris-vektör çarpımı) fiziksel olarak üretirler. Hesap değil — fizik kanunu uyarınca otomatik.
Bu, SIDRA’nın merkezi numarasıdır. Bir 256×256 crossbar’a giriş voltajları uygula → çıkış akımları anında 256-boyutlu MVM sonucudur. Saat çevrimi yok. CPU/GPU instruction yok. Sadece elektronlar Ohm + KCL’ye uyar.
Bu bölüm o iki yasayı yan yana koyar, üst üste bindirir, ve crossbar matematiğini sıfırdan kurar. 4.1’de gördüğümüz MVM, burada silikona dökülür.
Sezgi: Bir Hücre Çarpar, Bir Sütun Toplar
Bir tek memristör hücresi:
İletkenliği olan bir memristör. Üzerine voltaj uygulanır. Ohm der ki:
Bu çarpma işlemidir. ve iki sayı, çarpımları.
- µS, V → µA.
- “ağırlık” (programlanmış), “veri” (anlık).
- Çarpma fizik kanunuyla yapıldı, hiçbir transistör çalışmadı.
256 memristör bir sütunda:
256 satır, bir sütun. Her satır ‘ye voltaj uygulanıyor; her hücre akımı üretiyor. Hepsi aynı sütun teline akıyor. Kirchhoff der ki:
Bu iç çarpımdır — vektör çarpımı. 4.1’de matematiksel olarak tanımladığımız işlem.
256 sütun paralel:
256 sütun, hepsi aynı 256 girişi okuyor. Her sütun farklı bir iç çarpım üretir → toplam 256-boyutlu çıkış vektörü. Bu, 256×256 matrisin 256-vektörle çarpımıdır = MVM.
Tek adımda: 65,536 çarpma + 256 × 255 = 65,280 toplama. Hepsi paralel, ~10 ns’de. Bir CPU bu işi 130,000 ns’de yapar.
Sezgi sonucu: Crossbar = analog MVM motoru. Her hücre bir sinaps (3.7’de gördük), her sütun bir nöron’un sinaptik integrasyonu. Fizik kanunları matematiksel işlemi bedavaya yapar.
Formalizm: İki Yasadan Crossbar Denklemine
Ohm yasası (kompakt):
- = iletkenlik (Siemens, S = 1/Ω). Memristörde 0.1-100 µS arası tipik.
- = voltaj (V).
- = akım (A).
Kirchhoff akım yasası (KCL):
Bir düğüme giren akımların toplamı, çıkan akımların toplamına eşittir:
Eşdeğer ifade: bir düğümdeki tüm akımların cebirsel toplamı sıfırdır.
Crossbar geometrisi:
Sütun 1 Sütun 2 ... Sütun M
| | |
Satır 1 -[G11]---[G12]----...--[G1M]---
| | |
Satır 2 -[G21]---[G22]----...--[G2M]---
| | |
...
| | |
Satır N -[GN1]---[GN2]----...--[GNM]---
| | |
I1 I2 ... IM (sütun akımları, ölçülen)- Yatay teller (satırlar): voltaj uygulanır ().
- Dikey teller (sütunlar): akım toplanır ().
- Kesişimde memristör .
Sütun ‘nin toplam akımı (Ohm + KCL):
Vektörel:
Bu MVM’dir. Matris ağırlıkları taşır; vektör giriş.
Pratik SIDRA Y1 boyutları:
- (256×256 crossbar).
- → 256 ayrık seviye (8 bit). Aralık: µS, µS.
- → DAC’tan gelir. 8 bit giriş tipik. Aralık: 0 V — 0.5 V (memristör SET’i tetiklemez).
- → ADC’ye gider. 8 bit veya 12 bit kuantizasyon.
Bir MVM enerji bütçesi:
- 256 satır × 0.5 V (max) = 128 V·row toplam (eğer hepsi aktifse).
- Her hücre tipik 50 µS × 0.25 V = 12.5 µA → 256² = 65K hücre × 12.5 µA = ~800 mA toplam (worst case). Pratikte sparsity ile ~10× azalır.
- Tek MVM süresi 10 ns → enerji ~80 mA × 0.25 V × 10 ns = 200 pJ (worst case). Tipik ~26 pJ.
Bit doğruluğu:
Crossbar 8 bit programlama × 8 bit giriş = teorik 16 bit ürün. Ama:
- ADC kuantizasyon: 8 bit ADC → çıkış 8 bit (0-255).
- Gürültü (termal, shot, drift): ~4-6 bit etkin SNR.
Pratik etkin doğruluk: ~6 bit. Modern AI inference için yeterli (INT8 quantization standart). FP32 gerektiren işler crossbar’a uygun değil.
Çıkış akımının yorumlanması:
ADC ham akımı sayıya çevirir: , kalibrasyon sabiti (mA → integer). Eğer µS, V, 256 satır → mA. ADC bu aralığı 0-255’e çevirir.
Hata kaynakları (analog MVM’in zayıflıkları):
-
Programlama hatası: memristör hedef ‘ye tam programlanamaz. Tipik varyasyon. ISPP (Incremental Step Pulse Programming) ile ‘e indirilebilir (Modül 6.4’te detay).
-
Termal gürültü (Johnson): . 256 hücre paralel → toplam gürültü . SNR genelde 30-40 dB.
-
Shot noise: . Düşük akımda (HRS hücreler) baskın.
-
Drift / 1/f gürültü: memristör iletkenliği zamanla yavaşça değişir. 10 ms — 1 yıl ölçeklerinde retention sorunu (Modül 5.10’da detay).
-
IR drop: uzun bakır hatlar üzerinde voltaj düşer. 256 satır boyunca tam olarak ulaşmaz; başında 0.5 V, sonunda 0.45 V. Çıkış akımları sapar (Modül 5.12’de detay).
-
Sneak-path akımları: seçici (1S1R) yokken yarı-seçili hücrelerden istenmeyen akım sızar. 1T1R + 1S1R çözümleri (Modül 5.2-5.3).
-
Sıcaklık bağımlılığı: Arrhenius bağımlılığı. 25°C → 85°C arasında %20-50 kayma. Sıcaklık kalibrasyonu zorunlu.
Toplam etkin SNR: ~30 dB → ~5 bit etkin (signal/noise oranı 32). Sınıflama için yeterli; regresyon için gereken durumlarda ek teknikler (averaging, error correction).
Karşı önlemler:
- ISPP programlama (5.5)
- Sıcaklık kompansasyonu (5.10)
- Çoklu okuma + ortalama (3-10 örnek)
- Online kalibrasyon (her N inference’ta bir referans MVM)
- ECC (Error Correction Code) — analog için yeni teknikler (5.8)
Crossbar’ın matematiksel mükemmelliği vs gerçeklik:
İdeal: , sınırsız hassasiyet, sıfır gürültü.
Gerçek: , ~5% normal hata. AI inference için kabul edilebilir; eğitim için (gradyan kayması) zorlu.
Deney: 3×3 Crossbar Üzerinde Manuel MVM
3 satır × 3 sütun crossbar. İletkenlikler (μS):
Giriş voltajları (V):
Sütun 1 akımı:
µA
Sütun 2:
µA
Sütun 3:
µA
Çıkış vektörü:
ADC sonrası (kalibrasyon µA/integer):
Bu, bir 3 nöronlu MLP katmanının çıkışıdır (henüz aktivasyon uygulanmadan). 3 sinapsa sahip 3 nöron, paralel.
Süre: 10 ns. Enerji: fJ. 9 MAC için 200 fJ → 22 fJ/MAC = 45 TOPS/W (bu küçük örnek için; 256×256’da daha düşük çünkü ADC overhead artar).
Karşılaştırma: Aynı işi yapmak için 32-bit MAC dijital devre ~5-10 pJ harcar. SIDRA crossbar 200-500× daha verimli.
Kısa Sınav
Laboratuvar Görevi
SIDRA Y1 256×256 crossbar enerji-verim analizi.
Veri:
- Crossbar: 256×256 = 65,536 memristör.
- Tipik MVM enerjisi: 26 pJ.
- ADC enerjisi: 1 pJ × 256 sütun = 256 pJ (büyük overhead!).
- DAC enerjisi: 0.5 pJ × 256 satır = 128 pJ.
- Çevre kontrol: 50 pJ.
- Toplam MVM enerjisi: ~460 pJ (crossbar 6%, ADC 56%, DAC 28%, kontrol 10%).
- MVM süresi: 10 ns (crossbar settling) + 5 ns (ADC convert) = 15 ns.
Sorular:
(a) MVM başına etkin TOPS/W? (b) ADC enerjisi crossbar’dan çok daha büyük. Bu nasıl azaltılır? (c) Y10 hedefi 8-bit ADC yerine 6-bit + on-chip ortalama. ADC enerjisi nasıl değişir? Toplam etkin verim? (d) GPT-2 small inference (~250 MFLOPS) Y1’de kaç saniye sürer? Toplam enerji? (e) Aynı GPT-2 inference H100 GPU’da 700W ile mikrosaniyeler. Hangi metrikte SIDRA Y1 önde?
Çözümler
(a) 65,536 MAC / 460 pJ = 1.42 × 10¹¹ MAC/J = 142 GOPS/W ≈ 0.14 TOPS/W (ADC overhead dahil). Pratik SIDRA Y1 daha yüksek (10 TOPS/W) çünkü ADC daha verimli tasarlanır + multi-MVM amortize.
(b) ADC azaltma stratejileri: (1) düşük çözünürlük (6-bit yeter), (2) sadece aktif sütunları okuma (sparsity), (3) sample-and-hold ile zamansal paylaşım, (4) zaman-domain ADC (Modül 5.6 TDC).
(c) 6-bit ADC: ~0.25 pJ × 256 = 64 pJ (4× düşüş). + on-chip ortalama (4 sample): ~250 pJ. Toplam MVM: 26 + 64 + 128 + 50 + 80 (averaging) = 350 pJ. Verim: 65K / 350 = 187 GOPS/W. Y10 hedef tasarım daha agresif.
(d) GPT-2 inference: ~250 MFLOPS × 1 token. SIDRA Y1 30 TOPS → 250 MFLOPS / 30 TOPS = ~8 ms / token. Enerji: 8 ms × 3 W = 24 mJ.
(e) H100 GPT-2 inference: ~1 µs / token, 700 W → enerji: 700 µJ. SIDRA: 8 ms / token, 24 mJ. Süre: H100 8000× daha hızlı. Enerji: SIDRA 30× daha verimli (24 mJ / 700 µJ ≈ 34). Yani: SIDRA edge’de ölçek küçük, enerji önemli; H100 datacenter’da hız öncelik.
Sonuç: Aynı çiplerin doğru kategorisi farklı. SIDRA edge inference, H100 batch training. Yan yana çalışırlar, biri diğerinin yerine geçmez.
Özet Kart
- Ohm = çarpma: . Memristör tek hücresi.
- KCL = toplama: sütun akımı = hücre akımları.
- İkisi birleşince MVM: . 256×256 crossbar = 65K MAC paralel.
- Süre: ~10 ns (Ohmic settling).
- Enerji: ~26 pJ crossbar + ADC/DAC overhead.
- Etkin doğruluk: ~5-6 bit (programlama 8, gürültü kayıpları).
- Hata kaynakları: programlama (~5%), termal/shot gürültü, drift, IR drop, sneak-path, sıcaklık.
- Kazanç: dijital MAC’a göre ~100-500× enerji verim.
Vizyon: Saf Analog'tan Hibrit Mimariye
Saf analog MVM (sadece Ohm + KCL) sınırlıdır: hassasiyet, ölçek, kararlılık. Geleceğin SIDRA mimarisi hibrit — analog crossbar + dijital çevre + algoritmik kompansasyon:
- Y1 (bugün): Saf analog MVM, dijital ADC/DAC. ~10 TOPS/W, 8 bit etkin.
- Y3 (2027): TDC (Time-to-Digital Converter) okuma — Modül 5.6. ADC overhead %50 düşer. Etkin 9 bit.
- Y10 (2029): Çoklu-bit hücre (16 seviye → 256 seviye → 1024 seviye). Sıcaklık-aware kalibrasyon. Etkin 10-12 bit.
- Y100 (2031+): Fotonik MVM + elektronik birleşim. Hibrit Ohmic + optical interferometric. ~1000 TOPS/W. Tam analog FP16 eşdeğeri.
- Y1000 (uzun vade): Süperiletken (4 K) crossbar. Sıfır direnç → IR drop yok, gürültü çok düşük. Etkin 16+ bit. Kuantum-AI hibrit.
Türkiye için stratejik anlam: Analog MVM tasarımı yarıiletken bilgi birikimi gerektirir — devre tasarımı, malzeme, ölçüm. Türkiye’de ASIC tasarım ekosistemi (TÜBİTAK BİLGEM, üniversiteler, ASELSAN) bu açıdan doğal hazır. SIDRA atölyesi bu birikimi bir araya getiren ilk somut platform.
Beklenmedik gelecek: Crossbar-tabanlı bilgisayar. Bugün crossbar AI hızlandırıcısı. 2030’larda crossbar = ana CPU + bellek + AI tek karta. Von Neumann mimarisi (CPU ↔ RAM ayrımı) ortadan kalkar. SIDRA bu paradigma değişiminin ilk büyük üreticilerinden biri olabilir.
Daha İleri
- Bir sonraki bölüm: 4.3 — Türev ve Gradient
- Önceki: 4.1 — Vektör, Matris, MVM
- Bağlantı: 1.5 — Direnç ve Ohm Yasası — fizik temeli.
- Bağlantı: 3.7 — Memristör ↔ Sinaps Eşleşmesi — biyoloji köprüsü.
- Klasik analog MVM: Mead, Analog VLSI and Neural Systems, 1989.
- Memristör crossbar matematiği: Hu et al., Dot-product engine for neuromorphic computing, DAC 2016.
- In-memory computing genel: Verma et al., In-memory computing: Advances and prospects, IEEE Solid-State Circuits Magazine 2019.