📐 Modül 4 · Matematik Cephanesi · Bölüm 4.2 · 12 dk okuma

Ohm + Kirchhoff = Analog MVM

İki yasayla bir matris çarpımı — SIDRA'nın fizik-cebir köprüsü.

Önkoşul

Bu bölümde öğreneceklerin

Ohm yasası I = G·V'nin çarpma işlemi olduğunu tek-hücre seviyesinde göster
Kirchhoff akım yasasının (KCL) toplama işlemi olduğunu açıkla
İki yasanın birlikte tek bir crossbar'da N×N MVM ürettiğini denklem denklem türet
Bir 3×3 SIDRA crossbar üzerinde elle MVM hesabı yap
Analog MVM'in temel hata kaynaklarını (programlama, gürültü, drift, IR drop) say

Açılış: 1827 + 1845 = 2026 SIDRA

İki temel elektrik yasası, neredeyse 200 yıllık:

Ohm yasası (1827): $V = I \cdot R$ veya $I = G \cdot V$ .
Kirchhoff akım yasası, KCL (1845): Bir düğüme giren akım = çıkan akım.

İki cümle. İkisi de lise fiziğinden tanıdık. Ama bu iki yasa bir araya getirildiğinde, modern AI’ın en yoğun matematiksel işlemini (matris-vektör çarpımı) fiziksel olarak üretirler. Hesap değil — fizik kanunu uyarınca otomatik.

Bu, SIDRA’nın merkezi numarasıdır. Bir 256×256 crossbar’a giriş voltajları uygula → çıkış akımları anında 256-boyutlu MVM sonucudur. Saat çevrimi yok. CPU/GPU instruction yok. Sadece elektronlar Ohm + KCL’ye uyar.

Bu bölüm o iki yasayı yan yana koyar, üst üste bindirir, ve crossbar matematiğini sıfırdan kurar. 4.1’de gördüğümüz MVM, burada silikona dökülür.

Sezgi: Bir Hücre Çarpar, Bir Sütun Toplar

Bir tek memristör hücresi:

İletkenliği $G$ olan bir memristör. Üzerine voltaj $V$ uygulanır. Ohm der ki:

I = G \cdot V

Bu çarpma işlemidir. $G$ ve $V$ iki sayı, $I$ çarpımları.

$G = 100$ µS, $V = 0.1$ V → $I = 10$ µA.
$G$ “ağırlık” (programlanmış), $V$ “veri” (anlık).
Çarpma fizik kanunuyla yapıldı, hiçbir transistör çalışmadı.

256 memristör bir sütunda:

256 satır, bir sütun. Her satır $i$ ‘ye voltaj $V_i$ uygulanıyor; her hücre $G_{ij} V_i$ akımı üretiyor. Hepsi aynı sütun teline akıyor. Kirchhoff der ki:

I_{\text{sütun}} = \sum_{i=1}^{256} G_{ij} V_i

Bu iç çarpımdır — vektör çarpımı. 4.1’de matematiksel olarak tanımladığımız işlem.

256 sütun paralel:

256 sütun, hepsi aynı 256 girişi okuyor. Her sütun farklı bir iç çarpım üretir → toplam 256-boyutlu çıkış vektörü. Bu, 256×256 matrisin 256-vektörle çarpımıdır = MVM.

Tek adımda: 65,536 çarpma + 256 × 255 = 65,280 toplama. Hepsi paralel, ~10 ns’de. Bir CPU bu işi 130,000 ns’de yapar.

Sezgi sonucu: Crossbar = analog MVM motoru. Her hücre bir sinaps (3.7’de gördük), her sütun bir nöron’un sinaptik integrasyonu. Fizik kanunları matematiksel işlemi bedavaya yapar.

Formalizm: İki Yasadan Crossbar Denklemine

L1 · Başlangıç

Ohm yasası (kompakt):

I = G \cdot V

$G$ = iletkenlik (Siemens, S = 1/Ω). Memristörde 0.1-100 µS arası tipik.
$V$ = voltaj (V).
$I$ = akım (A).

Kirchhoff akım yasası (KCL):

Bir düğüme giren akımların toplamı, çıkan akımların toplamına eşittir:

\sum I_{\text{in}} = \sum I_{\text{out}}

Eşdeğer ifade: bir düğümdeki tüm akımların cebirsel toplamı sıfırdır.

Crossbar geometrisi:

       Sütun 1  Sütun 2  ...  Sütun M
        |        |              |
Satır 1 -[G11]---[G12]----...--[G1M]---
        |        |              |
Satır 2 -[G21]---[G22]----...--[G2M]---
        |        |              |
  ...
        |        |              |
Satır N -[GN1]---[GN2]----...--[GNM]---
        |        |              |
        I1       I2     ...    IM (sütun akımları, ölçülen)

Yatay teller (satırlar): voltaj uygulanır $V_i$ ( $i = 1..N$ ).
Dikey teller (sütunlar): akım toplanır $I_j$ ( $j = 1..M$ ).
Kesişimde memristör $G_{ij}$ .

Sütun $j$ ‘nin toplam akımı (Ohm + KCL):

I_j = \sum_{i=1}^{N} G_{ij} \cdot V_i

Vektörel:

\mathbf{I} = \mathbf{G}^\top \mathbf{V}

Bu MVM’dir. Matris $\mathbf{G}^\top \in \mathbb{R}^{M \times N}$ ağırlıkları taşır; vektör $\mathbf{V} \in \mathbb{R}^N$ giriş.

L2 · Tam

Pratik SIDRA Y1 boyutları:

$N = M = 256$ (256×256 crossbar).
$G_{ij}$ → 256 ayrık seviye (8 bit). Aralık: $G_{\min} = 1$ µS, $G_{\max} = 100$ µS.
$V_i$ → DAC’tan gelir. 8 bit giriş tipik. Aralık: 0 V — 0.5 V (memristör SET’i tetiklemez).
$I_j$ → ADC’ye gider. 8 bit veya 12 bit kuantizasyon.

Bir MVM enerji bütçesi:

256 satır × 0.5 V (max) = 128 V·row toplam (eğer hepsi aktifse).
Her hücre tipik 50 µS × 0.25 V = 12.5 µA → 256² = 65K hücre × 12.5 µA = ~800 mA toplam (worst case). Pratikte sparsity ile ~10× azalır.
Tek MVM süresi 10 ns → enerji ~80 mA × 0.25 V × 10 ns = 200 pJ (worst case). Tipik ~26 pJ.

Bit doğruluğu:

Crossbar 8 bit programlama × 8 bit giriş = teorik 16 bit ürün. Ama:

ADC kuantizasyon: 8 bit ADC → çıkış 8 bit (0-255).
Gürültü (termal, shot, drift): ~4-6 bit etkin SNR.

Pratik etkin doğruluk: ~6 bit. Modern AI inference için yeterli (INT8 quantization standart). FP32 gerektiren işler crossbar’a uygun değil.

Çıkış akımının yorumlanması:

ADC ham akımı sayıya çevirir: $I_j = k \cdot y_j$ , $k$ kalibrasyon sabiti (mA → integer). Eğer $G_{\max} = 100$ µS, $V_{\max} = 0.5$ V, 256 satır → $I_{\max} = 256 \cdot 100 \cdot 0.5 = 12.8$ mA. ADC bu aralığı 0-255’e çevirir.

L3 · Derin

Hata kaynakları (analog MVM’in zayıflıkları):

Programlama hatası: memristör hedef $G$ ‘ye tam programlanamaz. Tipik $\pm 5\%$ varyasyon. ISPP (Incremental Step Pulse Programming) ile $\pm 1\%$ ‘e indirilebilir (Modül 6.4’te detay).
Termal gürültü (Johnson): $\sigma_I = \sqrt{4 k T G \Delta f}$ . 256 hücre paralel → toplam gürültü $\sqrt{N} \cdot \sigma$ . SNR genelde 30-40 dB.
Shot noise: $\sigma_I = \sqrt{2 q I \Delta f}$ . Düşük akımda (HRS hücreler) baskın.
Drift / 1/f gürültü: memristör iletkenliği zamanla yavaşça değişir. 10 ms — 1 yıl ölçeklerinde retention sorunu (Modül 5.10’da detay).
IR drop: uzun bakır hatlar üzerinde voltaj düşer. 256 satır boyunca $V_i$ tam olarak ulaşmaz; başında 0.5 V, sonunda 0.45 V. Çıkış akımları sapar (Modül 5.12’de detay).
Sneak-path akımları: seçici (1S1R) yokken yarı-seçili hücrelerden istenmeyen akım sızar. 1T1R + 1S1R çözümleri (Modül 5.2-5.3).
Sıcaklık bağımlılığı: $G(T)$ Arrhenius bağımlılığı. 25°C → 85°C arasında %20-50 kayma. Sıcaklık kalibrasyonu zorunlu.

Toplam etkin SNR: ~30 dB → ~5 bit etkin (signal/noise oranı 32). Sınıflama için yeterli; regresyon için gereken durumlarda ek teknikler (averaging, error correction).

Karşı önlemler:

ISPP programlama (5.5)
Sıcaklık kompansasyonu (5.10)
Çoklu okuma + ortalama (3-10 örnek)
Online kalibrasyon (her N inference’ta bir referans MVM)
ECC (Error Correction Code) — analog için yeni teknikler (5.8)

Crossbar’ın matematiksel mükemmelliği vs gerçeklik:

İdeal: $I = G^\top V$ , sınırsız hassasiyet, sıfır gürültü.

Gerçek: $I = G^\top V + \epsilon$ , $\epsilon$ ~5% normal hata. AI inference için kabul edilebilir; eğitim için (gradyan kayması) zorlu.

Deney: 3×3 Crossbar Üzerinde Manuel MVM

3 satır × 3 sütun crossbar. İletkenlikler (μS):

\mathbf{G} = \begin{bmatrix} 50 & 20 & 30 \\ 10 & 80 & 25 \\ 40 & 15 & 60 \end{bmatrix}

Giriş voltajları (V):

\mathbf{V} = \begin{bmatrix} 0.2 \\ 0.4 \\ 0.1 \end{bmatrix}

Sütun 1 akımı:

$I_1 = G_{11} V_1 + G_{21} V_2 + G_{31} V_3 = 50 \cdot 0.2 + 10 \cdot 0.4 + 40 \cdot 0.1 = 10 + 4 + 4 = 18$ µA

Sütun 2:

$I_2 = 20 \cdot 0.2 + 80 \cdot 0.4 + 15 \cdot 0.1 = 4 + 32 + 1.5 = 37.5$ µA

Sütun 3:

$I_3 = 30 \cdot 0.2 + 25 \cdot 0.4 + 60 \cdot 0.1 = 6 + 10 + 6 = 22$ µA

Çıkış vektörü:

\mathbf{I} = \begin{bmatrix} 18 \\ 37.5 \\ 22 \end{bmatrix} \text{µA}

ADC sonrası (kalibrasyon $k = 0.5$ µA/integer):

\mathbf{y} = \begin{bmatrix} 36 \\ 75 \\ 44 \end{bmatrix}

Bu, bir 3 nöronlu MLP katmanının çıkışıdır (henüz aktivasyon uygulanmadan). 3 sinapsa sahip 3 nöron, paralel.

Süre: 10 ns. Enerji: $(18+37.5+22) \cdot 10^{-6} \cdot 0.25 \cdot 10 \cdot 10^{-9} \approx 200$ fJ. 9 MAC için 200 fJ → 22 fJ/MAC = 45 TOPS/W (bu küçük örnek için; 256×256’da daha düşük çünkü ADC overhead artar).

Karşılaştırma: Aynı işi yapmak için 32-bit MAC dijital devre ~5-10 pJ harcar. SIDRA crossbar 200-500× daha verimli.

Kısa Sınav

1/6Tek bir memristör hücresinde Ohm yasası ne işlem yapar?

Laboratuvar Görevi

SIDRA Y1 256×256 crossbar enerji-verim analizi.

Veri:

Crossbar: 256×256 = 65,536 memristör.
Tipik MVM enerjisi: 26 pJ.
ADC enerjisi: 1 pJ × 256 sütun = 256 pJ (büyük overhead!).
DAC enerjisi: 0.5 pJ × 256 satır = 128 pJ.
Çevre kontrol: 50 pJ.
Toplam MVM enerjisi: ~460 pJ (crossbar 6%, ADC 56%, DAC 28%, kontrol 10%).
MVM süresi: 10 ns (crossbar settling) + 5 ns (ADC convert) = 15 ns.

Sorular:

(a) MVM başına etkin TOPS/W? (b) ADC enerjisi crossbar’dan çok daha büyük. Bu nasıl azaltılır? (c) Y10 hedefi 8-bit ADC yerine 6-bit + on-chip ortalama. ADC enerjisi nasıl değişir? Toplam etkin verim? (d) GPT-2 small inference (~250 MFLOPS) Y1’de kaç saniye sürer? Toplam enerji? (e) Aynı GPT-2 inference H100 GPU’da 700W ile mikrosaniyeler. Hangi metrikte SIDRA Y1 önde?

Çözümler

(a) 65,536 MAC / 460 pJ = 1.42 × 10¹¹ MAC/J = 142 GOPS/W ≈ 0.14 TOPS/W (ADC overhead dahil). Pratik SIDRA Y1 daha yüksek (10 TOPS/W) çünkü ADC daha verimli tasarlanır + multi-MVM amortize.

(b) ADC azaltma stratejileri: (1) düşük çözünürlük (6-bit yeter), (2) sadece aktif sütunları okuma (sparsity), (3) sample-and-hold ile zamansal paylaşım, (4) zaman-domain ADC (Modül 5.6 TDC).

(c) 6-bit ADC: ~0.25 pJ × 256 = 64 pJ (4× düşüş). + on-chip ortalama (4 sample): ~250 pJ. Toplam MVM: 26 + 64 + 128 + 50 + 80 (averaging) = 350 pJ. Verim: 65K / 350 = 187 GOPS/W. Y10 hedef tasarım daha agresif.

(d) GPT-2 inference: ~250 MFLOPS × 1 token. SIDRA Y1 30 TOPS → 250 MFLOPS / 30 TOPS = ~8 ms / token. Enerji: 8 ms × 3 W = 24 mJ.

(e) H100 GPT-2 inference: ~1 µs / token, 700 W → enerji: 700 µJ. SIDRA: 8 ms / token, 24 mJ. Süre: H100 8000× daha hızlı. Enerji: SIDRA 30× daha verimli (24 mJ / 700 µJ ≈ 34). Yani: SIDRA edge’de ölçek küçük, enerji önemli; H100 datacenter’da hız öncelik.

Sonuç: Aynı çiplerin doğru kategorisi farklı. SIDRA edge inference, H100 batch training. Yan yana çalışırlar, biri diğerinin yerine geçmez.

Özet Kart

Ohm = çarpma: $I = G \cdot V$ . Memristör tek hücresi.
KCL = toplama: sütun akımı = $\sum$ hücre akımları.
İkisi birleşince MVM: $\mathbf{I} = \mathbf{G}^\top \mathbf{V}$ . 256×256 crossbar = 65K MAC paralel.
Süre: ~10 ns (Ohmic settling).
Enerji: ~26 pJ crossbar + ADC/DAC overhead.
Etkin doğruluk: ~5-6 bit (programlama 8, gürültü kayıpları).
Hata kaynakları: programlama (~5%), termal/shot gürültü, drift, IR drop, sneak-path, sıcaklık.
Kazanç: dijital MAC’a göre ~100-500× enerji verim.

Vizyon: Saf Analog'tan Hibrit Mimariye

Saf analog MVM (sadece Ohm + KCL) sınırlıdır: hassasiyet, ölçek, kararlılık. Geleceğin SIDRA mimarisi hibrit — analog crossbar + dijital çevre + algoritmik kompansasyon:

Y1 (bugün): Saf analog MVM, dijital ADC/DAC. ~10 TOPS/W, 8 bit etkin.
Y3 (2027): TDC (Time-to-Digital Converter) okuma — Modül 5.6. ADC overhead %50 düşer. Etkin 9 bit.
Y10 (2029): Çoklu-bit hücre (16 seviye → 256 seviye → 1024 seviye). Sıcaklık-aware kalibrasyon. Etkin 10-12 bit.
Y100 (2031+): Fotonik MVM + elektronik birleşim. Hibrit Ohmic + optical interferometric. ~1000 TOPS/W. Tam analog FP16 eşdeğeri.
Y1000 (uzun vade): Süperiletken (4 K) crossbar. Sıfır direnç → IR drop yok, gürültü çok düşük. Etkin 16+ bit. Kuantum-AI hibrit.

Türkiye için stratejik anlam: Analog MVM tasarımı yarıiletken bilgi birikimi gerektirir — devre tasarımı, malzeme, ölçüm. Türkiye’de ASIC tasarım ekosistemi (TÜBİTAK BİLGEM, üniversiteler, ASELSAN) bu açıdan doğal hazır. SIDRA atölyesi bu birikimi bir araya getiren ilk somut platform.

Beklenmedik gelecek: Crossbar-tabanlı bilgisayar. Bugün crossbar AI hızlandırıcısı. 2030’larda crossbar = ana CPU + bellek + AI tek karta. Von Neumann mimarisi (CPU ↔ RAM ayrımı) ortadan kalkar. SIDRA bu paradigma değişiminin ilk büyük üreticilerinden biri olabilir.

Daha İleri

Bir sonraki bölüm: 4.3 — Türev ve Gradient
Önceki: 4.1 — Vektör, Matris, MVM
Bağlantı: 1.5 — Direnç ve Ohm Yasası — fizik temeli.
Bağlantı: 3.7 — Memristör ↔ Sinaps Eşleşmesi — biyoloji köprüsü.
Klasik analog MVM: Mead, Analog VLSI and Neural Systems, 1989.
Memristör crossbar matematiği: Hu et al., Dot-product engine for neuromorphic computing, DAC 2016.
In-memory computing genel: Verma et al., In-memory computing: Advances and prospects, IEEE Solid-State Circuits Magazine 2019.

Önkoşul

Bu bölümde öğreneceklerin

🪝 Açılış: 1827 + 1845 = 2026 SIDRA

🧭 Sezgi: Bir Hücre Çarpar, Bir Sütun Toplar

📐 Formalizm: İki Yasadan Crossbar Denklemine

🧪 Deney: 3×3 Crossbar Üzerinde Manuel MVM

📝 Kısa Sınav

🛠️ Laboratuvar Görevi

🗂️ Özet Kart

🔮 Vizyon: Saf Analog'tan Hibrit Mimariye

📚 Daha İleri