📐 Modül 4 · Matematik Cephanesi · Bölüm 4.2 · 12 dk okuma

Ohm + Kirchhoff = Analog MVM

İki yasayla bir matris çarpımı — SIDRA'nın fizik-cebir köprüsü.

Bu bölümde öğreneceklerin

  • Ohm yasası I = G·V'nin çarpma işlemi olduğunu tek-hücre seviyesinde göster
  • Kirchhoff akım yasasının (KCL) toplama işlemi olduğunu açıkla
  • İki yasanın birlikte tek bir crossbar'da N×N MVM ürettiğini denklem denklem türet
  • Bir 3×3 SIDRA crossbar üzerinde elle MVM hesabı yap
  • Analog MVM'in temel hata kaynaklarını (programlama, gürültü, drift, IR drop) say

Açılış: 1827 + 1845 = 2026 SIDRA

İki temel elektrik yasası, neredeyse 200 yıllık:

  • Ohm yasası (1827): V=IRV = I \cdot R veya I=GVI = G \cdot V.
  • Kirchhoff akım yasası, KCL (1845): Bir düğüme giren akım = çıkan akım.

İki cümle. İkisi de lise fiziğinden tanıdık. Ama bu iki yasa bir araya getirildiğinde, modern AI’ın en yoğun matematiksel işlemini (matris-vektör çarpımı) fiziksel olarak üretirler. Hesap değil — fizik kanunu uyarınca otomatik.

Bu, SIDRA’nın merkezi numarasıdır. Bir 256×256 crossbar’a giriş voltajları uygula → çıkış akımları anında 256-boyutlu MVM sonucudur. Saat çevrimi yok. CPU/GPU instruction yok. Sadece elektronlar Ohm + KCL’ye uyar.

Bu bölüm o iki yasayı yan yana koyar, üst üste bindirir, ve crossbar matematiğini sıfırdan kurar. 4.1’de gördüğümüz MVM, burada silikona dökülür.

Sezgi: Bir Hücre Çarpar, Bir Sütun Toplar

Bir tek memristör hücresi:

İletkenliği GG olan bir memristör. Üzerine voltaj VV uygulanır. Ohm der ki:

I=GVI = G \cdot V

Bu çarpma işlemidir. GG ve VV iki sayı, II çarpımları.

  • G=100G = 100 µS, V=0.1V = 0.1 V → I=10I = 10 µA.
  • GG “ağırlık” (programlanmış), VV “veri” (anlık).
  • Çarpma fizik kanunuyla yapıldı, hiçbir transistör çalışmadı.

256 memristör bir sütunda:

256 satır, bir sütun. Her satır ii‘ye voltaj ViV_i uygulanıyor; her hücre GijViG_{ij} V_i akımı üretiyor. Hepsi aynı sütun teline akıyor. Kirchhoff der ki:

Isu¨tun=i=1256GijViI_{\text{sütun}} = \sum_{i=1}^{256} G_{ij} V_i

Bu iç çarpımdır — vektör çarpımı. 4.1’de matematiksel olarak tanımladığımız işlem.

256 sütun paralel:

256 sütun, hepsi aynı 256 girişi okuyor. Her sütun farklı bir iç çarpım üretir → toplam 256-boyutlu çıkış vektörü. Bu, 256×256 matrisin 256-vektörle çarpımıdır = MVM.

Tek adımda: 65,536 çarpma + 256 × 255 = 65,280 toplama. Hepsi paralel, ~10 ns’de. Bir CPU bu işi 130,000 ns’de yapar.

Sezgi sonucu: Crossbar = analog MVM motoru. Her hücre bir sinaps (3.7’de gördük), her sütun bir nöron’un sinaptik integrasyonu. Fizik kanunları matematiksel işlemi bedavaya yapar.

Formalizm: İki Yasadan Crossbar Denklemine

L1 · Başlangıç

Ohm yasası (kompakt):

I=GVI = G \cdot V
  • GG = iletkenlik (Siemens, S = 1/Ω). Memristörde 0.1-100 µS arası tipik.
  • VV = voltaj (V).
  • II = akım (A).

Kirchhoff akım yasası (KCL):

Bir düğüme giren akımların toplamı, çıkan akımların toplamına eşittir:

Iin=Iout\sum I_{\text{in}} = \sum I_{\text{out}}

Eşdeğer ifade: bir düğümdeki tüm akımların cebirsel toplamı sıfırdır.

Crossbar geometrisi:

       Sütun 1  Sütun 2  ...  Sütun M
        |        |              |
Satır 1 -[G11]---[G12]----...--[G1M]---
        |        |              |
Satır 2 -[G21]---[G22]----...--[G2M]---
        |        |              |
  ...
        |        |              |
Satır N -[GN1]---[GN2]----...--[GNM]---
        |        |              |
        I1       I2     ...    IM (sütun akımları, ölçülen)
  • Yatay teller (satırlar): voltaj uygulanır ViV_i (i=1..Ni = 1..N).
  • Dikey teller (sütunlar): akım toplanır IjI_j (j=1..Mj = 1..M).
  • Kesişimde memristör GijG_{ij}.

Sütun jj‘nin toplam akımı (Ohm + KCL):

Ij=i=1NGijViI_j = \sum_{i=1}^{N} G_{ij} \cdot V_i

Vektörel:

I=GV\mathbf{I} = \mathbf{G}^\top \mathbf{V}

Bu MVM’dir. Matris GRM×N\mathbf{G}^\top \in \mathbb{R}^{M \times N} ağırlıkları taşır; vektör VRN\mathbf{V} \in \mathbb{R}^N giriş.

L2 · Tam

Pratik SIDRA Y1 boyutları:

  • N=M=256N = M = 256 (256×256 crossbar).
  • GijG_{ij} → 256 ayrık seviye (8 bit). Aralık: Gmin=1G_{\min} = 1 µS, Gmax=100G_{\max} = 100 µS.
  • ViV_i → DAC’tan gelir. 8 bit giriş tipik. Aralık: 0 V — 0.5 V (memristör SET’i tetiklemez).
  • IjI_j → ADC’ye gider. 8 bit veya 12 bit kuantizasyon.

Bir MVM enerji bütçesi:

  • 256 satır × 0.5 V (max) = 128 V·row toplam (eğer hepsi aktifse).
  • Her hücre tipik 50 µS × 0.25 V = 12.5 µA → 256² = 65K hücre × 12.5 µA = ~800 mA toplam (worst case). Pratikte sparsity ile ~10× azalır.
  • Tek MVM süresi 10 ns → enerji ~80 mA × 0.25 V × 10 ns = 200 pJ (worst case). Tipik ~26 pJ.

Bit doğruluğu:

Crossbar 8 bit programlama × 8 bit giriş = teorik 16 bit ürün. Ama:

  • ADC kuantizasyon: 8 bit ADC → çıkış 8 bit (0-255).
  • Gürültü (termal, shot, drift): ~4-6 bit etkin SNR.

Pratik etkin doğruluk: ~6 bit. Modern AI inference için yeterli (INT8 quantization standart). FP32 gerektiren işler crossbar’a uygun değil.

Çıkış akımının yorumlanması:

ADC ham akımı sayıya çevirir: Ij=kyjI_j = k \cdot y_j, kk kalibrasyon sabiti (mA → integer). Eğer Gmax=100G_{\max} = 100 µS, Vmax=0.5V_{\max} = 0.5 V, 256 satır → Imax=2561000.5=12.8I_{\max} = 256 \cdot 100 \cdot 0.5 = 12.8 mA. ADC bu aralığı 0-255’e çevirir.

L3 · Derin

Hata kaynakları (analog MVM’in zayıflıkları):

  1. Programlama hatası: memristör hedef GG‘ye tam programlanamaz. Tipik ±5%\pm 5\% varyasyon. ISPP (Incremental Step Pulse Programming) ile ±1%\pm 1\%‘e indirilebilir (Modül 6.4’te detay).

  2. Termal gürültü (Johnson): σI=4kTGΔf\sigma_I = \sqrt{4 k T G \Delta f}. 256 hücre paralel → toplam gürültü Nσ\sqrt{N} \cdot \sigma. SNR genelde 30-40 dB.

  3. Shot noise: σI=2qIΔf\sigma_I = \sqrt{2 q I \Delta f}. Düşük akımda (HRS hücreler) baskın.

  4. Drift / 1/f gürültü: memristör iletkenliği zamanla yavaşça değişir. 10 ms — 1 yıl ölçeklerinde retention sorunu (Modül 5.10’da detay).

  5. IR drop: uzun bakır hatlar üzerinde voltaj düşer. 256 satır boyunca ViV_i tam olarak ulaşmaz; başında 0.5 V, sonunda 0.45 V. Çıkış akımları sapar (Modül 5.12’de detay).

  6. Sneak-path akımları: seçici (1S1R) yokken yarı-seçili hücrelerden istenmeyen akım sızar. 1T1R + 1S1R çözümleri (Modül 5.2-5.3).

  7. Sıcaklık bağımlılığı: G(T)G(T) Arrhenius bağımlılığı. 25°C → 85°C arasında %20-50 kayma. Sıcaklık kalibrasyonu zorunlu.

Toplam etkin SNR: ~30 dB → ~5 bit etkin (signal/noise oranı 32). Sınıflama için yeterli; regresyon için gereken durumlarda ek teknikler (averaging, error correction).

Karşı önlemler:

  • ISPP programlama (5.5)
  • Sıcaklık kompansasyonu (5.10)
  • Çoklu okuma + ortalama (3-10 örnek)
  • Online kalibrasyon (her N inference’ta bir referans MVM)
  • ECC (Error Correction Code) — analog için yeni teknikler (5.8)

Crossbar’ın matematiksel mükemmelliği vs gerçeklik:

İdeal: I=GVI = G^\top V, sınırsız hassasiyet, sıfır gürültü.

Gerçek: I=GV+ϵI = G^\top V + \epsilon, ϵ\epsilon ~5% normal hata. AI inference için kabul edilebilir; eğitim için (gradyan kayması) zorlu.

Deney: 3×3 Crossbar Üzerinde Manuel MVM

3 satır × 3 sütun crossbar. İletkenlikler (μS):

G=[502030108025401560]\mathbf{G} = \begin{bmatrix} 50 & 20 & 30 \\ 10 & 80 & 25 \\ 40 & 15 & 60 \end{bmatrix}

Giriş voltajları (V):

V=[0.20.40.1]\mathbf{V} = \begin{bmatrix} 0.2 \\ 0.4 \\ 0.1 \end{bmatrix}

Sütun 1 akımı:

I1=G11V1+G21V2+G31V3=500.2+100.4+400.1=10+4+4=18I_1 = G_{11} V_1 + G_{21} V_2 + G_{31} V_3 = 50 \cdot 0.2 + 10 \cdot 0.4 + 40 \cdot 0.1 = 10 + 4 + 4 = 18 µA

Sütun 2:

I2=200.2+800.4+150.1=4+32+1.5=37.5I_2 = 20 \cdot 0.2 + 80 \cdot 0.4 + 15 \cdot 0.1 = 4 + 32 + 1.5 = 37.5 µA

Sütun 3:

I3=300.2+250.4+600.1=6+10+6=22I_3 = 30 \cdot 0.2 + 25 \cdot 0.4 + 60 \cdot 0.1 = 6 + 10 + 6 = 22 µA

Çıkış vektörü:

I=[1837.522]µA\mathbf{I} = \begin{bmatrix} 18 \\ 37.5 \\ 22 \end{bmatrix} \text{µA}

ADC sonrası (kalibrasyon k=0.5k = 0.5 µA/integer):

y=[367544]\mathbf{y} = \begin{bmatrix} 36 \\ 75 \\ 44 \end{bmatrix}

Bu, bir 3 nöronlu MLP katmanının çıkışıdır (henüz aktivasyon uygulanmadan). 3 sinapsa sahip 3 nöron, paralel.

Süre: 10 ns. Enerji: (18+37.5+22)1060.2510109200(18+37.5+22) \cdot 10^{-6} \cdot 0.25 \cdot 10 \cdot 10^{-9} \approx 200 fJ. 9 MAC için 200 fJ → 22 fJ/MAC = 45 TOPS/W (bu küçük örnek için; 256×256’da daha düşük çünkü ADC overhead artar).

Karşılaştırma: Aynı işi yapmak için 32-bit MAC dijital devre ~5-10 pJ harcar. SIDRA crossbar 200-500× daha verimli.

Kısa Sınav

1/6Tek bir memristör hücresinde Ohm yasası ne işlem yapar?

Laboratuvar Görevi

SIDRA Y1 256×256 crossbar enerji-verim analizi.

Veri:

  • Crossbar: 256×256 = 65,536 memristör.
  • Tipik MVM enerjisi: 26 pJ.
  • ADC enerjisi: 1 pJ × 256 sütun = 256 pJ (büyük overhead!).
  • DAC enerjisi: 0.5 pJ × 256 satır = 128 pJ.
  • Çevre kontrol: 50 pJ.
  • Toplam MVM enerjisi: ~460 pJ (crossbar 6%, ADC 56%, DAC 28%, kontrol 10%).
  • MVM süresi: 10 ns (crossbar settling) + 5 ns (ADC convert) = 15 ns.

Sorular:

(a) MVM başına etkin TOPS/W? (b) ADC enerjisi crossbar’dan çok daha büyük. Bu nasıl azaltılır? (c) Y10 hedefi 8-bit ADC yerine 6-bit + on-chip ortalama. ADC enerjisi nasıl değişir? Toplam etkin verim? (d) GPT-2 small inference (~250 MFLOPS) Y1’de kaç saniye sürer? Toplam enerji? (e) Aynı GPT-2 inference H100 GPU’da 700W ile mikrosaniyeler. Hangi metrikte SIDRA Y1 önde?

Çözümler

(a) 65,536 MAC / 460 pJ = 1.42 × 10¹¹ MAC/J = 142 GOPS/W ≈ 0.14 TOPS/W (ADC overhead dahil). Pratik SIDRA Y1 daha yüksek (10 TOPS/W) çünkü ADC daha verimli tasarlanır + multi-MVM amortize.

(b) ADC azaltma stratejileri: (1) düşük çözünürlük (6-bit yeter), (2) sadece aktif sütunları okuma (sparsity), (3) sample-and-hold ile zamansal paylaşım, (4) zaman-domain ADC (Modül 5.6 TDC).

(c) 6-bit ADC: ~0.25 pJ × 256 = 64 pJ (4× düşüş). + on-chip ortalama (4 sample): ~250 pJ. Toplam MVM: 26 + 64 + 128 + 50 + 80 (averaging) = 350 pJ. Verim: 65K / 350 = 187 GOPS/W. Y10 hedef tasarım daha agresif.

(d) GPT-2 inference: ~250 MFLOPS × 1 token. SIDRA Y1 30 TOPS → 250 MFLOPS / 30 TOPS = ~8 ms / token. Enerji: 8 ms × 3 W = 24 mJ.

(e) H100 GPT-2 inference: ~1 µs / token, 700 W → enerji: 700 µJ. SIDRA: 8 ms / token, 24 mJ. Süre: H100 8000× daha hızlı. Enerji: SIDRA 30× daha verimli (24 mJ / 700 µJ ≈ 34). Yani: SIDRA edge’de ölçek küçük, enerji önemli; H100 datacenter’da hız öncelik.

Sonuç: Aynı çiplerin doğru kategorisi farklı. SIDRA edge inference, H100 batch training. Yan yana çalışırlar, biri diğerinin yerine geçmez.

Özet Kart

  • Ohm = çarpma: I=GVI = G \cdot V. Memristör tek hücresi.
  • KCL = toplama: sütun akımı = \sum hücre akımları.
  • İkisi birleşince MVM: I=GV\mathbf{I} = \mathbf{G}^\top \mathbf{V}. 256×256 crossbar = 65K MAC paralel.
  • Süre: ~10 ns (Ohmic settling).
  • Enerji: ~26 pJ crossbar + ADC/DAC overhead.
  • Etkin doğruluk: ~5-6 bit (programlama 8, gürültü kayıpları).
  • Hata kaynakları: programlama (~5%), termal/shot gürültü, drift, IR drop, sneak-path, sıcaklık.
  • Kazanç: dijital MAC’a göre ~100-500× enerji verim.

Vizyon: Saf Analog'tan Hibrit Mimariye

Saf analog MVM (sadece Ohm + KCL) sınırlıdır: hassasiyet, ölçek, kararlılık. Geleceğin SIDRA mimarisi hibrit — analog crossbar + dijital çevre + algoritmik kompansasyon:

  • Y1 (bugün): Saf analog MVM, dijital ADC/DAC. ~10 TOPS/W, 8 bit etkin.
  • Y3 (2027): TDC (Time-to-Digital Converter) okuma — Modül 5.6. ADC overhead %50 düşer. Etkin 9 bit.
  • Y10 (2029): Çoklu-bit hücre (16 seviye → 256 seviye → 1024 seviye). Sıcaklık-aware kalibrasyon. Etkin 10-12 bit.
  • Y100 (2031+): Fotonik MVM + elektronik birleşim. Hibrit Ohmic + optical interferometric. ~1000 TOPS/W. Tam analog FP16 eşdeğeri.
  • Y1000 (uzun vade): Süperiletken (4 K) crossbar. Sıfır direnç → IR drop yok, gürültü çok düşük. Etkin 16+ bit. Kuantum-AI hibrit.

Türkiye için stratejik anlam: Analog MVM tasarımı yarıiletken bilgi birikimi gerektirir — devre tasarımı, malzeme, ölçüm. Türkiye’de ASIC tasarım ekosistemi (TÜBİTAK BİLGEM, üniversiteler, ASELSAN) bu açıdan doğal hazır. SIDRA atölyesi bu birikimi bir araya getiren ilk somut platform.

Beklenmedik gelecek: Crossbar-tabanlı bilgisayar. Bugün crossbar AI hızlandırıcısı. 2030’larda crossbar = ana CPU + bellek + AI tek karta. Von Neumann mimarisi (CPU ↔ RAM ayrımı) ortadan kalkar. SIDRA bu paradigma değişiminin ilk büyük üreticilerinden biri olabilir.

Daha İleri