recurrent neural network

Angol

Főnév

recurrent neural network (tsz. recurrent neural networks)

(informatika, mesterséges intelligencia) rekurrens neurális hálózat

A Recurrent Neural Network (röviden: RNN, magyarul: rekurrens neurális hálózat) egy speciális neurális hálózattípus, amelyet idősorok, szöveg, beszéd, és más szekvenciális adatok feldolgozására terveztek. A hagyományos mély neurális hálózatokkal ellentétben az RNN-ek memóriával rendelkeznek – képesek megőrizni az előző lépések információit, így időben összefüggő adatokon tanulni.

Miért van szükség RNN-re?

A klasszikus neurális hálók (pl. perceptronok, CNN-ek) minden bemenetet függetlennek kezelnek. Ez problémát okoz olyan feladatoknál, ahol a bemenetek sorrendje fontos:

mondat feldolgozás (a szó sorrend számít),
időalapú mérések (pl. hőmérséklet-idősor),
zenei dallam, hangfelvétel, stb.

Például egy mondat értelme más lehet attól függően, milyen szavak állnak előtte. Az RNN célja, hogy megőrizze a kontextust azáltal, hogy „emlékszik” a korábbi bemeneti elemekre.

Az RNN alapötlete

Az RNN-ek ismétlődő struktúrával rendelkeznek. Egy adott pillanatban nemcsak az aktuális bemenetet (x_t), hanem a korábbi állapotot (h_{t-1}) is figyelembe veszik. Így az aktuális kimenet és állapot együttesen a következőképpen számítható:

h_t = f(Wx_t + Uh_{t-1} + b)
y_t = g(Vh_t + c)

Itt:

x_t: aktuális bemenet,
h_t: rejtett állapot (emlékezet),
y_t: kimenet,
W, U, V: súlymátrixok,
f(): aktivációs függvény (pl. tanh vagy ReLU).

Működés egyszerű példán keresztül

Tegyük fel, hogy egy RNN-t betanítunk arra, hogy felismerje, tartalmaz-e egy szöveg egy bizonyos kulcsszót. A bemenet karakterenként jön: H, e, l, l, o. Az RNN minden egyes karaktert egyesével dolgoz fel, és a korábbi karakterek alapján fokozatosan építi fel a megértését.

Előnyök

Szekvenciális feldolgozás: Bemeneteket egymás után dolgoz fel, így jól alkalmazható beszédfelismerésre, nyelvi modellezésre.
Megőrzi az információt: Az előző lépések kimeneteit újra felhasználja a döntéshozatalhoz.
Kompakt architektúra: Azonos súlyokat alkalmaz minden időlépésben.

Hátrányok

1. Elhaló és robbanó gradiens probléma

Hosszú szekvenciák esetén a gradiens (amit visszaterjesztünk a tanulás során) vagy túl kicsi lesz (→ tanulás leáll), vagy túl nagy (→ instabil).
Ezért az egyszerű RNN-ek rosszul tanulnak hosszú távú függőségeket.

2. Tanítás nehézsége

Mivel a visszaterjesztés időben is történik (Backpropagation Through Time – BPTT), a tanulási folyamat erőforrás-igényes és instabil lehet.

Fejlettebb RNN-típusok

1. LSTM (Long Short-Term Memory)

Az LSTM egy speciális RNN, amely kapukkal (gates) szabályozza, hogy az információ hogyan áramlik az időlépések között. Képes hosszú távú függőségeket is megtartani, így gyakran használják gépi fordításban, chatbotoknál, stb.

A három fő kapu:

Beviteli kapu (input gate): milyen új információt vegyünk fel?
Elfelejtési kapu (forget gate): mit töröljünk a memóriából?
Kimeneti kapu (output gate): mit adjunk tovább?

2. GRU (Gated Recurrent Unit)

A GRU egyszerűsített változata az LSTM-nek – kevesebb kaput használ, gyorsabban tanul, és gyakran hasonló pontosságot ér el. Két fő komponense:

Frissítési kapu (update gate),
Visszaállítási kapu (reset gate).

Alkalmazások

Nyelvi modellek: predikció – „Mi a következő szó?”
Beszédfelismerés: hanghullám → szöveg
Idősor előrejelzés: pl. részvényárfolyam, hőmérséklet
Fordító rendszerek (pl. angol → magyar): egy RNN kódolja a bemenetet, másik dekódolja a célnyelvre.
Zenei és szöveg generálás: RNN-ekkel akár stílusban hű szövegeket vagy dallamokat is generálhatunk.

Példa kódszinten (egyszerűsített – Python, Keras)

from keras.models import Sequential
from keras.layers import SimpleRNN, Dense

model = Sequential()
model.add(SimpleRNN(50, input_shape=(10, 1)))  # 10 lépés hosszú sorozat, 1 feature per lépés
model.add(Dense(1))  # Egy kimenet

model.compile(optimizer='adam', loss='mse')

Ábrás magyarázat (szöveges formában)

           t-1       t         t+1
Input -->-->-->-->...
           |        |        |
           v        v        v
               
           |        |        |
          ...      ...      ...

Az h_t mindig az előző állapot h_{t-1} és az aktuális bemenet x_t alapján készül el, így a hálózat emlékezik.

Összefoglalás

A rekurrens neurális hálók (RNN-ek) kulcsfontosságúak olyan gépi tanulási problémák megoldásában, ahol a sorrendiség számít. Alapvető építőkövei a beszédfelismerő rendszereknek, fordító motoroknak, chatbotoknak, és időbeli előrejelző algoritmusoknak. Bár egyszerű formájukban korlátozottak, az LSTM és GRU architektúrák révén megbízhatóan kezelnek összetett, hosszú távú függőségeket is.

További információk

recurrent neural network - Szótár.net (en-hu)
recurrent neural network - Sztaki (en-hu)
recurrent neural network - Merriam–Webster
recurrent neural network - Cambridge
recurrent neural network - WordNet
recurrent neural network - Яндекс (en-ru)
recurrent neural network - Google (en-hu)
recurrent neural network - Wikidata
recurrent neural network - Wikipédia (angol)

recurrent neural network

Angol

Főnév

Miért van szükség RNN-re?

Az RNN alapötlete

Működés egyszerű példán keresztül

Előnyök

Hátrányok

1. Elhaló és robbanó gradiens probléma

2. Tanítás nehézsége

Fejlettebb RNN-típusok

1. LSTM (Long Short-Term Memory)

2. GRU (Gated Recurrent Unit)

Alkalmazások

Példa kódszinten (egyszerűsített – Python, Keras)

Ábrás magyarázat (szöveges formában)

Összefoglalás

További információk

Enciclo

Wikious

Sapientia

Scientia

Boobota

Anandapedia

Sagapedia

Wikithot