part of a series on |
machine learning and data mining |
---|
structured prediction (tsz. structured predictions)
Alkalmazás | Kimeneti struktúra |
---|---|
Beszédfelismerés | Szó- vagy hangszekvencia |
Mondatértelmezés | Syntaktikai fa (pl. függőségi elemzés) |
Névelemfelismerés | Címkék sorozata (pl. → PERSON) |
Gépi fordítás | Fordított mondatszekvencia |
Képfeldolgozás | Pixel-címkézési mátrix (pl. szegmentáció) |
Bioinformatika | DNS-szekvencia struktúrája |
A hagyományos predikció (pl. klasszifikáció, regresszió) egy értéket jósol meg:
A structured prediction esetében a kimenet összetett, elemei függnek egymástól:
A cél egy olyan függvény megtanulása:
ahol:
A predikció során az algoritmus azt a kimeneti struktúrát keresi, amely maximalizálja egy értékelőfüggvényt:
Ez gyakran kombinatorikus keresési probléma (nagyon sok lehetséges kimeneti struktúra van).
Módszer | Rövid leírás |
---|---|
Conditional Random Fields (CRF) | Címkék sorozatának modellezésére – figyelembe veszi a szomszédos címkéket |
Structured SVM (SSVM) | Margin maximalizálás strukturált kimenetekre |
Recurrent Neural Networks (RNN) | Szekvenciális tanulás (pl. LSTM, GRU) |
Transformer-alapú modellek | Bonyolult struktúrák tanulására (pl. BERT, T5) |
Graph Neural Networks (GNN) | Gráf-struktúrák esetén (pl. molekulák, hálózatok) |
Feladat: szavakhoz rendeljük hozzá, hogy személynév, szervezet, hely, stb.
Bemenet:
Kimenet:
Ez strukturált kimenet, mert a címkék között szekvenciális függés van: ha egy szó “B-PER”, a következő valószínűleg “I-PER”.
A klasszikus SVM-et kiterjeszti strukturált kimenetekre:
A CRF egy probabilisztikus modell, amely jól használható szekvencia-címkézési feladatokhoz.
A CRF globálisan optimalizálja a címkesorozatot.
Kihívás | Magyarázat |
---|---|
Nagy keresési tér | Nagyon sok lehetséges kimeneti struktúra létezik |
Kimeneti függések | A kimeneti elemek nem függetlenek – egymást befolyásolják |
Tanítás nehézsége | A tanulási célfüggvény komplex, nem mindig konvex |
Pontosság vs sebesség | A pontos modell gyakran lassú – kompromisszum kell |
import sklearn_crfsuite
crf = sklearn_crfsuite.CRF(
algorithm='lbfgs',
c1=0.1, c2=0.1,
max_iterations=100,
all_possible_transitions=True
)
crf.fit(X_train, y_train)
predictions = crf.predict(X_test)
Modell | Feladat |
---|---|
CRF | Szekvenciacímkézés, POS-tagging |
BiLSTM + CRF | NER, chunking, szekvenciaelemzés |
Transformer | Fordítás, kérdésválaszolás |
GNN | Molekulamodellezés, szociális gráfok |
Fogalom | Leírás |
---|---|
Structured prediction | Olyan tanulási feladat, ahol a kimenet összetett és egymással összefüggő elemekből áll |
Alkalmazás | Szövegfeldolgozás, fordítás, szegmentálás, képelemzés |
Algoritmusok | CRF, Structured SVM, RNN, Transformer, GNN |
Előnyök | Kontextusérzékeny, gazdagabb kimenetek |
Kihívás | Bonyolult tanítás, sok kimeneti lehetőség, optimalizálási nehézségek |