part of a series on |
machine learning and data mining |
---|
part of a series on |
artificial intelligence (ai) |
---|
![]() |
machine learning (tsz. machine learnings)
A gépi tanulás (machine learning, ML) a mesterséges intelligencia egy ága, amelynek célja, hogy a számítógépek képesek legyenek tanulni tapasztalatból (adatokból) anélkül, hogy explicit módon programoznánk őket minden esetre.
Az algoritmusok minták alapján általánosítanak, és képesek előrejelzést, döntést vagy osztályozást végezni új, ismeretlen bemenetekre is.
Típus | Jelentés |
---|---|
Supervised Learning (felügyelt tanulás) | Van bemenet + kimenet, a modell ez alapján tanul |
Unsupervised Learning (felügyelet nélküli tanulás) | Csak bemenetek vannak, nincs címke |
Semi-supervised Learning (félig felügyelt) | Kevés címkézett + sok címkézetlen adat |
Reinforcement Learning (megerősítéses tanulás) | A modell próbálgatással tanul jutalom alapján |
Fogalom | Magyarázat |
---|---|
Adatpont (sample) | Egy megfigyelés (pl. egy kép, szöveg vagy számok sora) |
Jellemző (feature) | Egy adat leíró tulajdonsága (pl. kor, méret, ár) |
Címke (label) | A tanításhoz tartozó helyes válasz |
Modell | A tanulás során képzett algoritmus |
Tanítás (training) | Az a folyamat, ahol az algoritmus megtanulja az adatok közti összefüggést |
Predikció | Előrejelzés új adatra a tanult modell alapján |
Feladat | Példa | Algoritmusok |
---|---|---|
Osztályozás | E-mail SPAM vagy nem | KNN, SVM, Naive Bayes, döntési fa |
Regresszió | Ház árának becslése | Lineáris regresszió, SVR, neurális háló |
Feladat | Példa | Algoritmusok |
---|---|---|
Klaszterezés | Vásárlók szegmentálása | K-means, DBSCAN |
Dimenziócsökkentés | Vizualizáció, zajcsökkentés | PCA, t-SNE, UMAP |
Anomáliadetektálás | Csalásfelderítés | LOF, Isolation Forest |
Alkalmazás | Példa |
---|---|
Játékok | AlphaGo, sakk |
Robotika | Mozgástanulás jutalom alapján |
Önvezetés | Kormányzás és gáz optimalizálása környezeti visszajelzés alapján |
Könyvtár / platform | Használat |
---|---|
scikit-learn | Klasszikus ML (Python) |
TensorFlow / Keras | Mélytanulás |
PyTorch | Haladó neurális hálók |
XGBoost / LightGBM | Boosting alapú modellek |
Google Colab | Ingyenes notebook környezet GPU-val |
Feladat | Metrika |
---|---|
Osztályozás | Accuracy, precision, recall, F1-score, ROC-AUC |
Regresszió | MAE, MSE, RMSE, R² |
Klaszterezés | Silhouette-score, Davies–Bouldin-index |
RL | Kumulatív jutalom, tanulási görbe |
Kihívás | Magyarázat |
---|---|
Adatéhség | Sok, jó minőségű adat kell a tanításhoz |
Túltanulás (overfitting) | A modell a tanítókészletet „bemagolja” |
Átláthatatlanság | „Fekete doboz” hatás – nem mindig tudjuk, mit miért dönt a modell |
Etikai kockázatok | Elfogultság, diszkrimináció, adatvédelmi kérdések |
from sklearn.datasets import load_iris
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
X, y = load_iris(return_X_y=True)
X_train, X_test, y_train, y_test = train_test_split(X, y)
model = LogisticRegression(max_iter=200)
model.fit(X_train, y_train)
print("Pontosság:", model.score(X_test, y_test))
Tulajdonság | Részletek |
---|---|
Definíció | Algoritmusok, amelyek adatokból tanulnak szabályokat |
Alaptípusok | Felügyelt, felügyelet nélküli, megerősítéses |
Felhasználás | Szöveg, kép, hang, pénzügy, orvostudomány, játékok |
Módszerek | Regresszió, klaszterezés, osztályozás, optimalizáció |
Előnyök | Automatizál, skálázható, mintafelismerő |
Kihívások | Adatigény, etika, komplexitás |
Ha szeretnéd, mutatok példát mélytanulási modellekre (pl. képfelismerés CNN-nel), vagy elkészíthetünk egy teljes machine learning pipeline-t Pythonban adattisztítástól kiértékelésig.