A gépi tanulás (Machine Learning, ML) algoritmusai különböző problémák megoldására alkalmasak, mint például az adatok osztályozása, regresszió, klaszterezés vagy éppen mintázatok felismerése. Az ML algoritmusok három fő kategóriába sorolhatók:
Az alábbiakban bemutatom a leggyakrabban használt gépi tanulási algoritmusokat, példákkal együtt.
Ezek az algoritmusok címkézett adatokkal dolgoznak. Két fő típus: osztályozás (classification) és regresszió (regression).
Egyszerű regressziós algoritmus, amely egyenes vonallal modellezi az adatok közötti kapcsolatot.
from sklearn.linear_model import LinearRegression
import numpy as np
# Adatok
X = np.array(, , , , ]) # Független változó
y = np.array() # Függő változó
# Modell betanítása
model = LinearRegression()
model.fit(X, y)
# Előrejelzés
predicted = model.predict(np.array(]))
print("Előrejelzett érték:", predicted)
Egy fa-alapú osztályozási algoritmus.
from sklearn.tree import DecisionTreeClassifier
# Adatok
X = , , , ] # Bemeneti változók
y = # Célváltozó (osztályok)
# Modell létrehozása és tanítása
model = DecisionTreeClassifier()
model.fit(X, y)
# Osztályozás
prediction = model.predict(])
print("Osztályozás eredménye:", prediction)
Egy hatékony algoritmus osztályozásra és regresszióra, amely egy hipersíkot használ az adatok elválasztására.
from sklearn.svm import SVC
# Adatok
X = , , , ]
y =
# Modell létrehozása és tanítása
model = SVC(kernel='linear')
model.fit(X, y)
# Előrejelzés
prediction = model.predict(])
print("Osztályozás eredménye:", prediction)
Ezek az algoritmusok nem címkézett adatokkal dolgoznak. Céljuk az adatok közötti struktúra vagy mintázat feltárása.
Az adatok csoportokba rendezése a távolságuk alapján.
from sklearn.cluster import KMeans
import numpy as np
# Adatok
data = np.array(, , , , , ])
# Modell
kmeans = KMeans(n_clusters=2, random_state=0)
kmeans.fit(data)
# Klaszterek és címkék
print("Klaszter középpontok:", kmeans.cluster_centers_)
print("Címkék:", kmeans.labels_)
Dimenziócsökkentési algoritmus.
from sklearn.decomposition import PCA
import numpy as np
# Adatok
data = np.array(, , , ])
# PCA
pca = PCA(n_components=2)
reduced_data = pca.fit_transform(data)
print("Csökkentett dimenziójú adatok:\n", reduced_data)
Ezek az algoritmusok a környezetből érkező visszacsatolás (jutalom vagy büntetés) alapján tanulnak. Ezek implementációjára leggyakrabban a gym
könyvtárat használják.
Egy egyszerű megerősítéses tanulási példa egy 2D rácsban történő navigációval.
import numpy as np
# Q-táblázat inicializálása
q_table = np.zeros((5, 5, 4)) # Állapotok: 5x5 rács, Akciók: 4 (fel, le, bal, jobb)
# Példa: Q-learning iteráció
state = (0, 0) # Kezdeti állapot
action = 2 # Példa akció (balra)
reward = -1 # Példa jutalom
next_state = (0, 1) # Következő állapot
# Q-érték frissítése
alpha = 0.1 # Tanulási ráta
gamma = 0.9 # Jövőbeli jutalom súlya
q_table = q_table + alpha * (
reward + gamma * np.max(q_table) - q_table
)
print("Q-táblázat frissítve:", q_table)
A neurális hálózatok mély tanulási (Deep Learning) algoritmusok alapjai.
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense
import numpy as np
# Adatok
X = np.array(, , , ])
y = np.array() # XOR probléma
# Modell létrehozása
model = Sequential([
Dense(4, input_dim=2, activation='relu'),
Dense(1, activation='sigmoid')
])
# Modell fordítása és tanítása
model.compile(optimizer='adam', loss='binary_crossentropy', metrics=)
model.fit(X, y, epochs=100, verbose=0)
# Előrejelzés
prediction = model.predict(])
print("Előrejelzés:", prediction)