szó jelentését keresi. A DICTIOUS-ban nem csak a
szó összes szótári jelentését megtalálod, hanem megismerheted az etimológiáját, a jellemzőit és azt is, hogyan kell a
szót egyes és többes számban mondani. Minden, amit a
szóról tudni kell, itt található. A
szó meghatározása segít abban, hogy pontosabban és helyesebben fogalmazz, amikor beszélsz vagy írsz. A
és más szavak definíciójának ismerete gazdagítja a szókincsedet, és több és jobb nyelvi forráshoz juttat.
Főnév
linear regression (tsz. linear regressions)
- (informatika) lineáris regresszió
Linear regression – magyarul: lineáris regresszió – az egyik legegyszerűbb és legismertebb felügyelt gépi tanulási és statisztikai módszer, amelyet arra használnak, hogy kapcsolatot találjunk egy vagy több független változó (input) és egy függő változó (output) között. A cél az, hogy megbecsüljük a kimeneti értéket egyenesen keresztül.
🧠 1. Alapötlet
A lineáris regresszió azt feltételezi, hogy az adatok között lineáris kapcsolat van:
Ahol:
: a kimeneti (függő) változó
: a bemeneti (független) változó
: az egyenes tengelymetszete (intercept)
: a meredekség (slope)
: hibatag (reziduális eltérés)
🔢 2. Többváltozós (multivariáns) lineáris regresszió
Több független változó esetén:
🎯 3. Cél
A regressziós modell célja a súlyok (β-k) meghatározása, hogy:
- minimális legyen az előrejelzési hiba, azaz a reziduális négyzetösszeg (RSS):
📐 4. Feltételezések
A klasszikus lineáris regresszió feltételezi:
- Lineáris kapcsolat a változók között
- Normál eloszlású hibák
- Homoszkedaszticitás (egyenletes szórás)
- Független hibák
- Nincs többváltozós kollinearitás (független változók ne legyenek korreláltak)
🧮 5. Megoldás: legkisebb négyzetek módszere (OLS)
Zárt formájú megoldás mátrixalgebrával:
🛠️ 6. Python példa (scikit-learn
)
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
X = , , , , ]
y =
model = LinearRegression()
model.fit(X, y)
print("Meredekség:", model.coef_)
print("Tengelymetszet:", model.intercept_)
📊 7. Kiértékelési mutatók
- R² (determinációs együttható): mennyire magyarázza a modell az adatok szórását
- MSE (Mean Squared Error): átlagos négyzetes hiba
- MAE (Mean Absolute Error): átlagos abszolút hiba
- RMSE: négyzetgyök az MSE-ből
🧩 8. Alkalmazások
- 📈 Gazdasági előrejelzések (árfolyam, infláció)
- 🏠 Ingatlanár-becslés
- 🏥 Egészségügyi predikció (pl. vérnyomás életkor alapján)
- 🎓 Oktatási teljesítménybecslés
⚖️ 9. Előnyök és hátrányok
✅ Előnyök:
- Egyszerű, gyors
- Könnyen interpretálható
- Alacsony számítási igény
❌ Hátrányok:
- Csak lineáris kapcsolatokra jó
- Outlierek erősen torzíthatják
- Nem kezeli jól a nemlineáris mintázatokat
🧾 10. Összefoglalás
A lineáris regresszió:
- Egy alapvető, de erőteljes eszköz az adatok közti összefüggések feltárására és előrejelzésére
- A legjobban akkor működik, ha a kapcsolat valóban közel lineáris
- Jól szolgál kiindulási pontként más, komplexebb gépi tanulási modellek előtt