Üdvözlöm, Ön a data compression szó jelentését keresi. A DICTIOUS-ban nem csak a data compression szó összes szótári jelentését megtalálod, hanem megismerheted az etimológiáját, a jellemzőit és azt is, hogyan kell a data compression szót egyes és többes számban mondani. Minden, amit a data compression szóról tudni kell, itt található. A data compression szó meghatározása segít abban, hogy pontosabban és helyesebben fogalmazz, amikor beszélsz vagy írsz. Adata compression és más szavak definíciójának ismerete gazdagítja a szókincsedet, és több és jobb nyelvi forráshoz juttat.
(informatika) A Data compression (adat-tömörítés) az informatika egyik alapvető technikája, amely lehetővé teszi az adatok méretének csökkentését úgy, hogy az információ tartalma megmarad (vagy elfogadható mértékben veszteséges lesz). Célja, hogy hatékonyabban tároljunk vagy gyorsabban továbbítsunk adatokat (például hálózaton keresztül). A Data compression egy olyan eljárás, amely során egy adott adathalmazt kisebb méretűvé alakítunk át bizonyos algoritmusok segítségével.
Például: Egy eredeti 10 MB méretű kép tömörítve lehet csak 2 MB.
Miért fontos?
Kevesebb hely a háttértáron (pl. SSD-n, pendrive-on).
Gyorsabb átvitel az interneten vagy hálózaton.
Csökkentett költség tárhelyszolgáltatásnál.
Hatékonyabb memóriakezelés.
2. Fő típusok
Adattömörítés lehet:
a) Veszteségmentes (Lossless Compression)
A tömörítés után pontosan visszaállítható az eredeti adat.
Használat:
Szövegek
Forráskódok
Dokumentumok
Archív fájlok (.zip, .rar)
Bizonyos képtípusok (pl. PNG)
Jellemző algoritmusok:
Huffman-kódolás
Lempel-Ziv-Welch (LZW)
Deflate (ZIP, GZIP)
Burrows-Wheeler Transform (BWT)
b) Veszteséges (Lossy Compression)
A tömörítés során bizonyos adatok végleg elvesznek, de a végeredmény vizuálisan vagy hangzásban még elfogadható.
Használat:
Képek (JPEG, WebP)
Hang (MP3, AAC)
Videó (H.264, H.265, AV1)
Jellemző algoritmusok:
DCT (Discrete Cosine Transform — JPEG)
MDCT (Modified DCT — MP3, AAC)
Motion compensation + transform coding (videók)
3. Hogyan működik?
A tömörítés mögött matematikai és statisztikai módszerek állnak.
a) Redundancia eltávolítása
Sok adatban vannak ismétlődő mintázatok:
AAAAABBBBCCCC → 5A4B4C
Cél: ismétlések, fölösleges bitek eltávolítása.
b) Entropia csökkentése
Ha az adatok nem egyformán valószínűek, hatékonyabban kódolhatók.
Például a “space” karakter gyakori egy szövegben → rövidebb kódolást kap.
Huffman-kódolás tipikus példa.
c) Predikció + maradék tárolása
A kódoló megjósolja a következő adatot a korábbiakból → csak az eltérés kerül tárolásra.