data compression

Üdvözlöm, Ön a data compression szó jelentését keresi. A DICTIOUS-ban nem csak a data compression szó összes szótári jelentését megtalálod, hanem megismerheted az etimológiáját, a jellemzőit és azt is, hogyan kell a data compression szót egyes és többes számban mondani. Minden, amit a data compression szóról tudni kell, itt található. A data compression szó meghatározása segít abban, hogy pontosabban és helyesebben fogalmazz, amikor beszélsz vagy írsz. Adata compression és más szavak definíciójának ismerete gazdagítja a szókincsedet, és több és jobb nyelvi forráshoz juttat.

Főnév

data compression (tsz. data compressions)

  1. (informatika) A Data compression (adat-tömörítés) az informatika egyik alapvető technikája, amely lehetővé teszi az adatok méretének csökkentését úgy, hogy az információ tartalma megmarad (vagy elfogadható mértékben veszteséges lesz). Célja, hogy hatékonyabban tároljunk vagy gyorsabban továbbítsunk adatokat (például hálózaton keresztül). A Data compression egy olyan eljárás, amely során egy adott adathalmazt kisebb méretűvé alakítunk át bizonyos algoritmusok segítségével.

Például: Egy eredeti 10 MB méretű kép tömörítve lehet csak 2 MB.

Miért fontos?

  • Kevesebb hely a háttértáron (pl. SSD-n, pendrive-on).
  • Gyorsabb átvitel az interneten vagy hálózaton.
  • Csökkentett költség tárhelyszolgáltatásnál.
  • Hatékonyabb memóriakezelés.



2. Fő típusok

Adattömörítés lehet:

a) Veszteségmentes (Lossless Compression)

A tömörítés után pontosan visszaállítható az eredeti adat.

Használat:

  • Szövegek
  • Forráskódok
  • Dokumentumok
  • Archív fájlok (.zip, .rar)
  • Bizonyos képtípusok (pl. PNG)

Jellemző algoritmusok:

  • Huffman-kódolás
  • Lempel-Ziv-Welch (LZW)
  • Deflate (ZIP, GZIP)
  • Burrows-Wheeler Transform (BWT)

b) Veszteséges (Lossy Compression)

A tömörítés során bizonyos adatok végleg elvesznek, de a végeredmény vizuálisan vagy hangzásban még elfogadható.

Használat:

  • Képek (JPEG, WebP)
  • Hang (MP3, AAC)
  • Videó (H.264, H.265, AV1)

Jellemző algoritmusok:

  • DCT (Discrete Cosine Transform — JPEG)
  • MDCT (Modified DCT — MP3, AAC)
  • Motion compensation + transform coding (videók)



3. Hogyan működik?

A tömörítés mögött matematikai és statisztikai módszerek állnak.

a) Redundancia eltávolítása

Sok adatban vannak ismétlődő mintázatok:

AAAAABBBBCCCC → 5A4B4C

Cél: ismétlések, fölösleges bitek eltávolítása.

b) Entropia csökkentése

Ha az adatok nem egyformán valószínűek, hatékonyabban kódolhatók.

Például a “space” karakter gyakori egy szövegben → rövidebb kódolást kap.

Huffman-kódolás tipikus példa.

c) Predikció + maradék tárolása

A kódoló megjósolja a következő adatot a korábbiakból → csak az eltérés kerül tárolásra.

Jellemző hang- és videókódolásnál.



4. Alapvető algoritmusok

a) Huffman-kódolás

  • Fájlbeli karakterek előfordulási gyakoriságát vizsgálja.
  • Ritka karakter → hosszabb kód.
  • Gyakori karakter → rövid kód.

Huffman-fa épül → prefix-free kódolás.

b) Lempel-Ziv (LZ77, LZ78, LZW)

  • Korlátozott méretű ablakon keres egy szövegrészletet, amit már látott.
  • Ha ismétlés van, hivatkozik rá.
  • Alkalmazás: ZIP, PNG, GIF.

c) Run-Length Encoding (RLE)

  • Egyszerű algoritmus.
  • Ismétlődő karakterek, minták darabszám + karakter formában kerülnek tárolásra.

Pl.: "AAAABBBCC""4A3B2C".

d) Burrows-Wheeler Transform (BWT)

  • Nem önmagában tömörít, hanem előkészíti az adatot más algoritmus számára (pl. Move-to-front + RLE).
  • Nagyon jó hatásfok természetes nyelveken.

e) Transformáció alapú tömörítés (DCT, MDCT)

  • Hang és kép esetén a frekvenciatartományba alakítják az adatot.
  • Magas frekvenciás komponensek (ember számára kevésbé érzékelhető részletek) eldobhatók.



5. Példák népszerű formátumokra

Veszteségmentes:

  • ZIP — általános archív formátum.
  • GZIP — Unix/Linux világban gyakori.
  • PNG — veszteségmentes képformátum.
  • FLAC — veszteségmentes hangformátum.

Veszteséges:

  • JPEG — tömörített fotókhoz.
  • MP3 — zenefájlok.
  • H.264 / H.265 (HEVC) — videók.
  • WebP — modern képformátum, kiváló tömörítési arány.



6. Tömörítési arány

Definíció:

compression ratio = eredeti méret / tömörített méret

Példa: 10 MB → 2 MB → tömörítési arány = 5:1

Minél nagyobb az arány, annál hatékonyabb a tömörítés.

Veszteséges tömörítésnél érdemes kompromisszumot keresni:

  • elfogadható minőség
  • jó tömörítési arány



7. Alkalmazási területek

a) Kommunikáció

  • E-mailben gyakran ZIP-be csomagolják a mellékleteket.
  • Videostreamingnél (Netflix, YouTube) hatékony videótömörítés teszi lehetővé a gyors átvitel.

b) Tárolás

  • Backup rendszerek tömörítik az adatokat.
  • SSD-nél fontos, hogy minél kisebb adatmennyiség íródjon → élettartam nő.

c) Mobil eszközök

  • Mobilnet → adatmennyiség korlátozott.
  • Kisebb képek, zenék, videók → alacsonyabb adatforgalom.

d) Valós idejű alkalmazások

  • VoIP (Skype, Teams, Zoom) → veszteséges hang- és videótömörítés nélkül nem működne hatékonyan.



8. Kihívások és kompromisszumok

a) Feldolgozási idő

Tömörítés + visszafejtés számításigényes lehet.

  • Erősebb algoritmus → hosszabb idő.
  • Egyszerűbb algoritmus → gyorsabb, de gyengébb tömörítés.

b) Minőség

Veszteséges tömörítésnél mindig kompromisszum van a minőség és a méret között.

  • Túl agresszív tömörítés → szemmel/hallással érzékelhető hibák.
  • Jó kompromisszum → észrevehetetlen minőségromlás.

c) Hardver támogatás

  • Modern CPU-k, GPU-k sok formátum dekódolását hardveresen gyorsítják.
  • Pl.: iPhone, Android telefonok → H.265 / VP9 támogatás.



9. Jövő és trendek

Új formátumok

  • AV1 — nyílt forráskódú modern videóformátum, hatékonyabb, mint H.265.
  • JPEG XL — új képformátum, kiváló tömörítési arány, veszteségmentes + veszteséges egyaránt.

Mesterséges intelligencia alapú tömörítés

  • Kísérleti AI-alapú képtömörítő rendszerek → jobb vizuális eredmény kis méret mellett.
  • Neural compression → jövőbeli irány.

Alkalmazkodó tömörítés

  • Kontextusfüggő, dinamikus tömörítés → a tartalom típusához illeszkedő optimális algoritmus kiválasztása.



10. Összegzés

A data compression minden modern digitális rendszer szerves része. Nélküle:

  • túl nagy adatmennyiséget kellene tárolni,
  • lassabb lenne az adatátvitel,
  • az interneten nem lenne megoldható a streaming.

Tömörítési algoritmusok fejlődése lehetővé tette, hogy:

  • HD/4K/8K videót nézzünk online,
  • zene férjen el kis helyen,
  • gyorsabban küldjünk adatokat.

A jövőben pedig az AI és az új generációs formátumok tovább növelhetik a tömörítési hatékonyságot.