Adattömörítés

Az adattömörítés a számítógépes tudományágak egy területe, melynek célja az adatok feldolgozása oly módon, hogy azok minél kevesebb helyet foglaljanak, vagy minél gyorsabban lehessen őket továbbítani. Ez azért lehetséges, mert a valós világ adatai többnyire igen redundánsan és nem a lehető legtömörebb formában reprezentálódnak.

Alapvetően kétféle adattömörítési megoldás létezik:

A veszteségmentes tömörítés
Veszteséges tömörítés
- Adott hibaarányú tömörítés

Egyik igen egyszerű módja a tömörítésnek például a futamhossz-tömörítés, amikor is egymást követő adatokat egyetlen kóddal és az előfordulás számával helyettesítünk. Ez példa a veszteségmentes tömörítésre is, amikor a tömörített adatból később egy fordított eljárással pontosan visszanyerhető az eredeti adat. Az olyan adatoknál, mint a szöveges dokumentumok (néhány esettől eltekintve), követelmény a veszteségmentes tömörítés, hiszen akár egyetlen bit változás is megváltoztathatja a szöveg jelentését.

Más esetekben – például hangok vagy képek tömörítésénél – csekély, a felhasználó számára nem észrevehető veszteség megengedhető, ilyenkor tehát veszteséges eljárások is alkalmazhatók. Ezen gyakorta jelentkező esetek a tömörítés hatásosságára széles választékot kínálnak a felhasználónak, attól függően, hogy inkább kevéssé tömörített, jó minőségű, vagy jobban tömörített, de nagyobb veszteséget hagyó tömörítési eljárást kíván alkalmazni. Az ehhez hasonló esetekben, tehát képek vagy hangok tömörítésénél egyúttal az emberi érzékszervek érzékenysége határozhatja meg az adattömörítés módját, hisz megengedhető olyan veszteség, amely számunkra nem észrevehető változást okoz.

Az adattömörítéssel szoros összefüggésben álló területek a kódelmélet és a kriptográfia. Ezekhez az információ-elmélet és az algoritmusos információ-elmélet nyújtanak elméleti hátteret. Amikor az adat tömörítése jelformák alakításaként jelentkezik, gyakran jelfeldolgozási módszereket alkalmazunk. Az adattömörítés ötlete szorosan kapcsolódik a matematika ritka mátrixok témájához, a statisztikai következtetésekhez és részben a maximum likelihood módszerhez.

Az adattömörítéshez kapcsolódó témák

Gyakori adattömörítési algoritmusok

Veszteségmentes tömörítés

Futáshossz-kódolás
- PackBits
- RLE (a PCX használja például)
Minimális redundanciájú kódolás
- Huffman-kódolás (egyszerű entrópia kódolás)
- Aritmetikai kódolás (fejlettebb entrópia kódolás)
Lexikai kódolás
- DEFLATE
- LZ77 és LZ78
- LZW
- Más LZ tömörítési eljárások
Burrows–Wheeler-transzformáció (blokkrendezési feldolgozás, amely a tömörítést egyszerűbbé teszi)

Veszteséges tömörítés

Diszkrét cosinusátalakításokra alapuló kódolások
- MPEG
- MP3
- JPEG
Fraktáltömörítés
- Fraktálátalakítás
Hullámtömörítés

A veszteségmentes tárolásra a legelterjedtebb forma a Lempel-Ziv (LZ) tömörítési módszer. Ennek egy sebességben és tömörítési arányban optimalizált változata a DEFLATE. Ez utóbbit használja a PKZIP, gzip és a PNG. Az LZW-t az Unisys szabadalmaztatta 2003-ban, melyet a GIF fájlokban használt és ami ezek elavulását eredményezte. Az LZ eljárások egy dinamikus táblát alkalmaznak a redundáns adat ábrázolására, melyet aztán Huffman kódolással tömörítenek.

A veszteségmentes tömörítéseknél elképzelhető a betömörítés és kibontás ráfordítási igénye szerint a szimmetrikus és aszimmetrikus tömörítés. Az aszimmetrikus tömörítés lényege, hogy a tömörítés időigényessége másodlagos, a kibontást - a tömörítés előtti fájllal megegyező fájlt létrehozását - viszont "szinte röptében" lehessen elvégezni. A mintakereséses tömörítés többféle eljárással történhet annak a sejtésnek a figyelembevételével, hogy egy adathalmaz megadható az elemek feltüntetésével, illetve szabályszerűségek megadásával továbbá ez utóbbi módon történő megadás - az eljárások leírása- rövidebb, mint maga az eredeti halmaz elemeinek sokasága.

A hangok tömörítését audiotömörítésnek nevezik, ahol is pszichoakusztikai módszereket alkalmaznak, hogy a nem hallható komponenseket kiszűrjék, s így a tömörítés hatékonyságát jelentősen növeljék.

További információk

Alice és Bob - 2. rész: Alice és Bob számítógépezik

Informatikai portál • összefoglaló, színes tartalomajánló lap

Sablon:Telekommunikáció m v sz Telekommunikáció
Története	Jeladó Broadcasting Cable protection system Kábeltelevízió Távközlési műhold Számítógép-hálózat Adattömörítés audio DCT Képtömörítés Videótömörítés Digital media Internet video online video platform közösségi média streaming Drums Edholm's law Electrical telegraph Fax Heliographs Hydraulic telegraph Information Age Information revolution Internet Mass media Mobile phone Okostelefon Optical telecommunication Optical telegraphy Pager Photophone Prepaid mobile phone Radio Radiotelephone Satellite communications Semaphore Semiconductor device MOSFET transistor Smoke signals Telecommunications history Telautograph Telegraphy Teleprinter (teletype) Telephone The Telephone Cases Television digital streaming Undersea telegraph line Videotelephony Whistled language Wireless revolution
Úttörők	Nasir Ahmed Edwin Howard Armstrong Mohamed M. Atalla John Logie Baird Paul Baran John Bardeen Alexander Graham Bell Emile Berliner Tim Berners-Lee Francis Blake (telephone) Jagadish Chandra Bose Charles Bourseul Walter Brattain Vint Cerf Claude Chappe Yogen Dalal Donald Davies Amos Dolbear Thomas Edison Lee de Forest Philo Farnsworth Reginald Fessenden Elisha Gray Oliver Heaviside Robert Hooke Erna Schneider Hoover Harold Hopkins Gardiner Greene Hubbard Internet pioneers Bob Kahn Dawon Kahng Charles K. Kao Narinder Singh Kapany Hedy Lamarr Innocenzo Manzetti Guglielmo Marconi Robert Metcalfe Antonio Meucci Nisizava Dzsunicsi Charles Grafton Page Radia Perlman Alexander Stepanovich Popov Puskás Tivadar Johann Philipp Reis Claude Shannon Almon Strowger Henry Sutton Charles Sumner Tainter Nikola Tesla Camille Tissot Alfred Vail Thomas Augustus Watson Charles Wheatstone Vladimir K. Zworykin
Átviteli közeg	Koaxiális kábel Fiber-optic communication optikai szál Free-space optical communication Molecular communication Rádióhullámok Wi-Fi Távvezeték data transmission circuit telecommunication circuit
Hálózati topológia és átkapcsolás	Bandwidth Links Nodes terminal Network switching circuit packet Telephone exchange
Multiplexing	Space-division Frequency-division Time-division Polarization-division Orbital angular-momentum Code-division
Fogalmak	Communication protocols Computer network Data transmission Store and forward Telecommunications equipment
Hálózattípusok	Cellular network Ethernet ISDN LAN Mobile NGN Public Switched Telephone Radio Television Telex UUCP WAN Wireless network
Nevezetes hálózatok	ARPANET BITNET CYCLADES FidoNet Internet Internet2 JANET NPL network Usenet

Sablon:Archív formátumok m v sz Archív formátumok
Csak archiválás	ar cpio shar tar LBR BagIt
Csak tömörítés	bzip2 gzip lzip LZMA lzop xz SQ compress
Archiválás és tömörítés	7z ACE ARC ARJ B1 Cabinet cfs cpt DGCA .dmg .egg kgb LHA LZX MPQ PEA qda RAR rzip sit SQX UDA UHARC Xar zoo Zip
Szoftvercsomagolás és terjesztés	APK deb pkg (OS X) RPM RUNZ MSI JAR WAR Java RAR EAR
Dokumentumcsomagolás és terjesztés	OEB Package Format OEBPS Container Format Open Packaging Conventions PAQ
Összehasonlítás Lista