De verschillende compressie-, versleutelings- en archiefindelingen begrijpen
In computertermen is archief een enkel bestand dat verschillende bestanden en mappen in zichzelf opslaat. Er zijn verschillende archiefformaten beschikbaar en elk heeft zijn eigen voor- en nadelen. Sommige archiefformaten worden geleverd met compressieondersteuning (waardoor uw bestandsgrootte kleiner wordt), terwijl anderen codering ondersteunen. Ja, en je raadt het al, sommige archiefformaten ondersteunen zowel compressie als versleuteling. Laten we meer te weten komen over de gebruikte compressie- en coderingsalgoritmen en de verschillende archiefformaten.
Compressiealgoritme
Compressie-algoritme is de methode die door het archief wordt gebruikt om de bestanden te comprimeren en de algehele bestandsgrootte kleiner te maken.
1. LZMA / LZMA2
Lempel-Ziv-Markov (LZMA) -ketenalgoritme is een algoritme zonder gegevenscompressie. LZMA maakt gebruik van een woordenboekcompressie-algoritme dat gebruikmaakt van complexe datastructuren om telkens één bit te coderen.
LZMA2 is een container die zowel de niet-gecomprimeerde als de LZMA-gecomprimeerde gegevens bevat. Het ondersteunt multi-threaded compressie en decompressie van gegevens. Het kan ook gegevens comprimeren die niet comprimeerbaar zijn met andere compressiealgoritmen.
2. Burrows-Wheeler Transform Algorithm (BWT)
BWT werkt door een reeks tekst op volgorde te comprimeren en vervolgens te comprimeren door de herhalende tekens in symbolen te vervangen.
3. PPM
Voorspelling door gedeeltelijke aanpassing (PPM) is een methode voor statistische gegevenscompressie die werkt door een reeks eerdere symbolen in de niet-gecomprimeerde symboolstroom te gebruiken om het volgende symbool in de stroom te voorspellen.
4. Laat leeglopen
Deflate is een populair datacompressiealgoritme dat een combinatie van LZ77- en Huffman-coderingsalgoritmen gebruikt om gegevens te comprimeren (combinatie van LZMA- en PPM-algoritmen om meer compressie te produceren). Omdat Deflate geen door patenten beperkte implementaties bevat, is het zeer populair geworden en wordt het veel gebruikt, vooral onder Linux.
Encryptie algoritme
Laten we nu enkele van de populaire versleutelingsmethoden doornemen:
1. DES
Data Encryption Standard maakt gebruik van privé geheime sleutels om gegevens te versleutelen en decoderen. De geheime sleutel wordt willekeurig geselecteerd uit een 56- tot 64-bits adresruimte.
2. AES
Advanced Encryption Standard is een versleutelingsalgoritme dat door Amerikaanse instanties wordt gebruikt om gevoelige gegevens te beveiligen. U kunt gegevens versleutelen met 128, 192 en 256 bits codering. AES gebruikt een symmetrisch sleutelalgoritme, wat betekent dat een gemeenschappelijke sleutel wordt gebruikt voor het coderen en vervolgens decoderen van de gegevens.
3. Blowfish
Blowfish-coderingsalgoritme codeert de archieven met een 64-bits blokgrootte en een variabele sleutellengte van 32 tot 448 bits.
Opmerking : er zijn verschillende andere coderingsalgoritmen, maar de bovengenoemde drie zijn de meest gebruikte.
Archief-indelingen
Er zijn verschillende archiefformaten beschikbaar. Hieronder zullen we elk archiefformaat evalueren met behulp van drie parameters - of het nu compressie en codering ondersteunt, welk besturingssysteem en software beschikbaar is voor het gebruik ervan.
1. Tar
Tape-archief (Tar) is een van de oudste archiefformaten. Aanvankelijk werd het gebruikt om gegevens te combineren en te schrijven naar sequentiële tapedrives, maar werd het later gestandaardiseerd als een compressie-indeling. Tar wordt meestal gebruikt in Linux en het ondersteunt geen compressie of codering. U kunt het ook op Windows gebruiken met de installatie van extra software. De meeste moderne archiveringsprogramma's ondersteunen dit formaat. De uitzonderingen zijn onder andere Disk Archiver en KGB Archiver.
2. GZ
GZ of GZip is een van de meest populaire compressie-indelingen die zowel in Windows als Linux worden gebruikt. GZip gebruikte het Deflate-compressiealgoritme om de gearchiveerde bestanden te comprimeren. GZip ondersteunt ook bestandsoverdrachten van meerdere delen, wat betekent dat u kleinere delen van een groot GZip-bestand kunt maken voor eenvoudig delen en overbrengen. Omdat GZip behoorlijk populair is, hebben de meeste moderne archiveringshulpprogramma's ondersteuning voor het comprimeren en decomprimeren van bestanden met behulp van het GZip-formaat, waaronder 7-Zip, BetterZip, PKZip, WinZip en WinRAR.
3. BZ / BZ2
BZ lijkt veel op GZ, maar maakt gebruik van Burrows-Wheelers Transform Algorithm, wat resulteert in iets meer compressie en kleinere bestandsgrootte. Hoewel de compressie langzaam is, is de decompressie vrij snel. De meeste software die GZ ondersteunt, ondersteunen ook BZ.
4. Zip
Zip is waarschijnlijk het meest bekende en gebruikte archiveringsformaat. Zip gebruikt het Deflate-algoritme en ondersteunt verliesloze compressie. Het ondersteunt ook AES- en DES-codering. De meeste moderne besturingssystemen worden geleverd met ingebouwde ondersteuning voor Zip-indeling, zodat u geen afzonderlijke software nodig hebt voor het archiveren en niet-archiveren van zip-bestanden.
5. 7Z
Het 7Z-archiveringsformaat is geïntroduceerd met een gratis en open source hulpprogramma dat 7-Zip heet. Het is het meest geavanceerde algemene compressie- en archiveringsformaat dat de meeste algoritmes voor gegevenscompressie en codering ondersteunt, inclusief degenen die we hierboven hebben besproken. 7Z-formaat comprimeert de bestanden meer dan elk ander formaat, maar is relatief trager in de verwerking. Een andere beperking is dat de 7-Zip-software alleen beschikbaar is voor Windows. Er is geen visuele ondersteuning voor Mac of Linux. 7Z ondersteunt ook meerdelige archivering.
6. RAR
RAR is een gepatenteerd archiveringsformaat. Hoewel het kan worden gelezen en geëxtraheerd door andere hulpprogramma's zoals 7-Zip en WinZip, kan het alleen worden gemaakt met behulp van het WinRAR-hulpprogramma. RAR was het populairste formaat voor meerdelige archivering voordat 7Z werd uitgebracht. Nu kan 7Z dezelfde taak gratis uitvoeren, wat RAR doet door zijn gebruikers te laten betalen voor de WinRAR-software. RAR ondersteunt AES-codering.
Andere indelingen voor compressie en archivering
Hier zijn enkele van de relatief minder bekende formaten:
XZ is een verliesloos datacompressieformaat dat het LZMA2-compressiealgoritme gebruikt. Het kan worden gezien als een uitgeklede versie van 7Z.
LHA, voorheen bekend als LHarc, wordt voornamelijk gebruikt voor het comprimeren van installatiebestanden en games (meestal gebruikt in Japan). Interessant is dat de Japanse versie van Windows 7 wordt geleverd met de ingebouwde ondersteuning voor LHA-archieven.
ACE is een gepatenteerd archiefbestand van gegevenscompressie dat in de begindagen van 2000 een concurrent van het RAR-formaat was.
StuffIt werd voornamelijk uitgebracht voor Mac, maar versies voor Windows, Linux en Solaris werden later uitgebracht. Dit is een eigen compressieformaat dat wordt gebruikt door StuffIt-hulpprogramma's.
Conclusie
In Linux is gz (of tar.gz) het meest gebruikte formaat, gevolgd door bz, terwijl in Windows of Mac het meest gebruikte formaat Zip is. Voor platformonafhankelijke compatibiliteit is Zip-formaat de beste keuze. Als u functies zoals beveiliging, hoge compressie en meerdelige archivering wilt, ga dan voor het 7Z-formaat. RAR is vergelijkbaar met 7Z behalve dat het wordt geleverd met een prijskaartje. Vermijd het zo veel mogelijk.
Welk bestandsformaat en hulpprogramma gebruikt u voor compressie?
Beeldtegoed: Spring, M-94 Coderingsapparaatreplica