Home > Προγράμματα > Πώς λειτουργούν τα προγράμματα συμπίεσης-αποσυμπίεσης αρχείων;

Πώς λειτουργούν τα προγράμματα συμπίεσης-αποσυμπίεσης αρχείων;


Σχεδόν όλοι μας έχουμε συμπιέσει και αποσυμπιέσει αρχεία. Η συμπίεση είναι μια διαδικασία μέσω της οποίας το μέγεθος του αρχικού αρχείου μειώνεται και έτσι το συμπιεσμένο αρχείο μεταδίδεται γρηγορότερα μέσω του διαδικτύου. Τα πιο γνωστά προγράμματα συμπίεσης-αποσυμπίεσης είναι το winzip και το winrar.

Πώς όμως είναι δυνατόν να αφαιρούνται αρκετά bytes από το αρχείο κατά την συμπίεση του και πώς να προστίθενται κατά την αποσυμπίεση;

Η εξήγηση δεν είναι δύσκολη. Πολλά αρχεία περιέχουν πληροφορία η οποία επαναλαμβάνεται συνεχώς. Το γεγονός αυτό εκμεταλλεύεται το πρόγραμμα συμπίεσης με αποτέλεσμα να κρατά μια φορά την κάθε επαναλαμβανόμενη πληροφορία. Για παράδειγμα έστω ότι έχουμε ένα αρχείο κειμένου στο οποίο είναι φυσικό κάποιες λέξεις να επαναλαμβάνονται αρκετές φορές. Αυτό που κάνει το πρόγραμμα συμπίεσης είναι να κατασκευάζει ένα ευρετήριο λέξεων ώστε να γνωρίζει τις θέσεις της κάθε λέξης για να μπορέσει ύστερα να αποσυμπιέσει το αρχείο επαναφέροντάς το στην αρχική του κατάσταση.

Ωστόσο ένα τέτοιο πρόγραμμα δεν τοποθετεί στο ευρετήριο μόνο λέξεις άλλα και ομάδα λέξεων ή γραμμάτων όπως παράδειγμα το “ει” ή το “αι” και πολλούς άλλους συνδυασμούς όπως κενό που ακολουθείται από ομάδα γραμμάτων κλπ. Επιπλέον είναι πολύ σύνηθες, μια λέξη που επαναλαμβάνεται τέσσερις φόρες στο κείμενο μας, να ακολουθείται και τις τέσσερις από κενό και έτσι το πρόγραμμα να “αποφασίζει” να τοποθετήσει στο ευρετήριο την λέξη μαζί με το κενό παρά την ίδια την λέξη ως ξεχωριστή οντότητα. Με αυτόν τον τρόπο επιτυγχάνεται μεγαλύτερη συμπίεση.

Επομένως, είναι λογικό ο βαθμός συμπίεσης να αλλάζει από αρχείο σε αρχείο. Υπάρχουν λοιπόν αρχεία με μικρό βαθμό συμπίεσης και αρχεία με μεγάλο βαθμό συμπίεσης. Στην δεύτερη κατηγορία ανήκουν τα αρχεία που περιέχουν προγραμματιστικό κωδικά λόγω των δεσμευμένων λέξεων οι οποίες επαναλαμβάνονται ξανά και ξανά. Έτσι, ο μεγάλος βαθμός επανάληψης οδηγεί τέτοιου είδους αρχεία σε συμπίεση της τάξεως του 70-80% σε αντίθεση με αρχεία τύπου μουσικής ή βίντεο τα οποία συνήθως διακρίνονται από μικρή επανάληψη δεδομένων.

  1. No comments yet.
  1. No trackbacks yet.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

%d bloggers like this: