ضغط بيانات
من ويكيبيديا، الموسوعة encyclopedia
ضغط البيانات أو مصدر الترميز (بالإنجليزية: Data compression) في علوم الحاسوب والمعلومات النظرية، هو عملية تشفير المعلومات حيث تأخذ حيزا قليلا من المساحة. ويوجد العديد من البرامج التي تقوم بضغط البيانات من أشهرها وين زيب.
صنف فرعي من | |
---|---|
الاستعمال | |
تسبب في | |
نظام تصنيف حوسبة رابطة مكائن الحوسبة (2012) |
في مجال معالجة الإشارات الرقمية، يشير مصطلح ضغط البيانات (Data Compression)، أو الترميز المصدري (Source Coding)،[1] أو خفض معدّل البيانات إلى ترميز المعلومات باستخدام قدر أقل من النبضات الثنائية من التمثيل الأصلي.[2] يمكن أن يكون ضغط البيانات إمّا ضغط منقوص أو ضغط البيانات غير المضيع بالإنجليزية (Lossy) و (Lossless Compression) على الترتيب. الضغط غير المنقوص يخفض من عدد النبضات الثنائية (البت) اللازمة للتعبير عن البيانات عن طريق التعرف على التكرارية الإحصائية.ولا تفقد أي معلومات نتيجة لضغط البيانات. ومن أمثلة هذا النوع البرامج التي تستخدم لضغط ملفات الحاسوب مثل برامج ليتم تخزينها في صيغة (*.rar)أو في صيغة (*.zip).ويتم استعادة ملفات الحاسب أيًا كان نوعها بالكامل بعد فك الضغط. أمّا في حالة الضغط المنقوص فيتم تقليل النبضات الثنائية من خلال التعرف على المعلومات غير الهامة أو غير اللازمة وإزالتها.[3] ومن أمثلة هذا النوع ما يحدث عند تخزين الصور ومقاطع الفيديو بصيغ تقلل الحجم، حيث يتم ضغط حجم الملفات عن طريق تقليل جودة الصورة مثلاً بقدر غير محسوس، مثال: تحويلها من صيغة (*.bmp) الكاملة إلى صيغة (*.jpg) المضغوطة. وكذلك الحال عند تحويل صيغة (*.avi) الكاملة إلى صيغ أخرى مثل (*.mp4) المضغوطة. ولا يمكن استرجاع «المعلومات» المفقودة عند الضغط بهذه الأساليب.
وتسمى عملية خفض حجم ملف البيانات باسم «ضغط البيانات». أمّا في سياق نقل البيانات وفي أنظمة الاتصالات، فيطلق عليها «ترميز المصدر» (حيث يتم الترميز عند مصدر البيانات قبل تخزينها أو إرسالها) وهذا على العكس من ترميز القناة.[4] والذي يقصد منه تصحيح الأخطاء التي تسببها القناة أثناء الإرسال.
يعتبر ضغط البيانات أمرًا مفيدًا نظرًا لأنه يساعد على خفض استخدام الموارد، مثل وسط التخزين أو سعة الإرسال أو حيز التردد. ونظرًا لأن البيانات المضغوطة لابد من فك ضغطها لكي تصبح صالحة للاستخدام، فإن عمليات المعالجة الإضافية هذه تضع قيودًا حسابية أو تكلفة من نوع آخر لعملية فك الضغط، وبالتالي فإن هذه العملية ليست بلا ثمن!. ويتطلب فك ضغط البيانات الموازنة بين الوقت/حيز التخزين من ناحية وبين التعقيد من ناحية أخرى. فعلى سبيل المثال، عند استخدام أحد أساليب ضغط الفيديو، يتطلب الأمر إمّا أجهزة مكلّفة لكي تتمكن من فك ضغط الفيديو أثناء المشاهدة (وهو ما يزيد التعقيد)، أو أن يتم فك الضغط بالكامل قبل المشاهدة وهو ما يكلِّف وقتًا (في أنظمة الإرسال/الاستقبال) ويتطلب أيضًا حيز تخزين كبير يستوعب الفيديو الذي تم فكّه. ويعتمد تصميم أنظمة ضغط البيانات على الموازنة بين عدة عوامل مختلفة، والتي تشمل درجة الضغط، وكمية التشويه (Distortion) التي يمكن احتمالها (وذلك عند استخدام أنظمة الضغط المنقوص)، وكمية الموارد الحسابية المطلوبة لفك ضغط البيانات.[5] وتجدر الإشارة إلى أن نظرية المعلومات هي العلم الذي يبحث في كلا نوعي ضغط البيانات، كما سيأتي تفصيله لاحقًا، حيث يهدف الضغط غير المنقوص إلى تمثيل البيانات بعدد من النبضات الثنائية يكافئ بالضبط الإنتروبية بينما يؤدي الضغط المنقوص إلى تمثيل البيانات بأقل من الإنتروبية، وبالتالي يحدث فقد في المعلومات (تشويه) وتبحث النظرية حينئذٍ في تحقيق أقصى استفادة مناظرة لهذا التشويه.