ضغط بيانات

ضغط البيانات أو مصدر الترميز (بالإنجليزية: Data compression)‏ في علوم الحاسوب والمعلومات النظرية، هو عملية تشفير المعلومات حيث تأخذ حيزا قليلا من المساحة. ويوجد العديد من البرامج التي تقوم بضغط البيانات من أشهرها وين زيب.

يختلف نوع ما من المقاييس المستخدمة لضغط البيانات الرقمية باختلاف بشكل ملحوظ جدا على نوع الضغط المستخدمة وطريقة التطبيق الذي يتم استخدامه. خوارزميات ضغط ضياع، والتي ترتبط في المقام الأول مع المدرسة القديمة من ضغط المعروفة باسم الجيل الأول الترميز، واستخدام صيغة بسيطة نسبة كما في المعادلة (2.1):

ضغط حجم الملف

نسبة ضغط =----------------------- (2.1)

فتح ضغط حجم الملف

المعادلة (2.1) هي في جوهرها ضغط متري نسبة بسيطة مبنية. بغض النظر عن نوع من وسائل الإعلام الرقمية يتم ضغطها (أي الصورة والنص، والصوت، الخ) نسبة ضغط صرح يعطي دلالة واضحة على ضغط تحقيقه. وهناك أنواع عديدة من الطريقة المستخدمة في هذه الأيام لضغط، وكلها لها خصائصها المميزة. نوع الطريقة المستخدمة يملي الانتروبيا من البيانات التي يتم ضغطها. عند اختيار طريقة من المهم أن تعرف ما نوع البيانات التي يتم ضغطها من أجل الحصول على نسبة ضغط الحد الأقصى الممكن. عند استخدام الانتروبي المدى بالتعاون مع الصور الرقمية لا يعني بالضرورة على المعلومات بكسل من الصورة. مؤخرا أصبح من الممكن لتخزين كيف تبدو صورة إدراكيا. عند تطبيق مثل هذا النموذج قد يعني أن الصورة تم تعديل طفيف خلال دورة ضغط / التوسع دون التأثير على الجودة المدركة من جانب المستخدم. هذا هو مفهوم هام كما يراها نموذجا الإدراك الحسي محتوى المعلومات من الصورة لا تكون البيانات بكسل ثنائي مقرها، ولكن كيف يمكن لصورة على أن جهاز تبدو للمستخدم [49]. عندما يجري تنفيذها واختبارها هذا يمكن أن يكون، في بعض الأحيان غير موضوعية جدا، ولكن عند تطبيقها بطريقة سليمة ومدروسة يمكن أن تولد بعض نسب ضغط مذهلة مع تشويه الحد الأدنى من الأصل. ويمكن أن يقال هذه الفكرة لتكون أساس الحقل الجديد من الجيل الثاني ضغط الصورة [41]. خلال الفترة المتبقية من هذه الرسالة سيكون التركيز على تطوير المعلومات الزائدة عن الحاجة من صورة وقت ممكن. مشغولة نموذج أساسا مع إزالة المعلومات الزائدة عن الحاجة، ووضع بيانات الناتج في مثل هذا التنسيق الذي يعتبر مثاليا للالكون تستند الترميز، وتستند جميع النماذج الإحصائية، حتى بعد تطبيق جميع التحويلات الممكنة لتبسيط وتعديل واحد إدخال البيانات لا يزال مطلوب لتوليد الاحتمالات وذلك لتشفير البيانات. يتم تصنيف أساليب الضغط إلى نوعين:

  • ضغط البيانات غير المنقوص.
  • ضغط البيانات المنقوص.

في مجال معالجة الإشارات الرقمية، يشير مصطلح ضغط البيانات (Data Compression)، أو الترميز المصدري (Source Coding)، أو خفض معدّل البيانات إلى ترميز المعلومات باستخدام قدر أقل من النبضات الثنائية من التمثيل الأصلي. يمكن أن يكون ضغط البيانات إمّا ضغط منقوص أو ضغط البيانات غير المضيع بالإنجليزية (Lossy) و(Lossless Compression) على الترتيب. الضغط غير المنقوص يخفض من عدد النبضات الثنائية (البت) اللازمة للتعبير عن البيانات عن طريق التعرف على التكرارية الإحصائية. ،ولا تفقد أي معلومات نتيجة لضغط البيانات. ومن أمثلة هذا النوع البرامج التي تستخدم لضغط ملفات الحاسوب مثل برامج ليتم تخزينها في صيغة (*.rar)أو في صيغة (*.zip).ويتم استعادة ملفات الحاسب أيًا كان نوعها بالكامل بعد فك الضغط. أمّا في حالة الضغط المنقوص فيتم تقليل النبضات الثنائية من خلال التعرف على المعلومات غير الهامة أو غير اللازمة وإزالتها. ومن أمثلة هذا النوع ما يحدث عند تخزين الصور ومقاطع الفيديو بصيغ تقلل الحجم، حيث يتم ضغط حجم الملفات عن طريق تقليل جودة الصورة مثلاً بقدر غير محسوس، مثال: تحويلها من صيغة (*.bmp) الكاملة إلى صيغة (*.jpg) المضغوطة. وكذلك الحال عند تحويل صيغة (*.avi) الكاملة إلى صيغ أخرى مثل (*.mp4) المضغوطة. ولا يمكن استرجاع "المعلومات" المفقودة عند الضغط بهذه الأساليب.

وتسمى عملية خفض حجم ملف البيانات باسم "ضغط البيانات". أمّا في سياق نقل البيانات وفي أنظمة الاتصالات، فيطلق عليها "ترميز المصدر" (حيث يتم الترميز عند مصدر البيانات قبل تخزينها أو إرسالها) وهذا على العكس من ترميز القناة. والذي يقصد منه تصحيح الأخطاء التي تسببها القناة أثناء الإرسال.

يعتبر ضغط البيانات أمرًا مفيدًا نظرًا لأنه يساعد على خفض استخدام الموارد، مثل وسط التخزين أو سعة الإرسال أو حيز التردد. ونظرًا لأن البيانات المضغوطة لابد من فك ضغطها لكي تصبح صالحة للاستخدام، فإن عمليات المعالجة الإضافية هذه تضع قيودًا حسابية أو تكلفة من نوع آخر لعملية فك الضغط، وبالتالي فإن هذه العملية ليست بلا ثمن!. ويتطلب فك ضغط البيانات الموازنة بين الوقت/حيز التخزين من ناحية وبين التعقيد من ناحية أخرى. فعلى سبيل المثال، عند استخدام أحد أساليب ضغط الفيديو، يتطلب الأمر إمّا أجهزة مكلّفة لكي تتمكن من فك ضغط الفيديو أثناء المشاهدة (وهو ما يزيد التعقيد)، أو أن يتم فك الضغط بالكامل قبل المشاهدة وهو ما يكلِّف وقتًا (في أنظمة الإرسال/الاستقبال) ويتطلب أيضًا حيز تخزين كبير يستوعب الفيديو الذي تم فكّه. ويعتمد تصميم أنظمة ضغط البيانات على الموازنة بين عدة عوامل مختلفة، والتي تشمل درجة الضغط، وكمية التشويه (Distortion) التي يمكن احتمالها (وذلك عند استخدام أنظمة الضغط المنقوص)، وكمية الموارد الحسابية المطلوبة لفك ضغط البيانات. وتجدر الإشارة إلى أن نظرية المعلومات هي العلم الذي يبحث في كلا نوعي ضغط البيانات، كما سيأتي تفصيله لاحقًا، حيث يهدف الضغط غير المنقوص إلى تمثيل البيانات بعدد من النبضات الثنائية يكافئ بالضبط الإنتروبية بينما يؤدي الضغط المنقوص إلى تمثيل البيانات بأقل من الإنتروبية، وبالتالي يحدث فقد في المعلومات (تشويه) وتبحث النظرية حينئذٍ في تحقيق أقصى استفادة مناظرة لهذا التشويه.

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.