الإحصاء[2] (بالإنجليزية: Statistics) هو أحد فروع الرياضيات الهامة ذات التطبيقات الواسعة.[3][4][5] وهو علم جمع، وصف وتفسير البيانات وبمعنى آخر صندوق الأدوات الموضوع تحت البحث التجريبي. يهتم علم الإحصاء بجمع، تلخيص، تمثيل وإيجاد استنتاجات من مجموعة البيانات المتوفرة، محاولًا التغلب على مشاكل مثل عدم تجانس البيانات وتباعدها. كل هذا يجعله ذا أهمية تطبيقية واسعة في شتى مجالات العلوم من الفيزياء إلى العلوم الاجتماعية وحتى الإنسانية، كما يلعب دورًا في السياسة والأعمال.
صنف فرعي من | |
---|---|
جزء من | |
يمتهنه |
عالم إحصاء (إحصائي)[1] |
فروع | |
الموضوع | |
التاريخ |
في تحرير البيانات، هدف العلماء لوصف فهمنا للعالم، أوصاف العلاقات المستقرة بين الظواهر الجديرة بالملاحظة على شكل نظريات أحيانًا مدعوة بأن تكون توضيحية. أي اختراع نظرية عملية مبدعة لإعادة هيكلة المعلومات التي ضُمنت في إيجاد (وقبول) النظريات، وتنتزع المعلومات القابلة للاستغلال من العالم الحقيقي.
تاريخ
تعود أقدم الكتابات حول الاحتمالات والإحصاءات إلى علماء الرياضيات وعلماء التشفير العرب، خلال العصر الذهبي الإسلامي بين القرنين الثامن والثالث عشر. كتب الخليل بن أحمد الفراهيدي (717-786) كتاب رسائل التشفير، الذي يحتوي على أول استخدام للتبديلات والتوليفات، لسرد جميع الكلمات العربية الممكنة مع وبدون حروف العلة.[6] أقدم كتاب عن الإحصاء هو أطروحة القرن التاسع عشر حول فك رموز الرسائل المشفرة، كتبها الباحث العربي الكندي (801-873). قدم الكندي في كتابه وصفًا تفصيليًا لكيفية استخدام الإحصائيات وتحليل التردد لفك تشفير الرسائل المشفرة. وضع هذا النص أسس الإحصاء وتحليل الشفرات.[7][8] قام الكندي أيضًا بأول استخدام معروف للاستدلال الإحصائي، بينما طور هو وغيره من مصممي التشفير العرب الأساليب الإحصائية المبكرة لفك تشفير الرسائل المشفرة. قدم ابن عدلان (1187-1268) فيما بعد مساهمة مهمة، في استخدام حجم العينة في تحليل التردد.[6]
يرجع تاريخ أقدم كتابات أوروبية عن الإحصاء إلى عام 1663، مع نشر Natural and Political Observations upon the Bills of Mortality لجون جرونت.[9] دارت التطبيقات المبكرة للتفكير الإحصائي حول احتياجات الدول لوضع سياستها على البيانات الديموغرافية والاقتصادية، ومن هنا جاء علم الإحصاء. اتسع نطاق تخصص الإحصاء في أوائل القرن التاسع عشر ليشمل جمع وتحليل البيانات بشكل عام. اليوم، يستخدم الإحصاء على نطاق واسع في الحكومة والأعمال والعلوم الطبيعية والاجتماعية.
وضعت الأسس الرياضية للإحصاءات الحديثة في القرن السابع عشر مع تطوير نظرية الاحتمالات بواسطة جيرولامو كاردانو وبليز باسكال وبيير دي فيرما. نشأت نظرية الاحتمال الرياضي من دراسة ألعاب الحظ، على الرغم من أن مفهوم الاحتمال قد فحص بالفعل في قانون العصور الوسطى ومن قبل فلاسفة مثل خوان كارامويل.[10] وصفت طريقة المربعات الصغرى لأول مرة بواسطة أدريان ماري ليجاندر في عام 1805.
ظهر مجال الإحصاء الحديث في أواخر القرن التاسع عشر وأوائل القرن العشرين على ثلاث مراحل.[11] كانت الموجة الأولى، في مطلع القرن، بقيادة أعمال فرانسيس جالتون وكارل بيرسون، اللذين حوَّلَ الإحصاء إلى نظام رياضي صارم يستخدم في التحليل، ليس فقط في العلوم، ولكن في الصناعة والسياسة أيضًا. تضمنت مساهمات جالتون تقديم مفاهيم الانحراف المعياري والارتباط وتحليل الانحدار وتطبيق هذه الأساليب في دراسة الخصائص المتنوعة للإنسان مثل الطول والوزن وطول رمش العين وغيرها.[12] طور بيرسون معامل الارتباط لبيرسون، والذي يُعرَّف بأنه لحظة المنتج،[13] وطريقة اللحظات لتناسب التوزيعات على العينات وتوزيع بيرسون، من بين أشياء أخرى كثيرة.[14] أسس جالتون وبيرسون Biometrika كأول مجلة للإحصاء الرياضي والإحصاء الحيوي (ثم أُطلق عليها علم القياس الحيوي)، وأسس هذا الأخير أول قسم إحصائي جامعي في العالم في كلية لندن الجامعية.[15]
صاغ رونالد فيشر مصطلح فرضية العدم أثناء تجربة تذوق الشاي للسيدة، والتي «لم يتم إثباتها أو إثباتها مطلقًا، ولكن ربما يتم دحضها أثناء التجربة».[16][17]
بدأ ويليام سيلي جوسيت الموجة الثانية من العقد الأول من القرن الماضي، وبلغت ذروتها في رؤى رونالد فيشر، الذي كتب الكتب المدرسية التي كان من المفترض أن تحدد الانضباط الأكاديمي في الجامعات حول العالم. كانت أهم منشورات فيشر هي الورقة الأساسية التي نشرها عام 1918 بعنوان العلاقة بين الأقارب على افتراض الميراث المندلي (الذي كان أول من استخدم المصطلح الإحصائي، التباين)، وعمله الكلاسيكي عام 1925، الأساليب الإحصائية لعمال البحث، وعام 1935 تصميم التجارب،[18][19][20] حيث طور تصميمًا صارمًا لنماذج التجارب. ابتكر مفاهيم الاكتفاء والإحصاء الإضافي وتحليل التمييز الخطي ومعلومات فيشر.[21] في كتابه «النظرية الوراثية للانتقاء الطبيعي» عام 1930، طبق الإحصاء على مفاهيم بيولوجية مختلفة مثل مبدأ فيشر[22] (والذي أطلق عليه أنتوني إيدوارد «ربما الحجة الأكثر شهرة في علم الأحياء التطوري») وFisherian Runaway[23][24][25][26][27][28] مفهوم في الانتقاء الجنسي حول تأثير ردود الفعل الإيجابية الجامح الموجود في التطور.
نشأت الموجة الأخيرة، التي شهدت بشكل أساسي صقل وتوسيع التطورات السابقة، من العمل التعاوني بين إيغون بيرسون وجيرزي نيمان في الثلاثينيات. قدموا مفاهيم خطأ «النوع الثاني» وقوة الاختبار وفترات الثقة. أظهر جيرزي نيمان في عام 1934 أن أخذ العينات العشوائية الطبقية كان بشكل عام طريقة أفضل للتقدير من أخذ العينات الهادفة (الحصص).[29]
اليوم، يتم تطبيق الأساليب الإحصائية في جميع المجالات التي تنطوي على اتخاذ القرار، لإجراء استنتاجات دقيقة من مجموعة مجمعة من البيانات ولاتخاذ القرارات في مواجهة عدم اليقين على أساس المنهجية الإحصائية. أدى استخدام أجهزة الحاسوب الحديثة إلى تسريع العمليات الحسابية الإحصائية على نطاق واسع، كما أتاح إمكانية استخدام طرق جديدة غير عملية لأداءها يدويًا. لا تزال الإحصائيات مجالًا للبحث النشط على سبيل المثال حول مشكلة كيفية تحليل البيانات الضخمة.[30]
مراحله
الخطوة الأولى في أي عملية إحصائية هي جمع البيانات من خلال عملية الاستعيان من ضمن المجتمع الإحصائي الضخم أو من خلال تسجيل الاستجابات لمعالجة ما في تجربة (تصميم تجريبي experimental design)، أو عن طريق ملاحظة عملية متكررة مع الزمن (متسلسلات زمنية)، من ثم وضع خلاصات رقمية وتمثيلية (مخططية) graphical باستخدام ما يدعى الإحصاء الوصفي.
تُدمج الأنماط الموجودة ضمن البيانات (تنمذج) modeling لأخذ استدلالات حول مجتمعات كبيرة، لذلك يجب دراسة حجم العينة بحيث تكون ممثلة للمجتمع الإحصائي المسحوبة منه. تتم هذه العملية ضمن ما يدعى الإحصاء الاستدلالي inferential statistics ليأخذ بعين الاعتبار عشوائية وعدم دقة الملاحظات (القياسات).
غالبا ما تأخذ الاستدلالات الإحصائية شكل إجابات لأسئلة من نوع (نعم/لا) (فيما يدعى اختبار الفرضيات hypothesis testing)، تقدير خاصيات عددية (تقدير estimation)، التنبؤ prediction بملاحظات أو قياسات مستقبلية، وصف ارتباطات وعلاقات (ارتباط correlation)، أو نمذجة علاقات (انحدار regression) أو التفاف convolution.
تدخل مجمل العمليات والإجرائيات والفروع الإحصائية الموصوفة أعلاه في إطار ما يدعى الإحصاء التطبيقي، يقابله إحصاء رياضي mathematical statistics أو النظرية الإحصائية statistical theory وهي أحد فروع الرياضيات التطبيقية التي تستخدم نظرية الاحتمالات والتحليل الرياضي لوضع الممارسة الإحصائية على أساس نظري متين.
الإحصاء الوصفي
يتضمن الإحصاء الوصفي الأدوات التي ابتكرت لتنظيم وعرض البيانات في نماذج سهلة الوصول، بمعنى آخر بطريقة ما لا تتجاوز الحدود المعرفية للعقل الإنساني، يتضمن قياسات الظواهر المتكررة، خلاصة الإحصاءات المتنوعة، المتوسطات المحسوبة بشكل رئيسي، بيانات الأسطر والإحصاءات تعرض باستعمال الجداول والرسوم البيانية. الوصف الإحصائي يعرض رؤيات مهمة لحدوث الظواهر المفردة، ويشير للمشاركة بينهم، لكن هل يمكن ليزود النتائج التي تكون القوانين المعتبرة في سياق علمي. الإحصاءات وسائل تعامل مع الاختلافات في خصائص الأشياء المتميزة، الأشياء المفردة ليست عرض بياني لمجتمع الأشياء، التي تمتلك الميزة القابلة للقياس موضع التحري، رغم تلك الاختلافات تكون نتيجة اختلاف المتغيرات الأخرى (المسيطرة والعشوائية). الفيزياء على سبيل المثال، تهتم بانتزاع والصياغة الرياضية للعلاقات المضبوطة، لا يترك مجال للتقلبات العشوائية، في إحصاءات مثل هذه التقلبات العشوائية مشكلة، العلاقات الإحصائية هكذا العلاقات التي تحدد النسبة المعينة للاختلاف الإحصائي.
الإحصاء الاستقرائي
بالمقارنة مع مناطق واسعة من الفيزياء، تلاحظ العلاقات التجريبية إحصائيا في العلوم الطبيعية، وعلم الاجتماع وعلم النفس (ومواضيع أكثر انتقائية مثل الاقتصاد). العمل التجريبي في هذه الحقول ينتقل نموذجيا على قواعد التجارب أو مسوحات العينة التجريبية، أما في حالة كامل المجتمع لا يمكن أن يلاحظ إما لأسباب عملية أو اقتصادية. الاستنتاج من العينة المحددة للأشياء لسيادة الخصائص في المجتمع هدف استنتاجي أو إحصاء استقرائي، هنا التغير يكون انعكاس التباين في العينة واجراء العينة.
الإحصاء والإجراء العلمي
اعتمادا على حالة التحقيق العلمي، البيانات مفحوصة بتغير درجات المعلومات السابقة. البيانات ستجمع لاكتشاف الظاهرة في المدخل الأول، لكنه يمكن أن يخدم الاختيار الإحصائي (التأكيد/النفي) الفرضيات حول تركيب الخاصة موضع التحري. هكذا، الإحصاء يطبق في كل مراحل العملية العلمية، حيثما الظواهر القابلة للقياس معقدة. هنا مفهومنا عام بما فيه الكفاية لاحاطة تشكيلة واسعة من المقترحات العلمية المثيرة. نأخذ على سبيل المثال اقتراح نحلة طنانة تطير، بحساب عدد الحوادث في أماكن مختلفة، نحدد حدوث الظاهرة. على هذه القاعدة، نحاول استنتاج إمكانية مصادفة نحلة، تحت الظروف المعينة (مثال يوم صيفي ممطر في برلين).
السلسلة الإحصائية
في تسجيل البيانات نولد السلسلة الإحصائية تدعى السلسلة الأصلية غير المنجزة بالبيانات الخام. نعطي مستوى مقياس ملائم (على الأقل مقياس ترتيبي)، نستطيع تصنيف البيانات الخام وهكذا نخلق سلسلة منظمة.
جمعت البيانات في نفس النقطة الزمنية أو بنفس الفترة الزمنية على عناصر مختلفة تدعى بيانات القسم المشترك.
جمعت البيانات عند نقاط مختلفة من الزمن، أو لفترات مختلفة من الزمن على نفس العنصر، تدعى بيانات السلاسل الزمنية. أن سلسلة المشاهدات مرتبة على طول الزمن.
التكرار
عدد المشاهدات التي تتطابق لفئة معطى تدعى التكرار.
الفئات مبينة لتلخيص البيانات المستمرة أو شبه المستمرة بواسطة التكرارات في البيانات المنقطعة ينظم الواحد التلاقي أو ما يسمى بالروابط، مشاهدتين أو أكثر تأخذ على نفس القيمة، لهذا لا تتطلب البيانات المنفصلة تبويب لتحسب التكرارات.
التكرار المطلق
حساب عدد المشاهدات التي تأخذ على قيمة معينة ينتج التكرار المطلق:
عندما تبوب البيانات التكرارات المطلقة للفئات محسوبة على الشكل التالي:
الخواص
التكرار النسبي
تدعى نسبة المشاهدات التي تأخذ على قيمة معينة، أو تتطابق مع فئة محددة بالتكرار النسبي. التكرار المطلق المنتج على العدد الإجمالي للمشاهدات
الخواص:
التوزيع التكراري
بتوحيد تكرارات الفئة للبيانات المبوبة بأعراض فئتهم الخاصة، جعلت التكرارات لفئات أحجام مختلفة للمقارنة، يمكن تجميع التكرارات الناتجة لتشكيل لتوزيع التكراري.
انظر أيضًا
المراجع
وصلات خارجية
Wikiwand in your browser!
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.