التعليقات

لمحة عامة عن مفارقة سيمبسون في الإحصاء

لمحة عامة عن مفارقة سيمبسون في الإحصاء


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

المفارقة هي بيان أو ظاهرة تبدو متناقضة على السطح. تساعد المفارقات في الكشف عن الحقيقة الكامنة تحت سطح ما يبدو أنه سخيف. في مجال الإحصاء ، توضح مفارقة سيمبسون أنواع المشكلات الناتجة عن دمج البيانات من عدة مجموعات.

مع كل البيانات ، نحتاج إلى توخي الحذر. من أين أتى؟ كيف تم الحصول عليها؟ وماذا تقول حقا؟ هذه كلها أسئلة جيدة يجب طرحها عند تقديمها مع البيانات. تبين لنا الحالة المفاجئة للغاية لمفارقة سيمبسون أنه في بعض الأحيان ما يبدو أن البيانات لا تقوله هو الحال بالفعل.

نظرة عامة على المفارقة

لنفترض أننا نلاحظ عدة مجموعات ، ونقيم علاقة أو علاقة لكل من هذه المجموعات. تقول مفارقة سيمبسون إنه عندما نجمع كل المجموعات معًا وننظر إلى البيانات في شكل إجمالي ، فإن العلاقة التي لاحظناها من قبل قد تنعكس على نفسها. يرجع ذلك غالبًا إلى المتغيرات الكامنة التي لم يتم أخذها في الاعتبار ، ولكن في بعض الأحيان يكون ذلك بسبب القيم العددية للبيانات.

مثال

لإضفاء مزيد من الإحساس على مفارقة سيمبسون ، دعونا نلقي نظرة على المثال التالي. في مستشفى معين ، هناك جراحان. يعمل الجراح A على 100 مريض ، و 95 منهم على قيد الحياة. يعمل الجراح ب على 80 مريضًا و 72 ناجًا. نحن نفكر في إجراء عملية جراحية في هذا المستشفى والعيش خلال العملية أمر مهم. نريد أن نختار الأفضل من الجراحين.

نحن ننظر إلى البيانات ونستخدمها لحساب النسبة المئوية لمرضى الجراح A الذين نجوا من عملياتهم ومقارنتها بمعدل البقاء على قيد الحياة لمرضى الجراح B.

  • نجا 95 مريضًا من كل 100 من الجراح أ ، لذلك نجا 95/100 = 95٪ منهم.
  • نجا 72 مريضا من أصل 80 من الجراح B ، لذلك نجا 72/80 = 90 ٪ منهم.

من هذا التحليل ، أي الجراح يجب أن نختار علاجنا؟ يبدو أن الجراح أ هو الرهان الأكثر أمانًا. ولكن هل هذا صحيح حقا؟

ماذا لو أجرينا بعض الأبحاث الإضافية في البيانات ووجدنا أن المستشفى قد درس أصلاً نوعين مختلفين من العمليات الجراحية ، ولكن بعد ذلك جمع كل البيانات معًا للإبلاغ عن كل من جراحيه. ليست كل العمليات الجراحية متساوية ، فبعضها كان يعتبر عمليات جراحية طارئة عالية الخطورة ، في حين أن البعض الآخر كان ذا طبيعة روتينية تم تحديدها مسبقًا.

من بين 100 مريض عولجوا الجراح أ ، 50 منهم كانوا معرضين لخطر كبير ، توفي ثلاثة منهم. الخمسون الآخرون كانوا يعتبرون روتينيا ، وتوفي هؤلاء. هذا يعني أنه بالنسبة للجراحة الروتينية ، فإن معدل البقاء على قيد الحياة للمريض الذي يعالجه الجراح A يبلغ 48/50 = 96٪.

الآن ننظر بعناية أكبر في بيانات الجراح B ونجد أن 80 مريضًا ، 40 منهم كانوا معرضين لخطر كبير ، منهم سبعة توفوا. أما الأربعون الآخرون فكانوا روتينيين وتوفي واحد فقط هذا يعني أن المريض لديه معدل بقاء 39/40 = 97.5 ٪ لعملية جراحية روتينية مع الجراح B.

الآن أي الجراح يبدو أفضل؟ إذا كانت الجراحة الخاصة بك ستكون عملية روتينية ، فإن الجراح B هو في الواقع الجراح الأفضل. إذا نظرنا إلى جميع العمليات الجراحية التي أجراها الجراحون ، فإن A أفضل. هذا هو الحدس تماما. في هذه الحالة ، يؤثر المتغير الكامن في نوع الجراحة على البيانات المجمعة للجراحين.

تاريخ سيمبسون المفارقة

سميت مفارقة سيمبسون باسم إدوارد سيمبسون ، الذي وصف هذه المفارقة لأول مرة في ورقة عام 1951 "تفسير التفاعل في جداول الطوارئ" منمجلة الجمعية الإحصائية الملكية. لاحظ كل من بيرسون ويول مفارقة مماثلة قبل نصف قرن من سيمبسون ، لذلك يشار إلى مفارقة سيمبسون في بعض الأحيان باسم تأثير سيمبسون يول.

هناك العديد من التطبيقات واسعة النطاق للمفارقة في مجالات متنوعة مثل الإحصاءات الرياضية وبيانات البطالة. في أي وقت يتم فيه تجميع البيانات ، احترس من أن تظهر هذه المفارقة.


شاهد الفيديو: تنبؤات سمبسون بنهائى كأس العالم روسيا 2018 بين البرتغال والمكسيك (شهر اكتوبر 2022).

Video, Sitemap-Video, Sitemap-Videos