كثيرًا ما يتخيل الناس وجود علاقة مباشرة بين حدثين معينين لمجرد أنهما وقعا في نفس الفترة الزمنية أو لمجرد أن وقوع أحدهما تلا الآخر. وكثيرًا ما يُستخدم مصطلحي الارتباط والسببية بطريقة متبادلة، حتى أن هناك من يعتقد أن الارتباط والسببية مفهومان مترادفان. في واقع الأمر الاختلافات بين مصطلحي الارتباط والسببية عديدة ومتنوعة، ويمكن للخلط بينهما أن يخلق مجموعة من المشاكل المنطقية، خصوصًا عند دراسة الظواهر الطبيعية، أو عند التعامل مع الأوراق البحثية.
يعد مثال ارتباط العلاج باستخدام الهرمونات البديلة مع مرض القلب التاجي من الأمثلة الشهيرة التي تستخدم لتوضيح مسألة الخلط بين مفهومي الارتباط والسببية . حيث أظهرت العديد من الدراسات الإحصائية أن النساء اللائي استخدمن العلاج باستخدام الهرمونات البديلة، لديهن معدل أقل من المتوسط من معدل الإصابة بأمراض القلب التاجية عند باقي النساء، مما دفع الأطباء إلى اقتراح أن العلاج باستخدام الهرمونات البديلة يساعد على الوقاية من مرض القلب التاجي. لكن التجارب العشوائية المنضبطة ذات الشواهد )بالإنجليزية: Randomised Control Trial) أظهرت لاحقًا أن استخدام العلاج التعويضي بالهرمونات أدى إلى زيادة صغيرة ذات دلالة إحصائية في معدل الإصابة بأمراض الشرايين التاجية. كذلك أظهرت إعادة تحليل البيانات المستقاة من الدراسات الإحصائية أن هؤلاء النساء اللائي كن يستخدمن العلاج التعويضي بالهرمونات، كن من طبقة اجتماعية اقتصادية عالية تتبع نظامًا غذائيًا صحيًا مع ممارسة للأنظمة الرياضية بشكل متكرر أكثر من غيرهن. وبالتالي فإن استخدام العلاج التعويضي بالهرمونات وانخفاض معدل الإصابة بأمراض القلب التاجية كانت آثارًا متزامنة لسبب شائع (أي أن قلة معدلات الإصابة بأمراض الشرايين التاجية عند النساء اللائي استخدمن العلاج باستخدام الهرمونات البديلة، كان بسبب وضعهم الاجتماعي المرتفع بالإضافة إلى النظام الغذائي المنتظم وممارسة الرياضة) بدلاً من كونها أحد الأسباب المباشرة للآخر، كما كان يعتقد في بادئ الأمر.
سنحاول في مقالتنا تسليط الضوء على عبارة «الارتباط لا يعني السببية» لنفسرها، ونضع خطوطًا عريضةً للتعريف بكل من المصطلحين.
الارتباط والسببية
- ما هو الارتباط
يُعد الارتباط أحد التقنيات الإحصائية التي من شأنها أن تخبرنا بمدى قوة الترابط بين زوج من المتغيرات الخطية (أ) و (ب)، وكيفية تغيرهما معًا، إذ لا شأن لهذه التقنية بالإجابة عن أسئلة مثل «كيف، ولماذا» التي تكمن وراء علاقة ما، بل إنها تحدد بأن العلاقة موجودة فقط.
- في حالة الارتباط يؤدي تغير (أ) إلى تغير (ب):
قد تكون هذه الحالة قد حدثت بمحض الصدفة. لمجرد أنك تمكنت من تحديد إتصال ما، فهذا لا يعني أن الاتصال موجود فعلًا، فعلى سبيل المثال، كلما زادت مبيعات شركة «Apple» (المتغير-أ)، –كما هو الحال عند طرحها لإصدار جديد؛ تزداد معها معدل الوفيات بسبب السقوط على الدرج (المتغير-ب).
إن المُعطيات واضحة هنا، ما مِن اتصال مباشر بين المُتغيرين (أ و ب)، إذ لا يقوم موظفو المبيعات بدفع الناس إلى أسفل الدرج، لكن نظرًا لحالة الجنون التي تُصيب عشاق هذه الشركة مع كل إطلاق لإصدار جديد؛ فإنهم يتدافعون، ويدوسون على بعضهم البعض للحصول على هاتفهم الجديد، وبالتالي يكون حادث الوفاة بسبب السقوط على الدرج ناتج عن البيع، وليس البيع هو الذي أدى للوفاة.
- ما هي السببية؟
تأخذ السببية خطوة أبعد من الارتباط، بحيث تقول بأن أي تغيير في قيمة المتغير (أ)، سيؤدي إلى تغيير في قيمة المتغير (ب)، مما يعني بأن متغيرًا واحدًا يجعل الآخر يحدث. يشار لهذا التعريف باسم السببية أو النتيجة.
- في حالة السببية يؤدي تغير (أ) إلى حدوث (ب):
كمثال على ذلك، لو حدث خلل بأحد خطوط أنابيب نقل النفط، وأدى لتسرب كبير يقدر بملايين الجالونات في المياه؛ لن يقتصر الضرر هنا على التداعيات البيئية الهائلة فحسب، بل سترتفع أسعار النفط بسبب الانخفاض المفاجئ في العرض، وبالتالي تسبب تسرب النفط (المتغير-أ) بشكل مباشر في ارتفاع سعره (المتغير-ب)، أي أن السابق تسبب في حدوث الأخير.
الآن، وبعد أن فهمنا ماذا يعني كلٌ من الارتباط والسببية ، حان الوقت لفهم كيف أن الارتباط لا يقتضي السببية.
- هل يُعقل أن يُسبب استهلاك المثلجات وفاة الناس؟
هل سمعت يومًا بدراسة حول ارتباط زيادة مبيعات المثلجات بمعدل جرائم القتل في نيويورك؟
أثبتت تلك الدراسة التي أجريت عام 2009 أن مع كل ارتفاع أو انخفاض في مبيعات المثلجات، يزداد وينخفض معدل جرائم القتل. وفي دراسة مماثلة أخرى، وجد الباحثون أن معدل الوفيات بسبب الغرق كان أعلى من المعتاد عندما بلغت مبيعات المثلجات ذروتها.
الآن ونحن على أبواب فصل الصيف، هل يجب علينا القلق على سلامتنا في ضوء هذه النتائج المُقلقة؟ أو أن نحظر بيع المثلجات نهائيًا؟
حسنًا ربما هناك علاقة مختلفة بين هذه المُتغيرات ولا نستطيع رؤيتها، دعونا نحلل المعطيات أكثر.
- قبل تحديد نوعية الاتصال بين المتغيرات، ابحث عن العوامل المُسببة
من المهم أن نضع في اعتبارنا العوامل الأساسية قبل القيام بأي استنتاج، فقد نجد في كثير من الحالات، بعضًا من العوامل (الخفية) إن صح التعبير، والتي ترتبط مع العامل الرئيسي في مستوى ما.
بالعودة إلى مثالنا عن مبيعات المثلجات وزيادة معدلات جرائم القتل، وحوادث الغرق، سنجد بأن العامل الخفي هنا، والذي يُسبب كِلا الأمرين هو حالة الطقس، فإن كان مُشمسًا كما هو الحال في فصل الصيف؛ تزداد نشاطات الناس فيخرجون للسباحة مثلًا، أو للتنزه والاستمتاع بيوم مشمس لطيف، وتهدئة أعصابهم بتناول المثلجات.
أصبح لدينا الآن زيادة في مبيعات المثلجات، وزيادة في تجمعات الناس في الخارج، وبالتالي زيادة إمكانية تعرضهم لحوادث كالقتل أو الغرق -إن حدثا-، أي لا علاقة سببية بين المثلجات ومعدلات الوفاة، وإنما كلًا منهم تربطهم علاقة سببية مع الطقس المشمس ،الذي جمع بينهم في المقام الأول.
لتوضيح الأمر أكثر، اجلبوا ورقة وقلم، ولنرسم مخططًا للفكرة:
لحل معضلة الخلط بين مفهومي الارتباط والسببية ، اقترح الإحصائي الإنجليزي، السير أوستن برادفورد هيل، مجموعة من المعايير قوامها تسعة، لتقديم دليل يوضح العلاقة التي تربط تدخين السجائر وسرطان الرئة (أي بين السبب المفترض والتأثير المرصود)، وهي كالتالي:
- معايير أوستن برادفورد هيل لتمييز العلاقة السببية بين حدثين
- قوة الارتباط: بالرغم من أنه كلما كان الارتباط أكبر، زادت احتمالية كونه سببًا في حدوثه، إلا إن صغر الارتباط لا يعني عدم وجود تأثير سببي له، كمثال على ذلك، أظهرت الاستفسارات حول التدخين أن معدل الوفيات بسرطان الرئة لدى مدخني السجائر، هو تسعة إلى عشرة أضعاف المعدل ذاته لدى غير المدخنين، لكن من الناحية الأخرى، لا يزيد معدل الوفيات بتجلط الشرايين التاجية لدى المدخنين، عن ضعف معدل الوفيات، وربما أقل لدى غير المدخنين.
- تناسق الارتباط المرصود: النتائج المتسقة التي لاحظها أشخاص مختلفون في أماكن مختلفة مع عينات مختلفة بين العاملين تقوي احتمال حدوث تأثير، وكذلك إمكانية إعادة إنتاج العوامل نتيجة لبعضها البعض في أماكن أخرى وتجارب أخرى يزيد احتمال كون الارتباط سببي.
- الخصوصية: يُرجح أن تكون السببية موجودة إذا كان هناك عدد محدد جدًا من السكان، في موقع معين مع المرض، دون وجود أي تفسير محتمل آخر. هنا كلما كان الارتباط بين العامل والتأثير أكثر تحديدًا، كلما كانت احتمالات العلاقة السببية أكبر.
- الزمانية: من أساسيات الارتباط والسببية هو حدوث التأثير بعد السبب، حتى وإن حصل تأخير بين السبب والنتيجة المتوقعة، يجب أن يحدث التأثير بعد هذا التأخير.
- التدرج البيولوجي (علاقة التعرض بالاستجابة): عند وصف مقدار استجابة كائن حي ما لمنبه أو عامل ضغط كمادة كيميائية مثلًا، يأتي التدرج البيولوجي ليشرح أنه كلما كان التعرض للمنبه أكبر، يجب أن يؤدي ذلك إلى حدوث تأثير أكبر، ومع ذلك، يمكن أن يؤدي وجود المنبه فقط إلى إحداث التأثير في بعض الحالات.
- المعقولية: قد نلاحظ ارتباطًا جديدًا في العلم أو الطب، وبالتالي يجب ألا نتجاهله بتهور لكونه غريب، ومن المفيد أن يكون السبب معقولًا من الناحية البيولوجية.
- التجانس: يجب ألا يتعارض تفسير السبب والتأثير بشكل خطير مع الحقائق المعروفة للتاريخ الطبيعي، وبيولوجيا المرض.
- التجربة: من الممكن أحيانًا اللجوء إلى الأدلة التجريبية أو شبه التجريبية، كأن تُتخذ بعض الإجراءات الوقائية لمجرد ملاحظة ارتباط ما، كأن يتوقف الشخص عن التدخين، وعندها نرى ماذا ينتج عنه من تأثيرات مصاحبة.
- التشابه (القياس): في بعض الظروف، يكون من العدل الحكم عن طريق القياس أو أوجه التشابه بين الارتباط المرصود وأي ارتباطات أخرى.
خلاصة
في علم الإحصاء تشير عبارة الارتباط لا يقتضي السببية أو الارتباط لا يعني السببية إلى عدم القدرة على الوصول إلى أي استنتاج شرعي للعلاقة بين سبب ونتيجة معينة بين متغيرين فقط على أساس ارتباط أو علاقة ملحوظة بينهما، عبارة أخرى، تشير هذه العبارة إلي أن ارتباط شيئين مع بعض لا يعني بالضرورة أن أحدهما يسبب الآخر، وهو ما سعى هيل لتوضيحه من خلال وضع مجموعة معاييره الشهيرة.
المصادر:
- Statistics For Dummies – Rumsey, Deborah J. 2nd Edition. 2011 – page. 308
- https://www.nytimes.com/2009/06/19/nyregion/19murder.html
- https://slate.com/news-and-politics/2013/07/warm-weather-homicide-rates-when-ice-cream-sales-rise-homicides-rise-coincidence.html
- Business Research Methods by William G. Zikmund، Barry J. Babin، Jon C. Carr، Mitch Griffin. 9th Edition. 2013 – page 55
- Austin Bradford Hill, “The Environment and Disease: Association or Causation?,”
- Proceedings of the Royal Society of Medicine, 58 (1965), 295-300.