في IPA (Ingenuity Pathway Analysis)، تُحسب القيمة الاحتمالية (P) باستخدام التحليل الإحصائي. القيمة الاحتمالية (P) مؤشر يقيّم ما إذا كانت البيانات المرصودة ذات دلالة إحصائية مقارنةً بما يمكن الحصول عليه في ظروف عشوائية.
الخطوط العريضة للعملية
في تحليل المسارات بواسطة IPA، تُحسب القيمة الاحتمالية (P) عبر الخطوات التالية.
- المعالجة المسبقة لبيانات الإدخال: من أجل تحليل المسارات، تُدخَل بيانات خام مثل بيانات التعبير الجيني أو بيانات التعبير البروتيني.
- اختيار المسار: يُختار المسار البيولوجي المراد تحليله. على سبيل المثال، قد تُختار مسارات نقل الإشارة أو المسارات الأيضية المرتبطة بمرض معيّن.
- تسجيل نقاط المسار: تُحسب نقاط الجينات والبروتينات المتضمَّنة في المسار المختار. ولهذا قد يُستخدم، على سبيل المثال، تحليل التعبير التفاضلي لبيانات التعبير الجيني أو تحليل تغيرات التعبير البروتيني.
- اختبار التبديل (Permutation test): استنادًا إلى نقاط الجينات والبروتينات داخل المسار، تُولَّد مجموعات بيانات عشوائية. وتحافظ مجموعات البيانات العشوائية هذه على خصائص بيانات الإدخال مع توزيع نقاط الجينات والبروتينات بشكل عشوائي.
- حساب القيمة الاحتمالية (P): باستخدام مجموعات البيانات العشوائية المولَّدة من اختبار التبديل، يُنشأ توزيع عشوائي للنقاط. ثم يُقيَّم موقع النقطة المرصودة ضمن التوزيع العشوائي، وتُحسب القيمة الاحتمالية (P). تشير القيمة الاحتمالية (P) إلى احتمال الحصول على النقطة المرصودة في توزيع عشوائي.
كلما صغرت القيمة الاحتمالية (P)، انخفض احتمال الحصول على النقطة المرصودة في ظروف عشوائية. وبصفة عامة، إذا كانت القيمة الاحتمالية (P) تساوي 0.05 أو أقل (عادةً 0.01 أو أقل)، فإنها تُعدّ ذات دلالة إحصائية. وفي مثل هذه الحالات، نظرًا لأن احتمال الحصول على النقطة المرصودة في ظروف عشوائية منخفض جدًا، يُعتقد أن هناك ارتباطًا بيولوجيًا ذا معنى حقيقي.
كيف يجري تسجيل نقاط المسار؟
في تسجيل نقاط المسار، تُحوَّل أهمية الجينات ومدى إسهامها إلى قيم عددية وتُقيَّم.
كمثال ملموس، لنفترض أن هناك ثلاثة جينات (A وB وC) مرتبطة بمسار معيّن، وأن مستوى التعبير لكل جين معطى على النحو التالي.
مستوى التعبير للجين A: 10 مستوى التعبير للجين B: 5 مستوى التعبير للجين C: 8
في هذه الحالة، لنفترض أن نقاط الجينات تُحسب استنادًا إلى مستويات التعبير وتُقيَّم، على سبيل المثال، على مقياس من 10 نقاط. وبما أن الجين A يمتلك أعلى مستوى تعبير، يُمنح 10 نقاط. وبما أن الجين B له مستوى تعبير متوسط، يُمنح 5 نقاط. وبما أن الجين C له أيضًا مستوى تعبير مرتفع، يُمنح 8 نقاط.
ثم تُطبَّع هذه النقاط. على سبيل المثال، لنفترض أنها تُقاس على نطاق من 0 إلى 1. في هذه الحالة، يصبح الجين A بقيمة 1.0، والجين B بقيمة 0.5، والجين C بقيمة 0.8.
بهذه الطريقة، يمكن إسناد نقاط للجينات داخل المسار. وهذا يتيح تقييم أهمية الجينات ودورها داخل المسار.
ما هو اختبار التبديل؟
في اختبار التبديل، تُعاد ترتيب البيانات بشكل عشوائي من أجل إجراء التحليل الإحصائي. ومن خلال إعادة الترتيب العشوائية هذه، تُتنبأ النتائج التي يمكن الحصول عليها عندما تكون البيانات في حالة عشوائية.
عندما يكون التعبير عن الجين A والجين B معروفًا من بيانات المرضى، فإنه لتقييم ما إذا كان هذان الجينان يشاركان في Pathway X، يمكن إجراء اختبار التبديل وفق الخطوات التالية.
- المعالجة المسبقة للبيانات: تُستخرج بيانات التعبير للجين A والجين B من بيانات المرضى.
- تسجيل نقاط الجينات: باستخدام بيانات التعبير للجين A والجين B، تُسنَد نقاط لكل جين. ويمكن تحديد طريقة حساب النقاط استنادًا إلى مستوى التعبير وأهمية الجين.
- الإعداد لاختبار التبديل: من أجل اختبار التبديل، تُجهَّز بيانات نقاط الجين A والجين B.
- تنفيذ التبديل: تُعاد ترتيب بيانات نقاط الجين A والجين B بشكل عشوائي، ويُنفَّذ اختبار التبديل. وهذا يتنبأ بالنتائج التي يمكن الحصول عليها عندما ينشأ الارتباط بين الجين A والجين B في ظروف عشوائية.
- تكرار التبديل: يُكرَّر التبديل عدة مرات لتوليد مجموعات بيانات عشوائية. وعادةً ما يُجرى التكرار آلاف المرات أو أكثر.
- تقييم النتائج: تُقارَن مجموعات البيانات العشوائية التي تم الحصول عليها من اختبار التبديل بالبيانات الأصلية. وعلى وجه التحديد، يُقيَّم موقع نقاط الجين A والجين B ضمن مجموعات البيانات العشوائية. وهذا يتيح التقييم الإحصائي لما إذا كانت نقاط الجين A والجين B تشارك في Pathway X.
من خلال اختبار التبديل، يمكن تقييم ما إذا كان لنقاط الجين A والجين B ارتباط ذو دلالة إحصائية بـ Pathway X. وهذا يتيح التحقق إحصائيًا مما إذا كان جين معيّن يشارك في مسار معيّن.
كيف تُستخرج القيمة الاحتمالية (P)؟
- بعد تنفيذ اختبار التبديل، يُقيَّم موقع البيانات الأصلية ضمن مجموعات البيانات العشوائية.
- لأجل التقييم، يُحسب مقياس إحصائي للبيانات الأصلية (على سبيل المثال، القيمة المطلقة للفرق بين نقاط الجين A والجين B، أو معامل الارتباط).
- من بين مجموعات البيانات العشوائية التي تم الحصول عليها من اختبار التبديل، تُحسب النسبة التي تم فيها الحصول على مقياس إحصائي أكبر من أو يساوي مقياس البيانات الأصلية.
- هذه النسبة تصبح القيمة الاحتمالية (P). تشير القيمة الاحتمالية (P) إلى احتمال الحصول على البيانات الأصلية في حالة عشوائية.
على سبيل المثال، لننظر في حالة تقييم القيمة المطلقة للفرق بين نقاط الجين A والجين B.
- من خلال اختبار التبديل، تُعاد ترتيب بيانات نقاط الجين A والجين B بشكل عشوائي.
- تُحسب القيمة المطلقة للفرق بين نقاط الجين A والجين B في البيانات الأصلية.
- من بين مجموعات البيانات العشوائية التي تم الحصول عليها من اختبار التبديل، يُعَدّ عدد المرات التي تم فيها الحصول على قيمة مطلقة للفرق أكبر من أو تساوي قيمة البيانات الأصلية.
- يُقسَم ذلك العدد على عدد تكرارات التبديل لحساب نسبة. وهذه تصبح القيمة الاحتمالية (P).
تشير القيمة الاحتمالية (P) إلى احتمال الحصول على البيانات الأصلية في حالة عشوائية. وكلما صغرت القيمة الاحتمالية (P)، انخفض احتمال الحصول على البيانات الأصلية في حالة عشوائية. وفي اختبار الفرضيات الإحصائي، عند مقارنتها بمستوى دلالة محدَّد مسبقًا (عادةً 0.05 أو 0.01)، إذا كانت القيمة الاحتمالية (P) صغيرة، فيمكن القول إن النتيجة ذات دلالة إحصائية.
ما سبق هو مثال على طريقة حساب القيمة الاحتمالية (P). وبهذا، يمكن تقييم نتائج اختبار التبديل إحصائيًا، ويمكن استخراج احتمال الحصول على البيانات الأصلية في حالة عشوائية.
إذا لُخِّص الأمر في رسم تخطيطي، فربما يكون على هذا النحو.
