IPA (Ingenuity Pathway Analysis) में, P मान सांख्यिकीय विश्लेषण के माध्यम से प्राप्त किया जाता है। P मान एक ऐसा संकेतक है जो यह आकलन करता है कि प्रेक्षित आंकड़े यादृच्छिक परिस्थितियों में प्राप्त होने वाले परिणामों की तुलना में सांख्यिकीय रूप से सार्थक हैं या नहीं।
सामान्य प्रवाह
IPA के पाथवे विश्लेषण में, P मान निम्नलिखित चरणों के माध्यम से परिकलित किया जाता है।
- इनपुट आंकड़ों का पूर्व-प्रसंस्करण: पाथवे विश्लेषण के लिए, जीन अभिव्यक्ति आंकड़े या प्रोटीन अभिव्यक्ति आंकड़े जैसे कच्चे आंकड़े इनपुट किए जाते हैं।
- पाथवे का चयन: जिस जैविक पाथवे का विश्लेषण करना है उसे चुना जाता है। उदाहरण के लिए, किसी विशिष्ट रोग से संबंधित संकेत संचरण पाथवे या उपापचयी पाथवे चुने जा सकते हैं।
- पाथवे का स्कोरिंग: चुने गए पाथवे में शामिल जीन और प्रोटीन के स्कोर परिकलित किए जाते हैं। इसके लिए, उदाहरण के तौर पर, जीन अभिव्यक्ति आंकड़ों का विभेदक अभिव्यक्ति विश्लेषण या प्रोटीन अभिव्यक्ति में परिवर्तन का विश्लेषण उपयोग किया जा सकता है।
- क्रमचय परीक्षण (permutation test): पाथवे के भीतर जीन और प्रोटीन के स्कोर के आधार पर, यादृच्छिक डेटासेट उत्पन्न किए जाते हैं। ये यादृच्छिक डेटासेट इनपुट आंकड़ों की विशेषताओं को बनाए रखते हुए, जीन और प्रोटीन के स्कोर को यादृच्छिक रूप से नियत करते हैं।
- P मान का परिकलन: क्रमचय परीक्षण द्वारा उत्पन्न यादृच्छिक डेटासेट का उपयोग करके, स्कोर का एक यादृच्छिक वितरण बनाया जाता है। इसके बाद, यह आकलन किया जाता है कि प्रेक्षित स्कोर यादृच्छिक वितरण के भीतर किस स्थान पर है, और P मान परिकलित किया जाता है। P मान यह दर्शाता है कि प्रेक्षित स्कोर यादृच्छिक वितरण में प्राप्त होने की प्रायिकता क्या है।
P मान जितना छोटा होगा, प्रेक्षित स्कोर के यादृच्छिक परिस्थितियों में प्राप्त होने की प्रायिकता उतनी ही कम होगी। सामान्यतः, यदि P मान 0.05 या उससे कम (आमतौर पर 0.01 या उससे कम) हो, तो उसे सांख्यिकीय रूप से सार्थक माना जाता है। ऐसी स्थिति में, चूंकि प्रेक्षित स्कोर के यादृच्छिक परिस्थितियों में प्राप्त होने की प्रायिकता बहुत कम होती है, इसलिए यह माना जाता है कि वास्तव में कोई सार्थक जैविक संबंध मौजूद है।
पाथवे का स्कोरिंग कैसे किया जाता है?
पाथवे के स्कोरिंग में, जीन के महत्व और योगदान को संख्यात्मक रूप में व्यक्त करके आकलित किया जाता है।
एक ठोस उदाहरण के रूप में, मान लीजिए कि किसी पाथवे से संबंधित तीन जीन (A, B, C) हैं, और प्रत्येक जीन का अभिव्यक्ति स्तर निम्नानुसार दिया गया है।
जीन A का अभिव्यक्ति स्तर: 10 जीन B का अभिव्यक्ति स्तर: 5 जीन C का अभिव्यक्ति स्तर: 8
इस स्थिति में, मान लीजिए कि जीन के स्कोर अभिव्यक्ति स्तर के आधार पर परिकलित किए जाते हैं और, उदाहरण के लिए, 10 अंकों के पैमाने पर आकलित किए जाते हैं। चूंकि जीन A का अभिव्यक्ति स्तर सबसे अधिक है, इसलिए उसे 10 अंक दिए जाते हैं। चूंकि जीन B का अभिव्यक्ति स्तर मध्यम है, इसलिए उसे 5 अंक दिए जाते हैं। चूंकि जीन C का अभिव्यक्ति स्तर भी अधिक है, इसलिए उसे 8 अंक दिए जाते हैं।
इसके बाद, इन स्कोर का सामान्यीकरण किया जाता है। उदाहरण के लिए, मान लीजिए कि उन्हें 0 से 1 के परास में मापित किया जाता है। इस स्थिति में, जीन A का मान 1.0, जीन B का मान 0.5, और जीन C का मान 0.8 हो जाता है।
इस प्रकार, पाथवे के भीतर के जीन को स्कोर दिए जा सकते हैं। इससे जीन के महत्व और पाथवे के भीतर उनकी भूमिका का आकलन करना संभव हो जाता है।
क्रमचय परीक्षण क्या है?
क्रमचय परीक्षण में, सांख्यिकीय विश्लेषण करने के लिए आंकड़ों को यादृच्छिक रूप से पुनर्व्यवस्थित किया जाता है। इस यादृच्छिक पुनर्व्यवस्था के माध्यम से, उन परिणामों की भविष्यवाणी की जाती है जो आंकड़ों के यादृच्छिक अवस्था में होने पर प्राप्त होंगे।
जब रोगी के आंकड़ों से जीन A और जीन B की अभिव्यक्ति ज्ञात हो, तो यह आकलन करने के लिए कि क्या ये Pathway X में शामिल हैं, निम्नलिखित चरणों के अनुसार क्रमचय परीक्षण किया जा सकता है।
- आंकड़ों का पूर्व-प्रसंस्करण: रोगी के आंकड़ों से जीन A और जीन B के अभिव्यक्ति आंकड़े निकाले जाते हैं।
- जीन का स्कोरिंग: जीन A और जीन B के अभिव्यक्ति आंकड़ों का उपयोग करके, प्रत्येक जीन को स्कोर दिए जाते हैं। स्कोर परिकलित करने की विधि जीन के अभिव्यक्ति स्तर और महत्व के आधार पर निर्धारित की जा सकती है।
- क्रमचय परीक्षण की तैयारी: क्रमचय परीक्षण के लिए, जीन A और जीन B के स्कोर आंकड़े तैयार किए जाते हैं।
- क्रमचय का निष्पादन: जीन A और जीन B के स्कोर आंकड़ों को यादृच्छिक रूप से पुनर्व्यवस्थित किया जाता है, और क्रमचय परीक्षण निष्पादित किया जाता है। इससे उन परिणामों की भविष्यवाणी की जाती है जो यादृच्छिक परिस्थितियों में जीन A और जीन B के बीच संबंध प्राप्त होने पर मिलेंगे।
- क्रमचय की पुनरावृत्ति: यादृच्छिक डेटासेट उत्पन्न करने के लिए क्रमचय को कई बार दोहराया जाता है। आमतौर पर इसे कई हजार बार या उससे अधिक दोहराया जाता है।
- परिणामों का आकलन: क्रमचय परीक्षण से प्राप्त यादृच्छिक डेटासेट की तुलना मूल आंकड़ों से की जाती है। विशेष रूप से, यह आकलन किया जाता है कि जीन A और जीन B के स्कोर यादृच्छिक डेटासेट के भीतर किस स्थान पर हैं। इससे यह सांख्यिकीय रूप से आकलन करना संभव हो जाता है कि जीन A और जीन B के स्कोर Pathway X में शामिल हैं या नहीं।
क्रमचय परीक्षण के माध्यम से, यह आकलन करना संभव है कि जीन A और जीन B के स्कोर का Pathway X के साथ सांख्यिकीय रूप से सार्थक संबंध है या नहीं। इससे यह सांख्यिकीय रूप से सत्यापित करना संभव हो जाता है कि कोई विशिष्ट जीन किसी विशिष्ट पाथवे में शामिल है या नहीं।
P मान कैसे निकाला जाता है?
- क्रमचय परीक्षण निष्पादित करने के बाद, यह आकलन किया जाता है कि मूल आंकड़े यादृच्छिक डेटासेट के भीतर किस स्थान पर हैं।
- आकलन के लिए, मूल आंकड़ों का एक सांख्यिक (उदाहरण के लिए, जीन A और जीन B के स्कोर के अंतर का निरपेक्ष मान या सहसंबंध गुणांक) परिकलित किया जाता है।
- क्रमचय परीक्षण से प्राप्त यादृच्छिक डेटासेट में से, वह अनुपात परिकलित किया जाता है जिसमें मूल आंकड़ों के सांख्यिक से अधिक या उसके बराबर सांख्यिक प्राप्त हुआ।
- यही अनुपात P मान बन जाता है। P मान यह दर्शाता है कि मूल आंकड़े यादृच्छिक अवस्था में प्राप्त होने की प्रायिकता क्या है।
उदाहरण के लिए, आइए जीन A और जीन B के स्कोर के अंतर के निरपेक्ष मान का आकलन करने के मामले पर विचार करें।
- क्रमचय परीक्षण द्वारा, जीन A और जीन B के स्कोर आंकड़ों को यादृच्छिक रूप से पुनर्व्यवस्थित किया जाता है।
- मूल आंकड़ों में जीन A और जीन B के स्कोर के अंतर का निरपेक्ष मान परिकलित किया जाता है।
- क्रमचय परीक्षण से प्राप्त यादृच्छिक डेटासेट में से, उन बार की संख्या गिनी जाती है जिनमें मूल आंकड़ों से अधिक या उसके बराबर अंतर का निरपेक्ष मान प्राप्त हुआ।
- उस संख्या को क्रमचय की पुनरावृत्ति की संख्या से विभाजित करके अनुपात परिकलित किया जाता है। यही P मान बन जाता है।
P मान यह दर्शाता है कि मूल आंकड़े यादृच्छिक अवस्था में प्राप्त होने की प्रायिकता क्या है। P मान जितना छोटा होगा, मूल आंकड़ों के यादृच्छिक अवस्था में प्राप्त होने की प्रायिकता उतनी ही कम होगी। सांख्यिकीय परिकल्पना परीक्षण में, पहले से निर्धारित सार्थकता स्तर (आमतौर पर 0.05 या 0.01) के साथ तुलना करने पर, यदि P मान छोटा हो, तो परिणाम को सांख्यिकीय रूप से सार्थक कहा जा सकता है।
उपर्युक्त P मान परिकलित करने की विधि का एक उदाहरण है। इससे, क्रमचय परीक्षण के परिणामों का सांख्यिकीय रूप से आकलन किया जा सकता है, और मूल आंकड़ों के यादृच्छिक अवस्था में प्राप्त होने की प्रायिकता ज्ञात की जा सकती है।
यदि इसे चित्र में संक्षेपित किया जाए, तो शायद कुछ ऐसा होगा।
