在 IPA(Ingenuity Pathway Analysis)中,P 值是通过统计分析求得的。P 值是一个用于评估所观察到的数据与在随机情况下所能得到的结果相比是否具有统计学显著性的指标。
大致流程
在 IPA 的通路分析中,P 值通过以下步骤计算得出。
- 输入数据的预处理:为了进行通路分析,输入基因表达数据或蛋白质表达数据等原始数据。
- 通路的选择:选择想要分析的生物学通路。例如,可能会选择与特定疾病相关的信号转导通路或代谢通路等。
- 通路的打分:计算所选通路中所包含的基因和蛋白质的分数。为此,例如可能会使用基因表达数据的差异表达分析或蛋白质表达变化的分析等。
- 置换检验:基于通路内基因和蛋白质的分数,生成随机数据集。这些随机数据集在保留输入数据特性的同时,将基因和蛋白质的分数随机分配。
- P 值的计算:使用置换检验生成的随机数据集,建立分数的随机分布。随后,评估所观察到的分数在随机分布中处于哪个位置,并计算 P 值。P 值表示所观察到的分数在随机分布下被得到的概率。
P 值越小,所观察到的分数在随机情况下被得到的概率就越低。一般来说,如果 P 值在 0.05 以下(通常在 0.01 以下),则被视为具有统计学显著性。在这种情况下,由于所观察到的分数在随机情况下被得到的概率非常低,因此被认为存在真正有意义的生物学关联。
通路的打分是如何进行的?
在通路的打分中,将基因的重要性和贡献度进行数值化并加以评估。
作为具体的例子,假设有 3 个与某条通路相关的基因(A、B、C),并且各个基因的表达水平如下给出。
基因 A 的表达水平:10 基因 B 的表达水平:5 基因 C 的表达水平:8
在这种情况下,假设根据表达水平计算基因的分数,并以例如满分 10 分进行评估。由于基因 A 具有最高的表达水平,故定为 10 分。由于基因 B 的表达水平中等,故定为 5 分。由于基因 C 的表达水平也较高,故定为 8 分。
然后,对这些分数进行归一化。例如,假设将其缩放到 0 到 1 的范围内。在这种情况下,基因 A 为 1.0,基因 B 为 0.5,基因 C 为 0.8。
通过上述方式,可以对通路内的基因进行打分。由此,可以评估基因的重要性以及其在通路内的作用。
什么是置换检验?
在置换检验中,为了进行统计分析,将数据随机重新排列。通过这种随机重新排列,预测在数据处于随机状态下所能得到的结果。
在已从患者数据中得知基因 A 和基因 B 的表达的情况下,要评估它们是否参与 Pathway X 时,可以按以下步骤进行置换检验。
- 数据的预处理:从患者数据中提取基因 A 和基因 B 的表达数据。
- 基因的打分:使用基因 A 和基因 B 的表达数据,为各个基因打分。分数的计算方法可以根据基因的表达水平和重要性来设定。
- 置换检验的准备:为进行置换检验,准备基因 A 和基因 B 的分数数据。
- 置换的执行:将基因 A 和基因 B 的分数数据随机重新排列,执行置换检验。由此预测在随机情况下得到基因 A 与基因 B 之间关联时所能得到的结果。
- 置换的重复:将置换重复多次,生成随机数据集。通常会进行数千次以上的重复。
- 结果的评估:将置换检验所得到的随机数据集与原始数据进行比较。具体而言,评估基因 A 和基因 B 的分数在随机数据集中处于哪个位置。由此,可以从统计学上评估基因 A 和基因 B 的分数是否参与 Pathway X。
通过置换检验,可以评估基因 A 和基因 B 的分数是否与 Pathway X 具有统计学显著的关联。由此,可以从统计学上验证特定基因是否参与特定的通路。
P 值是如何得出的?
- 在执行置换检验之后,评估原始数据在随机数据集中处于哪个位置。
- 为了进行评估,计算原始数据的统计量(例如,基因 A 和基因 B 的分数之差的绝对值或相关系数等)。
- 在置换检验所得到的随机数据集中,计算得到大于或等于原始数据的统计量的比例。
- 这个比例即为 P 值。P 值表示原始数据在随机状态下被得到的概率。
例如,让我们考虑评估基因 A 和基因 B 的分数之差的绝对值的情形。
- 通过置换检验,将基因 A 和基因 B 的分数数据随机重新排列。
- 计算原始数据中基因 A 和基因 B 的分数之差的绝对值。
- 在置换检验所得到的随机数据集中,数出得到大于或等于原始数据的差的绝对值的次数。
- 将该次数除以置换的重复次数,计算出比例。这即为 P 值。
P 值表示原始数据在随机状态下被得到的概率。P 值越小,原始数据在随机状态下被得到的概率就越低。在统计学假设检验中,将其与预先设定的显著性水平(通常为 0.05 或 0.01)进行比较,如果 P 值较小,则可以说结果具有统计学显著性。
以上是 P 值计算方法的一个例子。由此,可以从统计学上评估置换检验的结果,并求得原始数据在随机状态下被得到的概率。
如果整理成图,大概就是这样的吧。
