PV值是什么意思(p值和p value一样吗)

来源:互联网 知识问答 2025-10-23 13:12:23 37

当我们谈论p值时,我们在谈论什么?

此变量的p值小于0.05,因此此变量很重要

.

你真的知道你在说什么吗?这个p值是什么鬼?为什么小于0.05很重要?什么叫重要?

最后.

这一次,我们来谈谈到底什么是P值。

在讨论p值之前,我们先抛硬币举个例子。

硬币有两面。在概率上,我们知道双方的概率都是50%(1/2)。所以,作为一个正常的硬币,如果我们无限期的投下去,结果会是每边50%。但是,如果我想知道我手里的硬币是不是正常硬币,有没有被篡改,在实际操作中是无法无限次投掷的。所以只能用有限的结果来判断“一枚硬币是不是普通硬币”这个问题的答案。

在统计学上,做这个检验的时候,我们通常会设置一个零假设(也叫零假设),这个零假设通常被称为H0。另一个假说,与虚无假说相反的假说。如果证明虚无假说是错误的,就可以推导出对立假说。

在抛硬币的例子中,我们可以设置

H0:手中的硬币是普通硬币。

H1:手里的硬币被篡改过

如果手里的硬币是普通硬币,我们知道正面和反面出现的概率分别是50%,那么如果我把硬币抛10次,正面和反面会出现5次。五头五尾是我们抛10次硬币的期望值。

现在开始抛硬币,有三头七尾。这个结果是我们投掷硬币10次的观测值,也就是实际结果。

通过分析期望值和观测值的差距,可以判断硬币是否正常。期望值与观测值之差的判断方法是卡方检验。

图1卡方计算公式

上图是卡方的计算公式,其中O代表观察值,E代表期望值。你觉得这和方差公式差不多吗?是的,实际上方差是一组数据与其均值的比较,而chi-suaqre是一组数据与另一组数据的期望值的比较。

那么在抛硬币的例子中,卡方(卡方)=(3-5) 2/5 (7-5) 2/5=1.6。

图2抛硬币实验:观察值与期望值对照表

计算卡方,那么如何判断测试结果?现在,跟我一起拿出卡方分布表(见图2 )~

图3卡方分布表

上图是卡方分布表,左上角的表示错误拒绝H0假设的概率(即原假设实际成立,但我们计算的结果错误判断原假设不成立的概率)。n代表自由度,即自变量个数减1。在这个例子中,自变量的数量是2(前和后),因此自由度是1(2-1=1)。

当然,你也会看到不同于上图的卡方分布图,比如图3。P是,也就是P(当H0为真时拒绝H0)(其实就是P值),df代表自由度。

图4卡方分布表

假设置信度为95%,错误拒绝H0的概率为0.05。解释是,我们有95%的概率确信测试结果是正确的,有5%的概率错误地拒绝零假设。(我们总说P值和0.05一样,其实不一定是0.05。可以根据具体情况设置不同的值,但大部分时候用0.05。)

参考卡方分布表(图4),找到1所在的行(我们计算的卡方自由度是1),发现1.6在1.323到2.706之间。查表显示其P值在0.25-0.1之间,大于0.05,所以我们不能拒绝H0。换句话说,H0认为,那枚硬币是一枚普通的硬币,不存在操纵。

图5卡方分布表(卡方=1.6)

通过观察卡方分布表可以发现,卡方越大,其P值越小。举个极端的例子,如果我抛一个硬币10次,正好5个正面5个反面,那么此时的卡方为0(观测值与期望值一致),此时的p值远大于0.095。没有理由拒绝H0。H0假设成立,即硬币是一个普通的硬币。

图6卡方分布表(卡方=0)

总而言之,

p值的作用:p值是判断H0假说是否成立的依据。因为期望值是基于H0假设的,如果观测值与期望值一致,就意味着检验现象越接近零假设,就越没有理由拒绝零假设。如果观测值偏离期望值,零假设越站不住脚,就越有理由拒绝零假设,从而推导出相反假设的成立。

p值的计算:计算卡方分布,计算自由度,查卡方分布表。

总的想法是,

假设H0和H1互斥,计算H0为真时的期望值,统计实际观测值,从期望值和观测值得到卡方(chi-square),再通过卡方查表得到P值。根据p值和(1-置信度)的比较,如果p值,拒绝)H0

推出H1成立;如果p-value>α,则接受(accpet)H0,推出H1不成立。

最后再划重点,把开头的几个问题再解释下。

【这个p-value到底是个什么鬼?】p值可通过计算chi-square后查询卡方分布表得出,用于判断H0假设是否成立的依据。

【为什么小于0.05就很重要?】大部分时候,我们假设错误拒绝H0的概率为0.05,所以如果p值小于0.05,说明错误拒绝H0的概率很低,则我们有理由相信H0本身就是错误的,而非检验错误导致。大部分时候p-value用于检验独立变量与输入变量的关系,H0假设通常为假设两者没有关系,所以若p值小于0.05,则可以推翻H0(两者没有关系),推出H1(两者有关系)。

【很重要是什么意思?】当p值小于0.05时,我们就说这个独立变量重要(significant),因为这个独立变量与输出结果有关系。

相关问答:相同数据用不同统计软件计算的p值一样吗?

你好!
道理上讲,只要算法一样,得到的结果应该是相同的,精度肯定会有不同,也可能会相同。算法不同,P值就可能不同了。
希望对你有所帮助,望采纳。

上一篇:农行卡号怎么查询

下一篇:股票k线图入门图解

需要摆账亮资?咨询在线客服,3分钟快速回复!