4008-953622
数据分析
数据分析中的P值怎么计算、什么意义?
发布时间:2019-12-27    信息来源:未知    浏览次数:

  左侧检验P值是当时,检验统计量小于或等于根据实际观测样本数据计算得到的检验统计量值的概率,即p值。

  右侧检验P值是当μ=μ0时,检验统计量大于或等于根据实际观测样本数据计算得到的检验统计量值的概率,即p值。

  双侧检验P值是当μ=μ0时,检验统计量大于或等于根据实际观测样本数据计算得到的检验统计量值的概率,即p值。

  P 值即概率,反映某一事件发生的可能性大小。统计学根据显著性检验方法所得到的P 值,一般以P 0.05 为显著, P 0.01 为非常显著,其含义是样本间的差异由抽样误差所致的概率小于0.05 或0.01。

  数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。这一过程也是质量管理体系的支持过程。在实用中,数据分析可帮助人们作出判断,以便采取适当行动。

  数据分析的数学基础在20世纪早期就已确立,但直到计算机的出现才使得实际操作成为可能,并使得数据分析得以推广。数据分析是数学与计算机科学相结合的产物。

  在统计学领域,有些人将数据分析划分为描述性统计分析、探索性数据分析以及验证性数据分析;其中,探索性数据分析侧重于在数据之中发现新的特征,而验证性数据分析则侧重于已有假设的证实或证伪。

  1、左侧检验P值是当μ=μ0时,检验统计量小于或等于根据实际观测样本数据计算得到的检验统计量值的概率

  2、右侧检验P值是当μ=μ0时,检验统计量大于或等于根据实际观测样本数据计算得到的检验统计量值的概率

  3、双侧检验P值是当μ=μ0时,检验统计量大于或等于根据实际观测样本数据计算得到的检验统计量值的概率

  p值是指在一个概率模型中,统计摘要(如两组样本均值差)与实际观测数据相同,或甚至更大这一事件发生的概率。换言之,是检验假设零假设成立或表现更严重的可能性。p值若与选定显著性水平(0.05或0.01)相比更小,则零假设会被否定而不可接受。

  数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。这一过程也是质量管理体系的支持过程。在实用中,数据分析可帮助人们作出判断,以便采取适当行动。

  数据分析的数学基础在20世纪早期就已确立,但直到计算机的出现才使得实际操作成为可能,并使得数据分析得以推广。数据分析是数学与计算机科学相结合的产物

  在统计学领域,有些人将数据分析划分为描述性统计分析、探索性数据分析以及验证性数据分析;其中,探索性数据分析侧重于在数据之中发现新的特征,而验证性数据分析则侧重于已有假设的证实或证伪。

  探索性数据分析是指为了形成值得假设的检验而对数据进行分析的一种方法,是对传统统计学假设检验手段的补充。该方法由美国著名统计学家约翰·图基(John Tukey)命名。

  定性数据分析又称为“定性资料分析”、“定性研究”或者“质性研究资料分析”,是指对诸如词语、照片、观察结果之类的非数值型数据(或者说资料)的分析。

  一般地,用X 表示检验的统计量,当H0为真时,可由样本数据计算出该统计量的值C,根据检验统计量X的具体分布,可求出P值。具体地说:

  左侧检验的P值为检验统计量X 小于样本统计值C 的概率,即:P = P{ X C}

  右侧检验的P值为检验统计量X 大于样本统计值C 的概率:P = P{ X C}

  双侧检验的P值为检验统计量X 落在样本统计值C 为端点的尾部区域内的概率的2 倍:P = 2P{ X C} (当C位于分布曲线的右端时) 或P = 2P{ X C} (当C 位于分布曲线的左端时) 。

  若X 服从正态分布和t分布,其分布曲线是关于纵轴对称的,故其P 值可表示为P = P{ X C} 。

  在实践中,当α = P值时,也即统计量的值C刚好等于临界值,为慎重起见,可增加样本容量,重新进行抽样检验。

  用SAS、SPSS等专业统计软件进行假设检验,在假设检验中常见到P值( P-Value,Probability,Pr),P值是进行检验决策的另一个依据。

  统计学根据显著性检验方法所得到的P 值,一般以P 0.05 为有统计学差异, P0.01 为有显著统计学差异,P0.001为有极其显著的统计学差异。其含义是样本间的差异由抽样误差所致的概率小于0.05 、0.01、0.001。

  左侧检验P值是当时,检验统计量小于或等于根据实际观测样本数据计算得到的检验统计量值的概率,即p值。

  右侧检验P值是当μ=μ0时,检验统计量大于或等于根据实际观测样本数据计算得到的检验统计量值的概率,即p值。

  双侧检验P值是当μ=μ0时,检验统计量大于或等于根据实际观测样本数据计算得到的检验统计量值的概率,即p值。

  P 值即概率,反映某一事件发生的可能性大小。统计学根据显著性检验方法所得到的P 值,一般以P 0.05 为显著, P 0.01 为非常显著,其含义是样本间的差异由抽样误差所致的概率小于0.05 或0.01。

  p值是指在一个概率模型中,统计摘要(如两组样本均值差)与实际观测数据相同,或甚至更大这一事件发生的概率。换言之,是检验假设零假设成立或表现更严重的可能性。p值若与选定显著性水平(0.05或0.01)相比更小,则零假设会被否定而不可接受。然而这并不直接表明原假设正确。

  R·A·Fisher(1890-1962)作为一代假设检验理论的创立者,在假设检验中首先提出P值的概念。他认为假设检验是一种程序,研究人员依照这一程序可以对某一总体参数形成一种判断。也就是说,他认为假设检验是数据分析的一种形式,是人们在研究中加入的主观信息。

  (当时这一观点遭到了Neyman-Pearson的反对,他们认为假设检验是一种方法,决策者在不确定的条件下进行运作,利用这一方法可以在两种可能中作出明确的选择,而同时又要控制错误发生的概率。这两种方法进行长期且痛苦的论战。虽然Fisher的这一观点同样也遭到了现代统计学家的反对,但是他对现代假设检验的发展作出了巨大的贡献。)

  P 值即概率,反映某一事件发生的可能性大小。统计学根据显著性检验方法所得到的P 值,一般以P 0.05 为显著, P 0.01 为非常显著,其含义是样本间的差异由抽样误差所致的概率小于0.05 或0.01。实际上,P 值不能赋予数据任何重要性,只能说明某事件发生的机率。 P 0.01 时样本间的差异比P 0.05 时更大,这种说法是错误的。统计结果中显示Pr F,也可写成Pr( F),P = P{ F0.05 F}或P = P{ F0.01 F}。 下面的内容列出了P值计算方法。 (1) P值是: 1) 一种概率,一种在原假设为真的前提下出现观察样本以及更极端情况的概率。 2) 拒绝原假设的最小显著性水平。 3) 观察到的(实例的) 显著性水平。 4) 表示对原假设的支持程度,是用于确定是否应该拒绝原假设的另一种方法。 (2) P 值的计算: 一般地,用X 表示检验的统计量,当H0 为真时,可由样本数据计算出该统计量的值C ,根据检验统计量X 的具体分布,可求出P 值。具体地说: 左侧检验的P 值为检验统计量X 小于样本统计值C 的概率,即 = P{ X C} 右侧检验的P 值为检验统计量X 大于样本统计值C 的概率 = P{ X C} 双侧检验的P 值为检验统计量X 落在样本统计值C 为端点的尾部区域内的概率的2 倍: P = 2P{ X C} (当C位于分布曲线的右端时) 或P = 2P{ X C} (当C 位于分布曲线的左端时) 。若X 服从正态分布和t分布,其分布曲线是关于纵轴对称的,故其P 值可表示为P = P{ X C} 。 计算出P 值后,将给定的显著性水平α与P 值比较,就可作出检验的结论: 如果α P 值,则在显著性水平α下拒绝原假设。 如果α ≤ P 值,则在显著性水平α下接受原假设。 在实践中,当α = P 值时,也即统计量的值C 刚好等于临界值,为慎重起见,可增加样本容量,重新进行抽样检验。 整理自: 樊冬梅,假设检验中的P值. 郑州经济管理干部学院学报,2002,韩志霞, 张玲,P 值检验和假设检验。边疆经济与文化,2006中国航天工业医药,1999 P值是怎么来的 从某总体中抽 ⑴、这一样本是由该总体抽出,其差别是由抽样误差所致; ⑵、这一样本不是从该总体抽出,所以有所不同。 如何判断是那种原因呢?统计学中用显著性检验赖判断。其步骤是: ⑴、建立检验假设(又称无效假设,符号为H0):如要比较A药和B药的疗效是否相等,则假设两组样本来自同一总体,即A药的总体疗效和B药相等,差别仅由抽样误差引起的碰巧出现的。⑵、选择适当的统计方法计算H0成立的可能性即概率有多大,概率用P值表示。⑶、根据选定的显著性水平(0.05或0.01),决定接受还是拒绝H0。如果P>0.05,不能否定“差别由抽样误差引起”,则接受H0;如果P<0.05或P <0.01,可以认为差别不由抽样误差引起,可以拒绝H0,则可以接受令一种可能性的假设(又称备选假设,符号为H1),即两样本来自不同的总体,所以两药疗效有差别。 统计学上规定的P值意义见下表 P值 碰巧的概率 对无效假设 统计意义 P>0.05 碰巧出现的可能性大于5% 不能否定无效假设 两组差别无显著意义 P<0.05 碰巧出现的可能性小于5% 可以否定无效假设 两组差别有显著意义 P <0.01 碰巧出现的可能性小于1% 可以否定无效假设 两者差别有非常显著意义 理解P值,下述几点必须注意: ⑴P的意义不表示两组差别的大小,P反映两组差别有无统计学意义,并不表示差别大小。因此,与对照组相比,C药取得P<0.05,D药取得P<0.01并不表示D的药效比C强。 ⑵ P>0.05时,差异无显著意义,根据统计学原理可知,不能否认无效假设,但并不认为无效假设肯定成立。在药效统计分析中,更不表示两药等效。哪种将“两组差别无显著意义”与“两组基本等效”相同的做法是缺乏统计学依据的。 ⑶统计学主要用上述三种P值表示,也可以计算出确切的P值,有人用P <0.001,无此必要。 ⑷显著性检验只是统计结论。判断差别还要根据专业知识。样所得的样本,其统计量会与总体参数有所不同,这可能是由于两种原因 [ts]kokofu 于 2010-3-25 22:12 补充以下内容[/ts] 实际上生物统计原理基于此……呵呵。 查看原帖

分享到:
您使用的浏览器版本过低,不仅存在较多的安全漏洞,也无法完美支持最新的web技术和标准,请更新高版本浏览器!!