深圳易捷网络科技财税咨询网-neatmaster518.com 返回首页

T检验和卡方检验

信息来源:深圳市易捷网络科技有限公司
信息发布时间:2025/4/6

好久没有更新博客了,今天更新一篇关于数据分析方法的文章,主要是基于统计学的假设检验的原理,无论是T检验还是卡方检验在现实的工作中都可以被用 到,而且结合Excel非常容易上手,基于这类统计学上的显著性检验能够让数据更有说服力。还是保持一贯的原则,先上方法论再上应用实例,这篇文章主要介 绍方法,之后会有另外一篇文章来专门介绍实际的应用案例。

关于假设检验

假设检验(Hypothesis Testing),或者叫做显著性检验(SignificanceTesting)是数理统计学中根据一定假设条件由样本推断总体的一种方法。其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此 假设应该被拒绝还是接受作出推断。既然以假设为前提,那么在进行检验前需要提出相应的假设:

H0:原假设或零假设(null hypothesis),即需要去验证的假设;一般首先认定原假设是正确的,然后根据显著性水平选择是接受还是拒绝原假设。

H1:备择假设(alternative hypothesis),一般是原假设的否命题;当原假设被拒绝时,默认接受备择假设。

如原假设是假设总体均值μ=μ0,则备择假设为总体均值μ≠μ0,检验的过程就是计算相应的统计量和显著性概率,来验证原假设应该被接受还是拒绝。

T检验

T检验(TTest)是最常见的一种假设检验类型,主要验证总体均值间是否存在显著性差异。T检验属于参数假设检验,所以它适用的范围是数值型的数据,在网站分析中 可以是访问数、独立访客数、停留时间等,电子商务的订单数、销售额等。T检验还需要符合一个条件——总体符合正态分布。

这里不介绍t统计量是怎么计算的,基于t统计量的显著性概率是怎么查询的,其实这些计算工具都可以帮我们完成,如果有兴趣可以查阅统计类书籍,里面都会有相应的介绍。这里介绍的是用Excel的数据分析工具来实现T检验:

Excel默认并没有加载“数据分析”工具,所以需要我们自己添加加载项,通过文件—选项—加载项—勾选“分析工具库”来完成添加,之后就可以在 “数据”标签的最右方找到数据分析这个按钮了,然后就可以开始做T检验了,这里以最常见的配对样本t检验为例,比较某个电子商务网站在改版前后订单数是否 产生了显著性差异,以天为单位,抽样改版前后各10天的数据进行比较:

首先建立假设:

H0:μ1=μ2,改版前后每天订单数均值相等;

H1:μ1≠μ2,改版前后每天订单数均值不相等。

将数据输入Excel,使用Excel的数据分析工具,选择“t检验:平均值的成对二样本分析”,输出检验结果:

看到右侧显示的结果是不是有点晕了,看上去有点专业,其实也并不难,只要关注一个数值的大小——单尾的P值,这里是0.00565,如果需要验证在 95%的置信水平下的显著性,那么0.00565显然小于0.05(1-95%),拒绝零假设,认为改版前后的订单数存在显著性差异。简单说下为什么选择 单尾显著性概率P,而不是双尾,对于大部分网站分析的应用环境,我们一般需要验证改动前后数值是否存在明显提升或下降,所以一般而言只会存在一类可能—— 或者提升或者下降,所以只要检验单侧的概率即可,就像上面例子中改版后的订单数均值1240.6大于改版前的1097.3,我们需要验证的就是这种“大 于”是否是显著的,也就是做的是左侧单边检验,这种情况下只要关注单尾的显著性概率P即可。

卡方检验

卡方检验(chi-squaretest),也就是χ2检验,用来验证两个总体间某个比率之间是否存在显著性差异。卡方检验属于非参数假设检验,适用于布尔型或二项分布数据,基于两个概 率间的比较,早期用于生产企业的产品合格率等,在网站分析中可以用于转化率、BounceRate等所有比率度量的比较分析,其实在之前的文章——AbandonmentRate的影响因素进行过相关的应用。这里同样不去介绍χ2是如何计算得到的,以及基于χ2统计量的显著性概率的查询等,这里直接以转化率为例来比较网站 改版前后转化率是否发生了显著性差异,抽样改版前后各3天的网站分析数据——总访问数和转化的访问数,用“转化访问数/总访问数”计算得到转化率:

首先建立假设:

H0:r1=r2,改版前后转化率相等;

H1:r1≠r2,改版前后转化率不相等。

其实这是一个最简单的四格卡方检验的例子,也无需使用SPSS(当然你足够熟悉SPSS也可以使用类似的统计分析工具),为了简化中间的计算步骤,我这里用Excel直接制作了一个简单的卡方检验的模板,只要在相应的单元格输入统计数据就能自动显示检验的结果:

点击下载:卡方检验示例

Excel中浅蓝色的单元格都支持输入,包括原用方案和测试方案的总访问数和转化访问数,另外置信度95%也是支持修改了,如果你需要99%的置信水平,只要修改这个单元格即可。

怎么看检验结果其实非常简单,只要看那个红色的“存在”单元格的显示结果即可,上面的案例中两者的转化率“存在”显著性差异,如果不存在,则该单 元格相应的就会显示“不存在”,有了这个模板对于A/BTesting等类似的数据比较也显得非常简单容易,或者说其实这个Excel模板就是为了A/B Testing而量身定制的。

好了,就到这里吧,其实这篇文章并不是想从专业的统计学的角度来介绍T检验和卡方检验,只是想让大家了解这两个方法的原理和适用条件,能够用最简单的方式去使用诸如此类的方法让数据更具说服力,请继续关注之后奉上的应用实例。

文章来源:网站数据分析 转载请注明出处链接。

相关行业资讯

1、怎么做门户网站建设方案需要哪些功能
2、如何为您的网站添加声音
3、网站优化中究竟要不要换空间
4、企业网站的精髓在于完美的设计和前端创意
5、企业网站用户体验的重要性
6、seo优化之文章更新四大基础要点
7、SEO优化有排名没有转化的原因是什么
8、深圳商城网站制作小技巧
9、企业网站风格内页设计如何保持一致
10、气势惊人的阿里巴巴工业网
11、外贸网站制作需要了解哪些方面
12、seo优化排名提升方法
13、效果最好的联盟广告尺寸
14、企业网站的建立有什么好处
15、浅谈企业网站优化存在的常见问题
16、企业在设计网站时究竟用什么风格才合适
17、网站设计有哪些要点
18、选择网站建设公司一定是要低价格吗
19、seo优化时怎么更好的利用“定制分析”与“优化分析”
20、如何养成富站长的秘笈
21、发掘原创文章的来源
22、网站建设行业的存在问题
23、 关于关键词的分类
24、现阶段网站分析对seo的重要性
25、分享新站如何被百度正常收录
26、“用户体验”百度是如何判断的
27、软文推广什么意思
28、网站优化:SEO从业者不能忽视的细节问题
29、浅谈到底什么是域名解析
30、新手对搜索引擎优化seo误区解读
31、什么样的网站会被检举而删除
32、门户类型的网站适合个人站长做吗
33、什么情况下网站需要改版维护
34、房产网首页的广告图优化不慎所带来的影响
35、为什么有一些网站看上去做得不怎么样但是自然
36、做企业网站制作需要考虑哪些方方面面
37、SEO不要无视优化后期数据综合_深圳网站制作公司
38、网站设计如何引导客户
39、教你如何防范以及解决死链的问题
40、地方性论坛运营经验分享
41、为什么网站设计可以改善你的SEO
42、提高B2B网站客户转化率的六个技巧
43、网站建设基础知识之网页的基本构成元素
44、怎么样做网站建设才能安全?
45、详解自媒体博客的优缺点及运营之道
46、网站模板功能简介
47、网站外链建设:该如何控制链接增长频率
48、做网站找哪家好既专业价格又合理
49、门头沟网站开发中常用的几种排版方法
50、新站优化6点SEO技术解析大全
深圳市易捷网络科技有限公司版权所有    粤ICP备2022153140号