高考考试网
当前位置: 首页 高考资讯

r语言计算方差贡献率(基于R语言进行单因素方差分析)

时间:2023-06-09 作者: 小编 阅读量: 3 栏目名: 高考资讯

今天,小编给大家展示的内容就是如何基于R语言进行单因素方差分析。多重比较为了找到各组两两之间是否有显著差异,可以进行两两的独立两样本t检验,但这样不能利用共同的模型参数,进行多次重复检验也会使得总第一类错误概率变得比较高,发生过度拟合。为此,可以进行一些调整,使得报告的检验p值能够控制总第一类错误概率。#实际中不同组的因变量可能有不同的方差。

在对数据进行基础的统计分析过程中,单因素方差分析(one-way analysis of variance)是比较常用的一种分析手段,一般我们要比较试验观测值的某个因变量(称为“指标”)按照一个分组变量(称为“因素”)分组后, 各组的因变量均值有无显著差异。今天,小编给大家展示的内容就是如何基于R语言进行单因素方差分析。

R包加载及数据加载

rm(list=ls())#clear Global Environmentsetwd('D:\\桌面\\单因素方差分析')#设置工作路径#加载包library(ggplot2)library(reshape)library(ggpubr)#读取数据df <- read.table(file="data.txt",sep="\t",header=T,check.names=FALSE)

由于后续数据分析的需要,将数据转换为长格式:

#转换数据data=melt(df)colnames(data)<-c('x','y')

单因素方差分析

基于aov()函数进行方差分析:

aov.manu <- aov(y ~ x, data=data)summary(aov.manu)

主效应x(分组)的F检验的p值为1.26e-07, 检验水平为0.05情况下则分组效应显著, 各组之间有显著差异。基于箱线图进行初步展示

ggplot(data,aes(x=x,y=y))stat_boxplot(geom = "errorbar", width=0.1)geom_boxplot(aes(fill=x), outlier.colour="white") theme(panel.background=element_blank(),axis.line=element_line(),legend.position="none")scale_fill_manual(values=c("#ffc000","#80c97f","#a68dc8","red")) geom_jitter(width=0.2)geom_signif(comparisons = list(c("A","B"),c("A","C"),c("A","D"),c("B","C"),c("B","D"),c("C","D")), map_signif_level=TRUE,test = t.test, y_position = c(200,205,210,215,220,225))

从箱线图来看,A组和D组之间以及B组和C组之间没有显著差异, A组与B组、C组之间均有显著差异,B组和C组与D组之间有显著差异。

多重比较

为了找到各组两两之间是否有显著差异,可以进行两两的独立两样本t检验,但这样不能利用共同的模型参数,进行多次重复检验也会使得总第一类错误概率变得比较高, 发生过度拟合。为此,可以进行一些调整, 使得报告的检验p值能够控制总第一类错误概率。multcomp包的glht()函数可以对方差分析结果进行多重比较并控制总错误率,一种方法是利用Tukey的HSD(Honest Significant Difference)方法, 程序如下:

library(multcomp, quietly=TRUE)glht(aov.manu, linfct = mcp(x = "Tukey")) |>summary()

Tukey HSD检验的结果显示在0.05水平下, A和D,B和C没有显著差异, A与B、C均有显著差异,B及C和D有显著差异,这与之前箱线图显示结果一致;

方差不相等情形

#方差分析模型要求误差项独立同正态分布,这意味着各组的因变量方差相等。

#实际中不同组的因变量可能有不同的方差。

#R中oneway.test()函数可以不要求方差相等,是一种独立两样本t检验的Welch方法推广。

oneway.test(y ~ x, data=data)

#p值为3.155e-06,说明在0.05水平下极显著, 说明四组有显著差异。

#多重比较——进行两两t检验并不使用合并的标准差估计, 使用Holm方法进行p值调整以控制总错误率:

with(data,pairwise.t.test(y, x, pool.sd=FALSE,p.adjust.method="holm"))

#在0.05水平下, A和D、B和C没有显著差异,A与B、C均有显著差异,B及C和D有显著差异,这与之前箱线图显示结果也一致;

非参数方差分析

#如果各组的因变量(指标)分布严重偏离正态, 则单因素方差分析所依据的F检验会有很大的误差,这时可以使用非参数方法,Kruskal-Wallis检验就是独立两样本比较的Wilcoxon秩和检验的推广。

kruskal.test(y ~ x, data=data)

#Kruskal-Wallis检验p值为0.002,所以在0.05水平下拒绝原假设,认为各组之间有显著差异。

参考:https://www.math.pku.edu.cn/teachers/lidf/docs/Rbook/html/_Rbook/stat-aov.html#stat-aov-1w-multc

    推荐阅读
  • 适合坐月子吃的水果(哪些水果适合孕妇吃)

    适合坐月子吃的水果苹果苹果味甘凉,性温,主要为碳水化物。含有丰富的苹果酸、鞣酸、维生素、果胶及矿物质,可预防和治疗坏血病、癞皮病,使皮肤润滑、光泽。苹果还能降低血糖及胆固醇,有利于患妊娠高血压综合症、糖尿病及肝功能不良产妇的产后恢复。香蕉香蕉中含有大量的纤维素和铁质,有通便补血的作用。坐月子期间,产妇常常发生便秘。产妇多吃些香蕉能防止产后便秘和产后贫血。对其过敏,易发湿疹者不宜食用。

  • 深海迷航怎么进入极光号(深海迷航之探索极光号攻略)

    2,极光号首尾各有一只死神,而且极光号有辐射,所以海蛾号不能开过去,用水下推进器过去就好。先靠近极光号中部浅滩后往头部游过去,这样就不会遇见死神。货舱入口有杂物堵住,用冲击炮轰走。5,货舱门后那一层有两块独眼巨人发动机碎片,仔细找一找能找到,找到后直接往下一层走,会看到有驾驶舱和海蛾号停靠处两个标识,先走海蛾再去驾驶舱。10,下载黑匣子,进实验室拿东西,走人。

  • 瘦胖子的特征(如何判断自己是不是)

    如何判断自己是不是从体重看绝对不胖,但肉眼看起来总是超出体重的“厚”,这就是传说中的“瘦胖子”,也可以被称之为SkinnyFat体型的泡芙人相信大家也有看到过:有些人体重相近,体型差别很大,这就是非常明显的体现如果BM。

  • 王者荣耀组合都有哪些(列出如下29个组合)

    王者荣耀组合都有哪些亚瑟:艾琳、安琪拉。

  • 学习粤语速成办法(得先下载这个软件)

    下面更多详细答案一起来看看吧!学习粤语速成办法打开百度手机助手,在搜索栏搜索‘百度翻译’。下载安装‘百度翻译’。打字或者语音输入自己需要变成粤语的文字点击翻译,在翻译出来的内容里面,点击翻译出来的文字下面的那个发音的小喇叭,学习粤语发音。

  • 魔兽各副本钥匙任务(魔兽各副本钥匙任务怎么完成)

    魔兽各副本钥匙任务血色修道院的钥匙:血色修道院副本入口共有四处,各不相通。擅长奥暴,战斗难度不大。通灵学院的钥匙:进入通灵学院需要盗贼开锁或者任务得到的骷髅钥匙,骷髅钥匙须完成一个系列任务才能得到。)进入黑石深渊,在通往熔火之心的传送门附近找到一块熔火碎片,然后回到黑石山脉的洛索斯·天痕那里。

  • 山东省威海市十大旅游景点排行榜(山东威海这个小渔村)

    山东省威海市十大旅游景点排行榜?的确,别看西霞口到现在为止都只是一个乡村级别的小地方,但是依托旅游业的发展,当地人民的生活水平非常高,幸福指数也令人羡慕。这时的威海,正是最好的时节,令人舒适的海风柔柔的迎面吹拂。这里的神雕山野生动物园,有着各种稀奇罕见的野生动物,它们无忧无虑的生活在这里,让前来游玩的游客大饱眼福。虽然现在西霞口还只是一个4A景区,但是按照这样的发展趋势,相信晋升5A指日可待。

  • 宝马起步抖动是怎么回事? 宝马起步抖动是怎么回事

    宝马启动抖动的原因如下:发动机积碳严重:汽车抖动最常见的原因是节气门太脏或者喷油器积碳太多。当发动机积碳过多时,冷启动喷油器喷出的汽油会被大量积碳吸收。发动机可燃混合气稀而浓;导致冷起动后怠速抖动。温度越低,冷启动所需的油量越大,积碳越多,影响冷启动成功。

  • 小舅子来你家你应该睡沙发吗(跟你的姘头鬼混去啊)

    东林夕亭01金良和文雅通过相亲认识,两个人说不上一见钟情,但也说不上彼此讨厌。每次他提出滚床单的要求时,她都会以各种理由拒绝。他很确定她出轨了,想要当场把她揪出来。他开始大喊,“文雅,你给我出来,我知道你在里面。”这时,文雅出现了,冷冷得问他,“你想干什么?”东林夕亭作者简介:东林夕亭,一个用心讲故事的作者。

  • 2021全国青少年禁毒知识竞赛小学组 2021全国青少年禁毒知识竞赛小学组题库期末考试答案

    2021全国青少年禁毒知识竞赛活动时间:2021年10月21日-11月21日活动形式:网上初赛和现场总决赛初赛流程:网上初赛阶段,竞赛活动题库通过全国青少年毒品预防教育数字化平台公布,竞赛活动系统于10月21日0时正式开放,11月21日24时关闭。答题方式:参加竞赛学生凭用户名登陆全国青少年毒品预防教育数字化平台,进入竞赛专区,点击“开始答题”按钮后,系统自动生成20道答题,每题5分,满分100分,限时10分钟答完。