确定主成分的数量:通常来说,保留前几个主成分就足够解释原始数据的大部分变异
异常值检测:通过观察PCA图中样本的分布情况,可以发现是否存在异常值。如果某个样本在各个主成分上的得分都明显偏离其他样本,则表示该样本为异常值
聚类分析:通过观察PCA图中样本的分布情况,将相似的样本归为同一类,不相似的样本归为不同类
预测分析:如果已知某些样本属于某一类或具有某一标签,就可以在PCA图中找到这些样本的位置,并预测新样本的分类或标签
02
结合具体案例怎么看?
①图题:肿瘤体积大小不同的3个组别
②图例
绿色圆点:代表肿瘤体积较小的患者粪便样本
蓝色圆点:代表肿瘤体积中等的患者粪便样本
红色圆点:代表肿瘤体积较大的患者粪便样本
绿色圆点:代表肿瘤体积较小的患者粪便样本
蓝色圆点:代表肿瘤体积中等的患者粪便样本
红色圆点:代表肿瘤体积较大的患者粪便样本
③纵坐标:第二主成分坐标轴及主成分贡献率
④横坐标为第一主成分坐标轴及主成分贡献率主成分贡献率,即每个主成分的方差在这一组变量中的总方差中所占的比例(PC为主成分变量,有的图以PC作为横纵坐标轴)
⑤圆点:样本点,不同的颜色或形状表示不同的分组情况。样本点之间连线距离短,则样本之间差异性小;反之,样本之间差异大;若圆点在圆圈外,则为离散样本,无统计学意义
⑥圆圈相关
圆圈:置信椭圆通常为95%的置信区间
不同的圆圈:不同的样本组
圆圈之间的距离:样本组之间的分离程度,距离越远,分离越显著。该图中的3个圆圈距离较近(重合面积较大),表明其无显著差异
圆圈的大小和形状:数据的分布和密集度。紧凑的圆圈表示数据点在这个主成分上的分布比较集中,而较大的或形状不规则的圆圈表示数据点在这个主成分上的分布比较分散或存在异常值
圆圈:置信椭圆通常为95%的置信区间
不同的圆圈:不同的样本组
圆圈之间的距离:样本组之间的分离程度,距离越远,分离越显著。该图中的3个圆圈距离较近(重合面积较大),表明其无显著差异
圆圈的大小和形状:数据的分布和密集度。紧凑的圆圈表示数据点在这个主成分上的分布比较集中,而较大的或形状不规则的圆圈表示数据点在这个主成分上的分布比较分散或存在异常值
案例解读
为了测试肿瘤体积大的患者是否系统性地表现出其微生物群的变化,研究者使用Bray-Curtis指数测量了整个队列的β多样性。主成分分析(PCA)显示这些患者的β多样性无显著差异。
03
什么是主成分?
主成分就是原始变量的线性组合。
第一主成分对应第一坐标轴,表示了原始数据中多个变量通过某种变换得到的新变量的变化范围,能够最大程度解释数据中方差的线性组合。
第二主成分则对应第二坐标轴,代表了第二个新变量的变化范围,能够最大程度解释数据中的方差。
04
PCA分析有哪些注意事项?
当我们遇到非线性的或高阶相关的变量关系时,就无法通过PCA分析发挥数据降维的作用
当我们遇到两个变量的数值尺度相差较大时,必须先进行标准化处理,确保变量之间的数值尺度相同,才能进行PCA分析
当我们进行PCA分析时,需要假设变量服从高斯分布,如果变量不服从高斯分布(例如均匀分布时),则会发生尺度缩放与旋转
当我们遇到非线性的或高阶相关的变量关系时,就无法通过PCA分析发挥数据降维的作用
当我们遇到两个变量的数值尺度相差较大时,必须先进行标准化处理,确保变量之间的数值尺度相同,才能进行PCA分析
当我们进行PCA分析时,需要假设变量服从高斯分布,如果变量不服从高斯分布(例如均匀分布时),则会发生尺度缩放与旋转
05
PCA图有哪些衍生类型?
①PCA散点图
②PCA双标图
③PCA三维图
④PCA山脊图
往期推荐
·【文献读图】相关性热图怎么看?1分钟速解!(附详细案例)
·【文献读图】Pearson/Spearman相关性分析散点图怎么看?3分钟详解!(附详细案例)
·【文献读图】一文看懂UpSet图!(附详细案例)
·【文献读图】一文读懂生存曲线!(附详细案例)
声明:本文提供的部分资料综合整理自网络,仅供学习和研究使用,不得用于任何商业用途。如有侵权,请联系我们删除~
数据分析工具不会用?数据挖掘无从下手?
与其花半年自学,磨个1年没结果
不如交给专业团队,最快10天出成果!
基础&临床
数据分析服务
8年服务经验,20000+成功案例
数据分析0失误率,成果真实有效
👇服务答疑环节👇
Q1
服务靠谱吗,分析师是否专业?
团队——「教授级」水平
一流服务团队,来自985/211顶尖院校
深耕医学生物领域,20+数据分析工具手拿把掐
结果——100%真实有效
尊重原始数据,最大程度挖掘有效结果
单位是否认可?放心!绝对认可!
隐私——密上加密
业务开展前期签署保密协议
个人隐私绝对安全
抢发SCI
评职称的要求达到了,心里美滋滋~
即刻咨询,抢占先机👇
Q2
多久能拿结果,数据会泄露吗?
速度比找课题还快!
3天定方案,10天拿结果
加快文章完稿,SCI发表不耽误
数据比锁保险箱里还保险!
正规企业,诚信经营!
数据泄露0发生,100%严格保密!
同事文章都投稿了,你还在犹犹豫豫?
即刻咨询,早定早享受👇
END返回搜狐,查看更多