python分类变量相关性分析,python典型相关分析

  python分类变量相关性分析,python典型相关分析

  r语言也是目前常用的数据分析编程语言之一。通过目前用户和科学家的开发,其功能也比较强大。本文用R语言corrplot制作了相关系数矩阵的热图。

  数据集中有506个观察样本和14个变量:

  image.png

  首先,将数据导入R软件。

  我的数据

  摘要(我的数据)。

  然后计算相关系数,下载相关系数矩阵corrplot包。

  表示留数

  下载install.packages(corrplot )相关系数矩阵corrplot软件包

  Corrplot(RES,method=shade ,shade.col=NA,tl.col=black ,tl.srt=45,order=AOE) #绘制相关系数矩阵

  获取图形:

  image.png

  相关系数图的颜色越深,两个变量之间的相关系数越接近1。从图中可以看出,在波士顿房价中值的MEDV列中,与LSTAT、PTRATIO、RM等变量的相关性最大。

  让我们关注一个名为corrplot的函数。

  在命令corrplot(RES,method=shade ,shade.col=NA,tl.col=black ,tl.srt=45,order=AOE )中

  Res:表示要可视化的相关系数矩阵;

  Method=shade 是指指定圆形、四边形、椭圆形、数值、阴影、颜色或饼图的图形的方法。method=c(圆形,正方形,椭圆, nunu)

  Shade.col=NA:指定图形显示的颜色。默认情况下,它显示为统一的颜色。

  Tl.col:指定文本标签的颜色,即几何图形的文本标签是什么颜色。默认值是黑色;

  Tl.srt=45,表示字符标签的大小;

  Order=AOE :指定相关系数的排序方法。可以是原始顺序(original)、特征向量角度顺序(AOE)、第一主成分顺序(FPC)、层次聚类顺序(hclust)和字母顺序。一般)AOE),排序结果比FPC好)。

  根据corrplot函数的不同属性,可以转换属性以创建具有不同相关系数矩阵的热图。

  image.png

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: