这篇文章给大家介绍python入门需要掌握绘制热图展示的相关系数,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。
使用的数据集还是之前提到的3个品种小麦种子数据需要示例数据的可以直接留言
数据集包括3个品种的小麦种子7个指标,这7个指标分别是
image.png- 最后一个变量target是小麦所属种类,分别是0,1,2
第一次使用python直接在电脑上安装anaconda3就好了,我之前录制过一个视频进行介绍,可以参考
第一步启动jupyter lab (我用的是win10系统的电脑)win+快捷键 输入cmd按回车 打开命令行窗口,然后再命令行输入 jupyter lab
按回车键 jupyter lab在默认浏览器启动
点击Notebook下的python3新建一个窗口
image.png接下来就是输入命令了
导入pandas模块读入数据import pandas as pd
df = pd.read_csv("D://Rstudio_default_working/kaggle/Seed_Data.csv")
df.head()
image.png 去掉最后一列target,因为计算相关系数用不到df1 = df.drop('target',axis=1)
image.png 接下来就是导入seaborn模块绘制相关系数的热图了这里参考了 https://heartbeat.fritz.ai/seaborn-heatmaps-13-ways-to-customize-correlation-matrix-visualizations-f1c49c816f07
import seaborn as sns
sns.heatmap(df.corr())
image.png显示相关系数
sns.heatmap(df.corr(),annot=True)
image.png这里相关性分析默认的好像是皮尔逊相关性分析
更改其他的方法
image.png
image.png关于python入门需要掌握绘制热图展示的相关系数就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。