seaborn 是一个基于 matplotlib 的 Python 数据可视化库,提供了更高层次的接口来绘制有吸引力的统计图形。pairplotseaborn 中的一个函数,用于绘制数据集中多个变量之间的成对关系图。


基本用法

pairplot 函数可以快速地对数据集中的所有数值变量进行成对关系的可视化。默认情况下,它会在对角线上绘制每个变量的直方图或核密度估计图,在非对角线上绘制散点图。

import seaborn as sns

# 加载示例数据集
tips = sns.load_dataset('tips')

# 绘制 pairplot
sns.pairplot(tips)

参数说明

pairplot 函数有许多参数可以调整,以满足不同的可视化需求。以下是一些常用的参数:

  • data:输入的数据集,通常是一个 DataFrame。
  • hue:用于分组的变量,可以是数据集中的一个列名。这将在所有子图中添加颜色编码。
  • vars:指定要绘制的变量列表。
  • kind:指定非对角线上的图类型,可以是 'scatter'(默认)或 'reg'(带回归线的散点图)。
  • diag_kind:指定对角线上的图类型,可以是 'auto'(默认,根据数据类型选择)、'hist'(直方图)或 'kde'(核密度估计图)。
  • markers:指定散点图的标记类型。
  • palette:指定颜色调色板。
  • height:每个子图的高度。
  • aspect:每个子图的宽高比。

示例代码

以下是一个更详细的示例,展示了如何使用 pairplot 函数并调整一些参数:

import seaborn as sns
import matplotlib.pyplot as plt

# 加载示例数据集
tips = sns.load_dataset('tips')

# 绘制 pairplot,并使用 'sex' 列进行颜色编码
sns.pairplot(tips, hue='sex', palette='husl', markers=['o', 's'], diag_kind='kde')

# 显示图形
plt.show()

输出示例

上述代码将生成一个成对关系图,其中每个子图的对角线上是核密度估计图,非对角线上是散点图,并且根据 sex 列进行颜色编码。

在这里插入图片描述


Logo

开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!

更多推荐