Python数据可视化,seaborn如何做出非常规图表

时间:2022-08-26 20:06:30

前言

上一节(Python可视化,matplotlib最佳入门练习 )我们只是单纯使用 matplotlib 制作出以下图表

Python数据可视化,seaborn如何做出非常规图表
  • 每年小麦产量柱状图
  • 使用不同颜色标记最小与最大值的柱子

但是,如果只是制作标准的图表,我们有许多其他的选择。最常见的就是使用 seaborn ,他是基于 matplotlib 的包装。

这一节我们就来看看,如何使用 seaborn 生成标准图表,然后结合 matplotlib 做出定制效果。

特别是多系列的情况下,会有一些技巧。

本文目标图表是这样:

Python数据可视化,seaborn如何做出非常规图表

2个系列。每个系列找出最小最大的柱子,标记成不同的颜色

本文所需要的库如下:

Python数据可视化,seaborn如何做出非常规图表

数据是这样子:

Python数据可视化,seaborn如何做出非常规图表

上一节做的事情如下:

  • 设置 x 轴标签的旋转角度
  • 设置某个指定柱状图的柱子颜色

简单把这些事情包装成函数:

Python数据可视化,seaborn如何做出非常规图表

使用 seaborn 的代码,实际与上一节直接使用 matplotlib 差不多:

Python数据可视化,seaborn如何做出非常规图表
Python数据可视化,seaborn如何做出非常规图表

看起来 seaborn 没有特别的地方!

这是因为我们只有一个系列(上图只涉及2个维度:wheat 与 year)

多系列

稍微修改一下数据,

Python数据可视化,seaborn如何做出非常规图表
  • 行3、4、5:复制一份数据,小麦产量随机生成
  • 行7、8:新增一个列"type",把数据划分成2类:"原始" 、"修改"
  • 行10:合并成一份数据
  • 行12:避免数据太多,图表不利于阅读,我只保留1750年以后的数据

现在数据成这样:

Python数据可视化,seaborn如何做出非常规图表

每个年份都有2行记录,字段"type"可以区分他们

使用 seaborn 可以非常方便映射多个维度的数据:

Python数据可视化,seaborn如何做出非常规图表

行1:hue 是类别映射,通常如果有一个列数据是文本,就可以映射上去。这里把数据中的"type"字段映射

图表成这样子:

Python数据可视化,seaborn如何做出非常规图表

显然没有标记出最大值的柱子

同时也提示执行有错误

如果我们查看图表的容器就能看出关键:

Python数据可视化,seaborn如何做出非常规图表

原来,seaborn 柱子分成2组。这是非常合理的

但数据范围索引,却是在整个数据共27行中查找

显然,我们需要是2组的范围索引:

Python数据可视化,seaborn如何做出非常规图表

语义非常清晰直白

但是,怎么准确从图表容器中找到需要的 BarContainer:

Python数据可视化,seaborn如何做出非常规图表

行7与行12:里面的 0 和 1 都是猜测的

原来,seaborn 在生成这些容器时,给容器的 label 属性写入了对应的数据值(就是我们数据的"type"字段):

Python数据可视化,seaborn如何做出非常规图表

注意,你不能使用 key 索引方式获取,比如写: axcontainers['修改'] ,这会报错

万事俱备,定义如下函数:

Python数据可视化,seaborn如何做出非常规图表

现在调用变得非常简单:

Python数据可视化,seaborn如何做出非常规图表

图表成这样子:

Python数据可视化,seaborn如何做出非常规图表

接下来我会继续编写更多非常规要求的图表,敬请关注!