matplotlib bar()实现多组数据并列柱状图通用简便创建方法

时间:2022-10-14 11:59:11

在使用柱状图时,经常遇到需要多组数据进行比较的情况。
绘制单个数据系列的柱形图比较简单,多组数据柱状图绘制的关键有三点:

  • 多次调用bar()函数即可在同一子图中绘制多组柱形图。
  • 为了防止柱子重叠,每个柱子在x轴上的位置需要依次递增,如果柱子紧挨,这个距离即柱子宽度。
  • 为了使刻度标签居中,需要调整x轴刻度标签的位置。

由上述可知,多组数据并列柱状图需要计算柱子x轴上的位置和x轴刻度标签。
因此,有两种实现方案:

  • x轴刻度标签位置固定,根据x轴刻度计算每个柱子的宽度
  • 每个柱子的宽度固定,计算x轴刻度标签位置,使之居中

下面使用第一种方法演示两组数据、三组数据、四组数据的并列柱状图。
使用方法一、方法二演示通用多组并列柱状图的创建方法。

两组数据、三组数据、四组数据的并列柱状图

matplotlib bar()实现多组数据并列柱状图通用简便创建方法

  1. import matplotlib
  2. import matplotlib.pyplot as plt
  3. import numpy as np
  4.  
  5. plt.figure(figsize=(13, 4))
  6. # 构造x轴刻度标签、数据
  7. labels = ['G1', 'G2', 'G3', 'G4', 'G5']
  8. first = [20, 34, 30, 35, 27]
  9. second = [25, 32, 34, 20, 25]
  10. third = [21, 31, 37, 21, 28]
  11. fourth = [26, 31, 35, 27, 21]
  12.  
  13. # 两组数据
  14. plt.subplot(131)
  15. x = np.arange(len(labels)) # x轴刻度标签位置
  16. width = 0.25 # 柱子的宽度
  17. # 计算每个柱子在x轴上的位置,保证x轴刻度标签居中
  18. # x - width/2,x + width/2即每组数据在x轴上的位置
  19. plt.bar(x - width/2, first, width, label='1')
  20. plt.bar(x + width/2, second, width, label='2')
  21. plt.ylabel('Scores')
  22. plt.title('2 datasets')
  23. # x轴刻度标签位置不进行计算
  24. plt.xticks(x, labels=labels)
  25. plt.legend()
  26. # 三组数据
  27. plt.subplot(132)
  28. x = np.arange(len(labels)) # x轴刻度标签位置
  29. width = 0.25 # 柱子的宽度
  30. # 计算每个柱子在x轴上的位置,保证x轴刻度标签居中
  31. # x - width,x, x + width即每组数据在x轴上的位置
  32. plt.bar(x - width, first, width, label='1')
  33. plt.bar(x, second, width, label='2')
  34. plt.bar(x + width, third, width, label='3')
  35. plt.ylabel('Scores')
  36. plt.title('3 datasets')
  37. # x轴刻度标签位置不进行计算
  38. plt.xticks(x, labels=labels)
  39. plt.legend()
  40. # 四组数据
  41. plt.subplot(133)
  42. x = np.arange(len(labels)) # x轴刻度标签位置
  43. width = 0.2 # 柱子的宽度
  44. # 计算每个柱子在x轴上的位置,保证x轴刻度标签居中
  45. plt.bar(x - 1.5*width, first, width, label='1')
  46. plt.bar(x - 0.5*width, second, width, label='2')
  47. plt.bar(x + 0.5*width, third, width, label='3')
  48. plt.bar(x + 1.5*width, fourth, width, label='4')
  49. plt.ylabel('Scores')
  50. plt.title('4 datasets')
  51. # x轴刻度标签位置不进行计算
  52. plt.xticks(x, labels=labels)
  53. plt.legend()
  54.  
  55. plt.show()

通用多组并列柱状图的简便创建方法

上面的示例比较简易,有一些问题没有考虑。为了便于重复使用,下面的通用方法可调整x轴标签刻度步长、每组柱子的总宽度、每组柱子之间的间隙、组与组之间的间隙。

matplotlib bar()实现多组数据并列柱状图通用简便创建方法

方法一

  1. import matplotlib
  2. import matplotlib.pyplot as plt
  3. import numpy as np
  4.  
  5. label = ['G1', 'G2', 'G3', 'G4', 'G5']
  6. first = [20, 34, 30, 35, 27]
  7. second = [25, 32, 34, 20, 25]
  8. third = [21, 31, 37, 21, 28]
  9. fourth = [26, 31, 35, 27, 21]
  10. data = [first, second, third, fourth]
  11.  
  12. def create_multi_bars(labels, datas, tick_step=1, group_gap=0.2, bar_gap=0):
  13. '''
  14. labels : x轴坐标标签序列
  15. datas :数据集,二维列表,要求列表每个元素的长度必须与labels的长度一致
  16. tick_step :默认x轴刻度步长为1,通过tick_step可调整x轴刻度步长。
  17. group_gap : 柱子组与组之间的间隙,最好为正值,否则组与组之间重叠
  18. bar_gap :每组柱子之间的空隙,默认为0,每组柱子紧挨,正值每组柱子之间有间隙,负值每组柱子之间重叠
  19. '''
  20. # ticks为x轴刻度
  21. ticks = np.arange(len(labels)) * tick_step
  22. # group_num为数据的组数,即每组柱子的柱子个数
  23. group_num = len(datas)
  24. # group_width为每组柱子的总宽度,group_gap 为柱子组与组之间的间隙。
  25. group_width = tick_step - group_gap
  26. # bar_span为每组柱子之间在x轴上的距离,即柱子宽度和间隙的总和
  27. bar_span = group_width / group_num
  28. # bar_width为每个柱子的实际宽度
  29. bar_width = bar_span - bar_gap
  30. # baseline_x为每组柱子第一个柱子的基准x轴位置,随后的柱子依次递增bar_span即可
  31. baseline_x = ticks - (group_width - bar_span) / 2
  32. for index, y in enumerate(datas):
  33. plt.bar(baseline_x + index*bar_span, y, bar_width)
  34. plt.ylabel('Scores')
  35. plt.title('multi datasets')
  36. # x轴刻度标签位置与x轴刻度一致
  37. plt.xticks(ticks, labels)
  38. plt.show()
  39.  
  40. create_multi_bars(label, data, bar_gap=0.1)

方法二

  1. import matplotlib
  2. import matplotlib.pyplot as plt
  3. import numpy as np
  4.  
  5. label = ['G1', 'G2', 'G3', 'G4', 'G5']
  6. first = [20, 34, 30, 35, 27]
  7. second = [25, 32, 34, 20, 25]
  8. third = [21, 31, 37, 21, 28]
  9. fourth = [26, 31, 35, 27, 21]
  10. data = [first, second, third, fourth]
  11.  
  12. def create_multi_bars(labels, datas, tick_step=1, group_gap=0.2, bar_gap=0):
  13. '''
  14. labels : x轴坐标标签序列
  15. datas :数据集,二维列表,要求列表每个元素的长度必须与labels的长度一致
  16. tick_step :默认x轴刻度步长为1,通过tick_step可调整x轴刻度步长。
  17. group_gap : 柱子组与组之间的间隙,最好为正值,否则组与组之间重叠
  18. bar_gap :每组柱子之间的空隙,默认为0,每组柱子紧挨,正值每组柱子之间有间隙,负值每组柱子之间重叠
  19. '''
  20. # x为每组柱子x轴的基准位置
  21. x = np.arange(len(labels)) * tick_step
  22. # group_num为数据的组数,即每组柱子的柱子个数
  23. group_num = len(datas)
  24. # group_width为每组柱子的总宽度,group_gap 为柱子组与组之间的间隙。
  25. group_width = tick_step - group_gap
  26. # bar_span为每组柱子之间在x轴上的距离,即柱子宽度和间隙的总和
  27. bar_span = group_width / group_num
  28. # bar_width为每个柱子的实际宽度
  29. bar_width = bar_span - bar_gap
  30. # 绘制柱子
  31. for index, y in enumerate(datas):
  32. plt.bar(x + index*bar_span, y, bar_width)
  33. plt.ylabel('Scores')
  34. plt.title('multi datasets')
  35. # ticks为新x轴刻度标签位置,即每组柱子x轴上的中心位置
  36. ticks = x + (group_width - bar_span) / 2
  37. plt.xticks(ticks, labels)
  38. plt.show()
  39.  
  40. create_multi_bars(label, data[:3], bar_gap=0.1)

原文链接:https://blog.csdn.net/mighty13/article/details/113873617