enrichment_plot: 创建累积计数的富集图

一个绘制累积计数阶梯图的函数。

from mlxtend.general import enrichment_plot

概述

在富集图中,y轴可以解释为“小于或等于对应的 x 轴标签的样本数量”。

参考资料

  • -

示例 1 - 来自 Pandas DataFrames 的富集图

import pandas as pd


s1 = [1.1, 1.5]
s2 = [2.1, 1.8]
s3 = [3.1, 2.1]
s4 = [3.9, 2.5]
data = [s1, s2, s3, s4]
df = pd.DataFrame(data, columns=['X1', 'X2'])
df
X1 X2
0 1.1 1.5
1 2.1 1.8
2 3.1 2.1
3 3.9 2.5

绘制数据,其中类别由标签列 label_col 中的唯一值确定。xy 值就是我们想要绘制的 DataFrame 的列名。

import matplotlib.pyplot as plt
from mlxtend.plotting import enrichment_plot

ax = enrichment_plot(df, legend_loc='upper left')

png

API

enrichment_plot(df, colors='bgrkcy', markers=' ', linestyles='-', alpha=0.5, lw=2, where='post', grid=True, count_label='Count', xlim='auto', ylim='auto', invert_axes=False, legend_loc='best', ax=None)

绘制堆叠条形图

参数

  • df : pandas.DataFrame

    一个 pandas DataFrame,其中列代表不同的类别。 colors: str (默认值: 'bgrcky') 条形的颜色。

  • markers : str (默认值: ' ')

    Matplotlib 标记样式,例如 'sov' 分别代表方形、圆形和三角形标记。

  • linestyles : str (默认值: '-')

    Matplotlib 线条样式,例如 '-,--' 循环使用实线和虚线。请注意,不同的线条样式需要用逗号分隔。

  • alpha : float (默认值: 0.5)

    透明度级别,范围从 0.0 到 1.0。

  • lw : int or float (默认值: 2)

    线宽参数。

  • where : {'post', 'pre', 'mid'} (默认值: 'post')

    阶梯的起始位置。

  • grid : bool (默认值: True)

    如果为 True,则绘制网格。

  • count_label : str (默认值: 'Count')

    "Count" 轴的标签。

  • xlim : 'auto' 或 array-like [min, max] (默认值: 'auto')

    x 轴范围的最小和最大位置。

  • ylim : 'auto' 或 array-like [min, max] (默认值: 'auto')

    y 轴范围的最小和最大位置。

  • invert_axes : bool (默认值: False)

    如果为 True,则将计数绘制在 x 轴上。

  • legend_loc : str (默认值: 'best')

    图例位置 {最佳, 左上, 右上, 左下, 右下} 如果 legend_loc=False 则不显示图例

  • ax : matplotlib 轴, 可选 (默认值: None)

    使用此轴进行绘图,否则创建新轴

返回值

  • ax : matplotlib 轴

示例

有关用法示例,请参阅 https://mlxtend.cn/mlxtend/user_guide/plotting/enrichment_plot/