wine_data:用于分类的三类别葡萄酒数据集

一个将 Wine 数据集加载到 NumPy 数组的函数。

from mlxtend.data import wine_data

概述

用于分类的葡萄酒数据集。

样本 178
特征 13
类别 3
数据集特点 多元
属性特点 整数,实数
相关任务 分类
缺失值
属性
1) 类别标签
2) 酒精
3) 苹果酸
4)
5) 灰分碱度
6)
7) 总酚
8) 类黄酮
9) 非类黄酮酚
10) 原花青素
11) 颜色强度
12) 色调
13) 稀释葡萄酒的 OD280/OD315
14) 脯氨酸
类别 样本
0 59
1 71
2 48

参考文献

  • Forina, M. et al, PARVUS - An Extendible Package for Data Exploration, Classification and Correlation. Institute of Pharmaceutical and Food Analysis and Technologies, Via Brigata Salerno, 16147 Genoa, Italy.
  • 来源:https://archive.ics.uci.edu/ml/datasets/Wine
  • Bache, K. & Lichman, M. (2013). UCI Machine Learning Repository. Irvine, CA: University of California, School of Information and Computer Science.

示例 1 - 数据集概述

from mlxtend.data import wine_data
X, y = wine_data()

print('Dimensions: %s x %s' % (X.shape[0], X.shape[1]))
print('\nHeader: %s' % ['alcohol', 'malic acid', 'ash', 'ash alcalinity',
                        'magnesium', 'total phenols', 'flavanoids',
                        'nonflavanoid phenols', 'proanthocyanins',
                        'color intensity', 'hue', 'OD280/OD315 of diluted wines',
                        'proline'])
print('1st row', X[0])
Dimensions: 178 x 13

Header: ['alcohol', 'malic acid', 'ash', 'ash alcalinity', 'magnesium', 'total phenols', 'flavanoids', 'nonflavanoid phenols', 'proanthocyanins', 'color intensity', 'hue', 'OD280/OD315 of diluted wines', 'proline']
1st row [  1.42300000e+01   1.71000000e+00   2.43000000e+00   1.56000000e+01
   1.27000000e+02   2.80000000e+00   3.06000000e+00   2.80000000e-01
   2.29000000e+00   5.64000000e+00   1.04000000e+00   3.92000000e+00
   1.06500000e+03]
import numpy as np
print('Classes: %s' % np.unique(y))
print('Class distribution: %s' % np.bincount(y))
Classes: [0 1 2]
Class distribution: [59 71 48]

API

wine_data()

葡萄酒数据集。

  • 来源:https://archive.ics.uci.edu/ml/datasets/Wine

  • 样本数量 : 178

  • 类别标签:{0, 1, 2},分布:[59, 71, 48]

    数据集属性

    • 1) 酒精
    • 2) 苹果酸
    • 3) 灰
    • 4) 灰分碱度
    • 5) 镁
    • 6) 总酚
    • 7) 类黄酮
    • 8) 非类黄酮酚
    • 9) 原花青素
    • 10) 颜色强度
    • 11) 色调
    • 12) 稀释葡萄酒的 OD280/OD315
    • 13) 脯氨酸

返回值

  • X, y:[样本数, 特征数], [类别标签数]

    X 是特征矩阵,包含 178 个葡萄酒样本(行)和 13 个特征(列)。y 是一个包含 3 个类别标签 0、1、2 的一维数组。

示例

有关用法示例,请参阅 https://mlxtend.cn/mlxtend/user_guide/data/wine_data