MeanCenterer: 对 NumPy 数组进行基于列的均值中心化

一个在 NumPy 数组上执行基于列的均值中心化的转换器对象。

from mlxtend.preprocessing import MeanCenterer

示例 1 - NumPy 数组中心化

使用 fit 方法拟合数据集(例如训练数据集)的列均值到新的 MeanCenterer 对象。然后,在同一数据集上调用 transform 方法,以样本均值对其进行中心化。

import numpy as np
from mlxtend.preprocessing import MeanCenterer
X_train = np.array(
                   [[1, 2, 3],
                    [4, 5, 6],
                    [7, 8, 9]])
mc = MeanCenterer().fit(X_train)
mc.transform(X_train)
array([[-3., -3., -3.],
       [ 0.,  0.,  0.],
       [ 3.,  3.,  3.]])

API

MeanCenterer()

向量和矩阵的列中心化。

属性

  • col_means : numpy.ndarray [n_columns]

    拟合 MeanCenterer 对象后,存储用于中心化的均值的 NumPy 数组。

示例

有关使用示例,请参阅 https://mlxtend.cn/mlxtend/user_guide/preprocessing/MeanCenterer/

方法


fit(X)

获取用于均值中心化的列均值。

参数

  • X : {类数组对象, 稀疏矩阵}, shape = [n_samples, n_features]

    数据向量数组,其中 n_samples 是样本数,n_features 是特征数。

返回值

self


fit_transform(X)

拟合并转换数组。

参数

  • X : {类数组对象, 稀疏矩阵}, shape = [n_samples, n_features]

    数据向量数组,其中 n_samples 是样本数,n_features 是特征数。

返回值

  • X_tr : {类数组对象, 稀疏矩阵}, shape = [n_samples, n_features]

    输入数组的副本,其中列已中心化。


transform(X)

中心化 NumPy 数组。

参数

  • X : {类数组对象, 稀疏矩阵}, shape = [n_samples, n_features]

    数据向量数组,其中 n_samples 是样本数,n_features 是特征数。

返回值

  • X_tr : {类数组对象, 稀疏矩阵}, shape = [n_samples, n_features]

    输入数组的副本,其中列已中心化。

ython