MeanCenterer: 对 NumPy 数组进行基于列的均值中心化
一个在 NumPy 数组上执行基于列的均值中心化的转换器对象。
from mlxtend.preprocessing import MeanCenterer
示例 1 - NumPy 数组中心化
使用 fit
方法拟合数据集(例如训练数据集)的列均值到新的 MeanCenterer
对象。然后,在同一数据集上调用 transform
方法,以样本均值对其进行中心化。
import numpy as np
from mlxtend.preprocessing import MeanCenterer
X_train = np.array(
[[1, 2, 3],
[4, 5, 6],
[7, 8, 9]])
mc = MeanCenterer().fit(X_train)
mc.transform(X_train)
array([[-3., -3., -3.],
[ 0., 0., 0.],
[ 3., 3., 3.]])
API
MeanCenterer()
向量和矩阵的列中心化。
属性
-
col_means
: numpy.ndarray [n_columns]拟合 MeanCenterer 对象后,存储用于中心化的均值的 NumPy 数组。
示例
有关使用示例,请参阅 https://mlxtend.cn/mlxtend/user_guide/preprocessing/MeanCenterer/
方法
fit(X)
获取用于均值中心化的列均值。
参数
-
X
: {类数组对象, 稀疏矩阵}, shape = [n_samples, n_features]数据向量数组,其中 n_samples 是样本数,n_features 是特征数。
返回值
self
fit_transform(X)
拟合并转换数组。
参数
-
X
: {类数组对象, 稀疏矩阵}, shape = [n_samples, n_features]数据向量数组,其中 n_samples 是样本数,n_features 是特征数。
返回值
-
X_tr
: {类数组对象, 稀疏矩阵}, shape = [n_samples, n_features]输入数组的副本,其中列已中心化。
transform(X)
中心化 NumPy 数组。
参数
-
X
: {类数组对象, 稀疏矩阵}, shape = [n_samples, n_features]数据向量数组,其中 n_samples 是样本数,n_features 是特征数。
返回值
-
X_tr
: {类数组对象, 稀疏矩阵}, shape = [n_samples, n_features]输入数组的副本,其中列已中心化。
ython