generalize_names:将名字转换为通用格式

一个将名字转换为通用格式 <last_name><separator><firstname letter(s)> (all lowercase) 的函数。

from mlxtend.text import generalize_names

概述

一个将名字转换为通用格式 <last_name><separator><firstname letter(s)> (all lowercase) 的函数,这对于从不同来源收集的数据,并需要基于名字标识符进行比较或合并的情况非常有用。例如,如果名字存储在 pandas DataFrame 列中,可以使用 apply 函数来通用化名字:df['name'] = df['name'].apply(generalize_names)

参考

  • -

示例 1 - 默认值

from mlxtend.text import generalize_names
generalize_names('Pozo, José Ángel')
'pozo j'
generalize_names('José Pozo')
'pozo j'
generalize_names('José Ángel Pozo')
'pozo j'

示例 2 - 可选参数

from mlxtend.text import generalize_names
generalize_names("Eto'o, Samuel", firstname_output_letters=2)
'etoo sa'
generalize_names("Eto'o, Samuel", firstname_output_letters=0)
'etoo'
generalize_names("Eto'o, Samuel", output_sep=', ')
'etoo, s'

API

generalize_names(name, output_sep=' ', firstname_output_letters=1)

通用化个人的姓和名。

返回一个通用化格式 <last_name><separator><firstname letter(s)> (all lowercase) 的个人名字

参数

  • name : str

    名字

  • output_sep : str (默认值: ' ')

    用于在输出中分隔姓和名的字符串。

  • firstname_output_letters : int

    缩写名字中的字母数量。

返回值

  • gen_name : str

    通用化后的名字。

示例

有关使用示例,请参阅 https://mlxtend.cn/mlxtend/user_guide/text/generalize_names/