generalize_names:将名字转换为通用格式
一个将名字转换为通用格式 <last_name><separator><firstname letter(s)> (all lowercase)
的函数。
from mlxtend.text import generalize_names
概述
一个将名字转换为通用格式 <last_name><separator><firstname letter(s)> (all lowercase)
的函数,这对于从不同来源收集的数据,并需要基于名字标识符进行比较或合并的情况非常有用。例如,如果名字存储在 pandas DataFrame
列中,可以使用 apply 函数来通用化名字:df['name'] = df['name'].apply(generalize_names)
参考
- -
示例 1 - 默认值
from mlxtend.text import generalize_names
generalize_names('Pozo, José Ángel')
'pozo j'
generalize_names('José Pozo')
'pozo j'
generalize_names('José Ángel Pozo')
'pozo j'
示例 2 - 可选参数
from mlxtend.text import generalize_names
generalize_names("Eto'o, Samuel", firstname_output_letters=2)
'etoo sa'
generalize_names("Eto'o, Samuel", firstname_output_letters=0)
'etoo'
generalize_names("Eto'o, Samuel", output_sep=', ')
'etoo, s'
API
generalize_names(name, output_sep=' ', firstname_output_letters=1)
通用化个人的姓和名。
返回一个通用化格式 <last_name><separator><firstname letter(s)> (all lowercase)
的个人名字
参数
-
name
:str
名字
-
output_sep
:str
(默认值: ' ')用于在输出中分隔姓和名的字符串。
-
firstname_output_letters
:int
缩写名字中的字母数量。
返回值
-
gen_name
:str
通用化后的名字。
示例
有关使用示例,请参阅 https://mlxtend.cn/mlxtend/user_guide/text/generalize_names/