Rapidminer Onomastics Extension:从人名中提取性别和出身-开源

时间:2024-06-01 08:31:00
【文件属性】:

文件名称:Rapidminer Onomastics Extension:从人名中提取性别和出身-开源

文件大小:7.54MB

文件格式:JAR

更新时间:2024-06-01 08:31:00

开源软件

猜测姓名的性别并不像看上去那么简单:-Andrea在意大利是男名字,在美国是女名字。 劳伦斯(Laurence)是法国的女性名字,在英国或美国则是男性名字-人口统计学的演变,有些名字是无性别的-用中文或韩文,猜测拉丁字母中的性别几乎是不可能的,即使使用原始文字,这也确实很困难-在大多数文化中,性别都以名字“编码”,在其他文化中,性别也以姓氏编码(例如,斯拉夫语名称,立陶宛语...),因此即使您有性别,也可以猜测性别只是名字的首字母(例如,O。Sokolova最有可能是斯拉夫名字和女性名字)-一些名字非常稀有或只是“虚构”,但是,因为它们听起来像是男性名字或女性名字,所以它们的性别在相同的文化/民族中被人们准确地感知到。 NamSor API的目标是隐藏这种复杂性,提供一个简单的界面来推断性别和出身,并返回最佳结果。


网友评论