中文人名语料库(Chinese-Names-Corpus) 120万常见中文人名,删除了部分名人的姓名。 25万古代中文人名,删除了罕见姓氏、和带生僻字的姓名。 1万日本常见人名,数据来源于网络。 2万英文常见姓或名,数据来源于网络。 1千个中文姓氏,删除了部分罕见姓氏,复姓仅保留了“欧阳”。 5千称呼词根,18万中文称呼,删除了部分带贬义的称呼。 48万翻译人名,含有部分西化中文人名,如“李伯恩”。 删除了1000余非人名。 -2017.08.08 @思南斋 整理 2017.08.08