やじうまWatch
地味に便利、日本人のフルネームを姓と名に分割するツールのPythonパッケージ公開
2020年11月18日 06:00
日本人のフルネームを読み込ませることで姓と名に分割するPythonパッケージがGitHubで公開された。
これはRei Sakamoto(@rskmoi)さんが作成したもので、自身の手による姓名分割ツール「NameDivider」のPythonパッケージ。漢字の統計情報をもとに特徴量を作ってルールベースで処理する仕組みで、姓と名の間にスペースが入っていない日本人のフルネームを読み込ませることで、99%という高い精度で姓名を分割できる。日本人の姓名の分割はもともと難易度が高く、自力での分割にチャレンジしたがうまくいかなかったという報告や、実用的なツールを求める書き込みもネットでは散見される。今回のツールはそうしたニーズに応えるものと言えそうだ。ちなみに利用マニュアルは、今回のPythonパッケージではない従来版に対して用意されているので、何ができるかを知りたい人はそちらを参照されたい。
- rskmoi/namedivider-python(GitHub)
https://github.com/rskmoi/namedivider-python - rskmoi/NameDivider(GitHub)
https://github.com/rskmoi/NameDivider - 姓名分割プログラムをつくる-NameDivider利用マニュアル(生き抜くぜ21世紀)
https://rskmoi.hatenablog.com/entry/2017/03/20/233058 - 告知ツイート(Twitter)
https://twitter.com/rskmoi/status/1327913822011572225