有时在处理文件时候,我们需要将中文姓名转换为拼音,或者是转换为拼音首字母,本文将介绍三种 Python 实现的方法,最后给一个批量操作的代码案例!
一、xpinyin
开门见山,Python 中文字转拼音可以使用 xpinyin
,直接使用 pip安装即可👇
pip install xpinyin -i http://pypi.douban.com/simple --trusted-host pypi.douban.com
接着导入 xpinyin 下的 Pinyin 方法如下
from xpinyin import Pinyin
首先试试中文名转拼音
p = Pinyin()
result1 = p.get_pinyin('叶伏天')
result1
结果如下:
'ye-fu-tian'
tone_marks
可以显示声调
result2 = p.get_pinyin('叶伏天', tone_marks='marks')
结果如下:
'yè-fú-tiān'
去掉空格👇
s = result1.split('-')
result3 = s[0].capitalize() + ' ' + ''.join(s[1:]).capitalize()
result3
结果如下:
'Ye Futian'
有时需要中文名转拼音首字母,也很简单👇
二、pypinyin
另一种方法是使用 pypinyin
,安装同样可以使用 pip
# 安装
pip install pypinyin -i http://pypi.douban.com/simple --trusted-host pypi.douban.com
直接导入就行👇
import pypinyin
再来看看中文名转拼音的实现办法
result1 = pypinyin.pinyin('叶庭云', style=pypinyin.NORMAL)
result1
结果如下:
[['ye'], ['ting'], ['yun']]
启用多音节来实现声调
result2 = pypinyin.pinyin('叶庭云', heteronym=True)
result2
结果如下:
[['yè', 'xié'], ['tíng'], ['yún']]
因为返回的是一个嵌套的 list,所以需要简单调整一下
result_ = [i[0] for i in result1]
result3 = result_[0].capitalize() + ' ' + ''.join(result_[1:]).capitalize()
result3
结果如下:
'Ye Tingyun'
启用多音字模式时,竟然发现 ‘叶’ 也是多音字,查询了资料发现确实是这样,涨知识啦!
下面是中文名转拼音首字母的方法
三、snownlp
最后一种办法是使用 snownlp
,同样的 pip 安装与导入如下:
# 安装
pip install snownlp -i http://pypi.douban.com/simple --trusted-host pypi.douban.com
# 导入
from snownlp import SnowNLP
中文名转拼音👇
s = SnowNLP('叶庭云')
s.pinyin
结果如下:
['ye', 'ting', 'yun']
将list转为字符串
result4 = s.pinyin[0].capitalize() + ' ' + ''.join(s.pinyin[1:]).capitalize()
result4
结果如下:
'Ye Tingyun'
最后是中文名转拼音首字母
四、批量将中文名转换成拼音
现在,掌握了基本使用后,我们就能利用批量操作来解放双手
import pypinyin
import pandas as pd
df = pd.read_excel('学生名单_test.xls')
df.head()
先导入一份学生名单如下
下面是使用 pypinyin
批量将全部学生的中文姓名转换为拼音
pinyin_name = []
first_pinyin = []
for i in df['姓名']:
result = pypinyin.pinyin(i, style=pypinyin.NORMAL)
result_ = [i[0] for i in result]
result2 = result_[0].capitalize() + ' ' + ''.join(result_[1:]).capitalize()
result3 = ''.join([i[0].upper() for i in result_])
print(result2, i, sep=' ')
pinyin_name.append(result2)
first_pinyin.append(result3)
df['英文名'] = pinyin_name
df['拼音首字母'] = first_pinyin
df.head()
或者是转换为拼音首字母,运行结果如下:
摘录自作者:叶庭云
CSDN:https://yetingyun.blog.csdn.net/
新车新盘 嘎嘎稳 嘎嘎靠谱coinsrore.com
新车首发,新的一年,只带想赚米的人coinsrore.com
新盘 上车集合 留下 我要发发 立马进裙coinsrore.com
做了几十年的项目 我总结了最好的一个盘(纯干货)coinsrore.com
新车上路,只带前10个人coinsrore.com
新盘首开 新盘首开 征召客户!!!coinsrore.com
新项目准备上线,寻找志同道合 的合作伙伴coinsrore.com
新车即将上线 真正的项目,期待你的参与coinsrore.com
新盘新项目,不再等待,现在就是最佳上车机会!coinsrore.com
新盘新盘 这个月刚上新盘 新车第一个吃螃蟹!coinsrore.com
新车新盘 嘎嘎稳 嘎嘎靠谱coinsrore.com
新车首发,新的一年,只带想赚米的人coinsrore.com
新盘 上车集合 留下 我要发发 立马进裙coinsrore.com
做了几十年的项目 我总结了最好的一个盘(纯干货)coinsrore.com
新车上路,只带前10个人coinsrore.com
新盘首开 新盘首开 征召客户!!!coinsrore.com
新项目准备上线,寻找志同道合 的合作伙伴coinsrore.com
新车即将上线 真正的项目,期待你的参与coinsrore.com
新盘新项目,不再等待,现在就是最佳上车机会!coinsrore.com
新盘新盘 这个月刚上新盘 新车第一个吃螃蟹!coinsrore.com
新车新盘 嘎嘎稳 嘎嘎靠谱coinsrore.com
新车首发,新的一年,只带想赚米的人coinsrore.com
新盘 上车集合 留下 我要发发 立马进裙coinsrore.com
做了几十年的项目 我总结了最好的一个盘(纯干货)coinsrore.com
新车上路,只带前10个人coinsrore.com
新盘首开 新盘首开 征召客户!!!coinsrore.com
新项目准备上线,寻找志同道合 的合作伙伴coinsrore.com
新车即将上线 真正的项目,期待你的参与coinsrore.com
新盘新项目,不再等待,现在就是最佳上车机会!coinsrore.com
新盘新盘 这个月刚上新盘 新车第一个吃螃蟹!coinsrore.com
新车新盘 嘎嘎稳 嘎嘎靠谱coinsrore.com
新车首发,新的一年,只带想赚米的人coinsrore.com
新盘 上车集合 留下 我要发发 立马进裙coinsrore.com
做了几十年的项目 我总结了最好的一个盘(纯干货)coinsrore.com
新车上路,只带前10个人coinsrore.com
新盘首开 新盘首开 征召客户!!!coinsrore.com
新项目准备上线,寻找志同道合 的合作伙伴coinsrore.com
新车即将上线 真正的项目,期待你的参与coinsrore.com
新盘新项目,不再等待,现在就是最佳上车机会!coinsrore.com
新盘新盘 这个月刚上新盘 新车第一个吃螃蟹!coinsrore.com