python 汉字按拼音排序,
原理很简单,就是根据汉字拼音字典,将汉字转为拼音,然后sort一下就好了,不过对于多音字倒是没有办法了。
#encoding:utf-8 import re def sort_pinyin (names): '''pinyin.txt: 吖 a1 阿 a1 啊 a1 锕 a1 錒 a1 嗄 a2 厑 aes ''' pinyin = file('pinyin.txt').read().decode('utf-8').split('\n') pinyin_dict = {} for line in pinyin: if not line.strip(): continue tmp = line.split('\t') pinyin_dict[tmp[0].strip()] = re.sub(r'\d*','',tmp[1].strip()) names_sort = sorted (names, key=lambda x:''.join([pinyin_dict.get(i) for i in x])) return names_sort if __name__ == "__main__": x = u'广州, 深圳, 北京, 长沙, 上海, 武汉, 成都, 南京, 重庆, 济南, 南宁, 西安, 天津, 合肥, 东莞, 厦门, 昆明, 岳阳, 海口, 长春, 徐州, 德阳, 南昌, 沈阳, 太原, 兰州, 太仓, 杭州, 芜湖, 佛山, 肇庆, 福州, 安顺, 大连, 扬州, 北海, 乌鲁木齐, 青岛, 贵阳' x = x.split(', ') x2 = sort_pinyin(x) for i in x: print i, print '\n------------' for i in x2: print i, '''oupput 安顺 北海 北京 长春 长沙 成都 大连 德阳 东莞 佛山 福州 广州 贵阳 海口 杭州 合肥 济南 昆明 兰州 南昌 南京 南宁 青岛 厦门 上海 深圳 沈阳 太仓 太原 天津 乌鲁木齐 芜湖 武汉 西安 徐州 扬州 岳阳 肇庆 重庆 '''
相关推荐
Python 如何按照拼音顺序对中文汉字进行排序 Python源码Python 如何按照拼音顺序对中文汉字进行排序 Python源码Python 如何按照拼音顺序对中文汉字进行排序 Python源码Python 如何按照拼音顺序对中文汉字进行排序 ...
看了网友写的基于Python2中文排序,将其改成Python3的,希望对大家有用。
将汉字转为拼音。可以用于汉字注音、排序、检索
中文通常有拼音和笔画两种排序方式,在最常用中文标准字符集GB2312中,3755个一级中文汉字是按照拼音序进行编码的,而3008个二级汉字则是按部首笔画排列, >> print '曙'< '鲑','曾'<'怡' True True 出现...
Python代码源码-实操案例-框架案例-如何按照拼音顺序对中文汉字进行排序.zip
将汉字转为拼音。可以用于汉字注音、排序、检索
按value排序,汉字次序不是按拼音输出 sorted并不改变字典本身的数据次序。 输出后为列表和元组 可以 A = sorted(mydict.items(),key = lambda mydict:mydict[1],reverse= False) 赋值给A ,A的次序
按拼音和笔顺精确、快速排序大量简体中文词组(支持百万数量级,简体中文与非中文混用的词组也可),有效解决多音字混排的问题。 依赖 运行python版本: 3.6+ 本项目涉及以下依赖: jieba pypinyin 安装 pip安装命令...
汉字转拼音 qqAuto 自动发送qq消息 scrapyDemo 获取天气情况的爬虫 simpleProject game2048 2048 pictureCharacterDraw 图片根据灰度转字符画 Sorting_Visualization 各种排序 translate 调用有道词典接口进行自动...
可以用作汉字注音,排序,检索。 注:这个版本同时支持在Node和Web浏览器环境运行, Python版请关注 特性 根据词组智能匹配最正确的拼音。 支持多音字。 简单的繁体支持。 支持多种不同拼音风格。 安装 通过npm: ...
mandarin.dat 文件中,记录了汉字的十六进制和拼音及音调,所以无此文件就无法翻译出来汉字的拼音(本次主要使用拼音来解决汉字排序的问题)。 找到编辑此文件【C:\ProgramData\Anaconda3\Lib\site-packages\...
hanzi_sort_by_pinyin.py 提取文本中的汉字,按拼音和声调排序hanzi_permutationsper.py 组合hanzi_sort_by_pinyin.py结果
窗口设计完后按F5调试程序,窗口出现的时候代码也就自动生成好了,直接去Python里粘贴即可调试 Python模块EP.py 已封装200+常用命令 函数命名跟各种操作已尽量仿照精易模块 ,用起来还是熟悉的味道。 模块内已有函数...