大数据人|大数据第一社区

 找回密码
 注册会员

扫一扫,访问微社区

查看: 588|回复: 0
打印 上一主题 下一主题

汉语言处理工具pyhanlp的简繁转换

[复制链接]
  • TA的每日心情

    2018-9-28 11:05
  • 签到天数: 1 天

    [LV.1]初来乍到

    109

    主题

    109

    帖子

    570

    积分

    高级会员

    Rank: 4

    积分
    570
    跳转到指定楼层
    楼主
    发表于 2019-3-29 10:31:57 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
    繁简转换
    HanLP几乎实现了所有我们需要的繁简转换方式,并且已经封装到了HanLP中,使得我们可以轻松的使用,而分词器中已经默认支持多种繁简格式或者混合。这里我们不再做过多描述。
    说明
    ·HanLP能够识别简繁分歧词,比如打印机=印表機。许多简繁转换工具不能区分“以后”“皇后”中的两个“后”字,HanLP可以。
    算法详解
    ·《汉字转拼音与简繁转换的Java实现》——请查阅此文
    1. from pyhanlp import *
    2. # 繁简转化
    3. print(HanLP.convertToTraditionalChinese("“以后等你当上皇后,就能买草莓庆祝了”。发现一根白头发"))
    4. print(HanLP.convertToSimplifiedChinese("憑藉筆記簿型電腦寫程式HanLP"))
    5. # 简体转台湾繁体
    6. print(HanLP.s2tw("hankcs在台湾写代码"))
    7. # 台湾繁体转简体
    8. print(HanLP.tw2s("hankcs在臺灣寫程式碼"))
    9. # 简体转香港繁体
    10. print(HanLP.s2hk("hankcs在香港写代码"))
    11. # 香港繁体转简体
    12. print(HanLP.hk2s("hankcs在香港寫代碼"))
    13. # 香港繁体转台湾繁体
    14. print(HanLP.hk2tw("hankcs在臺灣寫代碼"))
    15. # 台湾繁体转香港繁体
    16. print(HanLP.tw2hk("hankcs在香港寫程式碼"))
    17.
    18.# 香港/台湾繁体和HanLP标准繁体的互转
    19.print(HanLP.t2tw("hankcs在臺灣寫代碼"))
    20.print(HanLP.t2hk("hankcs在臺灣寫代碼"))
    21.
    22.print(HanLP.tw2t("hankcs在臺灣寫程式碼"))
    23.print(HanLP.hk2t("hankcs在台灣寫代碼"))
    1.「以後等你當上皇后,就能買草莓慶祝了」。發現一根白頭髮
    2.凭借笔记本电脑写程序HanLP
    3.hankcs在臺灣寫程式碼
    4.hankcs在台湾写代码
    5.hankcs在香港寫代碼
    6.hankcs在香港写代码
    7.hankcs在臺灣寫程式碼
    8.hankcs在香港寫代碼
    9.hankcs在臺灣寫程式碼
    10.hankcs在台灣寫代碼
    11.hankcs在臺灣寫代碼
    12.hankcs在臺灣寫代碼
    ---------------------


    困啊,想睡觉的呢
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 注册会员

    本版积分规则

    关闭

    站长推荐上一条 /2 下一条


    id="mn_portal" >首页Portalid="mn_P18" onmouseover="navShow('P18')">应用id="mn_P15" onmouseover="navShow('P15')">技术id="mn_P37" onmouseover="showMenu({'ctrlid':this.id,'ctrlclass':'hover','duration':2})">前沿id="mn_P36" onmouseover="navShow('P36')">宝箱id="mn_P61" onmouseover="showMenu({'ctrlid':this.id,'ctrlclass':'hover','duration':2})">专栏id="mn_P65" >企业id="mn_Nd633" >导航 折叠导航 关注微信 关注微博 关注我们

    QQ|广告服务|关于我们|Archiver|手机版|小黑屋|大数据人 ( 鄂ICP备14012176号-2  

    GMT+8, 2024-5-17 15:07 , Processed in 0.242334 second(s), 30 queries .

    Powered by 小雄! X3.2

    © 2014-2020 bigdataer Inc.

    快速回复 返回顶部 返回列表