HanLP.com在保持HanLP开源版功能性和专业性的前提下,提供了更易用和更经济的cloud-API服务,
助力开发人员提升开发效率。

词性标注

为句子中的每个单词预测一个词性标签,提供词语的抽象表示。结合多语言分词,可用于进行更深层次的自然语言处理业务。

产品优势

性能高效
达到史上最高准确率。精准预测文本自此的词性标签。
语料时新
灵活调整语料集, 迭代模型参数,快速调优整体方案,不断满足业务变化。
多语言支持
支持简繁中英日俄法德等104种语言。自由选择自定义语言任务预测输出。

模型介绍

  • HMM词性标注
  • CRF词性标注
  • 感知机词性标注
  • 深度学习词性标注

CRF模型分词

目前非深度学习方法中最佳的分词效果,対歧义词和未知词的识别效果更优

了解更多

评测结果

模型
P
一阶隐马尔可夫模型 44.99%
二阶隐马尔可夫模型 40.53%
条件随机场 82.12%
结构化感知机 83.07%
深度学习词性标注 96.66%

应用场景

  • 文本检索
  • 数据挖掘
  • 歧义识别
  • 用户画像
  • 语音指令解析

数据文本检索

结合词性标注,帮助各大企业对海量信息的检索,提高文本处理的精度与速度

数据决策辅助

针对海量数据种特定词性的词语进行挖掘,对下游任务提供支撑服务,可作用于决策辅助、舆情分析、用户反馈等场景

文本纠错

对文本种的交集性词语进行歧义识别,可用作于文本纠错、语音转换等场景

千人千面分析

通过用户分层,进而有目的的制定出更精准、更有针对性的运营策略,洞察目标用户群体特征,提供精细化运营解决方案

智能家居语音助手

结合词性标注,让机器更好的理解指令语义,快速做出对应响应,可用作于语音助手、智能家居、智慧硬件等场景

生成接口

API地址
参数说明
功能演示
    • 接口示例

    • 接口地址:/tagger/HMM
    • token:2145fa74hf61jf9a8vj417a9341123sd
    • 建立时间:2020-01-01 00:00:00
    • 备注:

    停用 启用 删除
    • 接口地址:{{item.url}}
    • token:{{item.token}}
    • 建立时间:{{item.createDate}}
    • 备注:
      保存取消

    已启用 已停用 停用 启用 删除
请求方式

POST

请求参数
参数名称 参数说明 请求类型 是否必须 数据类型
text 需要分词的文本, 支持中、英、日等多种语言 Body:form-data true string
token 使用API时系统需要验证的身份信息 Headers true string

下载范例程序
API地址
参数说明
功能演示
    • 接口示例

    • 接口地址:/tagger/crf
    • token:2145fa74hf61jf9a8vj417a9341123sd
    • 建立时间:2020-01-01 00:00:00
    • 备注:

    停用 启用 删除
    • 接口地址:{{item.url}}
    • token:{{item.token}}
    • 建立时间:{{item.createDate}}
    • 备注:
      保存取消

    已启用 已停用 停用 启用 删除
请求方式

POST

请求参数
参数名称 参数说明 请求类型 是否必须 数据类型
text 需要分词的文本, 支持中、英、日等多种语言 Body:form-data true string
token 使用API时系统需要验证的身份信息 Headers true string

下载范例程序
API地址
参数说明
功能演示
    • 接口示例

    • 接口地址:/tagger/nlp
    • token:2145fa74hf61jf9a8vj417a9341123sd
    • 建立时间:2020-01-01 00:00:00
    • 备注:

    停用 启用 删除
    • 接口地址:{{item.url}}
    • token:{{item.token}}
    • 建立时间:{{item.createDate}}
    • 备注:
      保存取消

    已启用 已停用 停用 启用 删除
请求方式

POST

请求参数
参数名称 参数说明 请求类型 是否必须 数据类型
text 需要分词的文本, 支持中、英、日等多种语言 Body:form-data true string
token 使用API时系统需要验证的身份信息 Headers true string

下载范例程序
API地址
参数说明
功能演示
    • 接口示例

    • 接口地址:/tagger/chinese
    • token:2145fa74hf61jf9a8vj417a9341123sd
    • 建立时间:2020-01-01 00:00:00
    • 备注:

    停用 启用 删除
    • 接口地址:{{item.url}}
    • token:{{item.token}}
    • 建立时间:{{item.createDate}}
    • 备注:
      保存取消

    已启用 已停用 停用 启用 删除
请求方式

POST

请求参数
参数名称 参数说明 请求类型 是否必须 数据类型
text 需要分词的文本, 支持中、英、日等多种语言 Body:form-data true string
token 使用API时系统需要验证的身份信息 Headers true string

下载范例程序

使用教程

常见问题