将一段文本拆分为一系列单词,拼接后等于原文本。并使其具有语义合理性和完整的词汇序列。为更好更精确的挖掘文本价值提供基础支撑。2.1接口支持包括简繁中英日俄法德在内的104种语言。
目前非深度学习方法中最佳的分词效果,対歧义词和未知词的识别效果更优
模型 |
P |
R |
F1 |
ROOV |
RIV |
---|---|---|---|---|---|
CRF分词 | 96.86 | 96.64 | 96.75 | 71.54 | 97.33 |
N-最短路径分词 | 87.31 | 85.92 | 86.61 | 53.23 | 86.81 |
NLP分词 | 91.87 | 90.74 | 91.30 | 38.78 | 92.15 |
极速词典分词 | 91.73 | 95.69 | 93.67 | 2.47 | 98.22 |
标准分词 | 85.36 | 87.72 | 86.52 | 39.20 | 98.04 |
深度学习分词 | 97.50 |
POST
参数名称 | 参数说明 | 请求类型 | 是否必须 | 数据类型 |
---|---|---|---|---|
text | 需要分词的文本, 支持中、英、日等多种语言 | Body:form-data | true | string |
token | 使用API时系统需要验证的身份信息 | Headers | true | string |
POST
参数名称 | 参数说明 | 请求类型 | 是否必须 | 数据类型 |
---|---|---|---|---|
text | 需要分词的文本, 支持中、英、日等多种语言 | Body:form-data | true | string |
token | 使用API时系统需要验证的身份信息 | Headers | true | string |
POST
参数名称 | 参数说明 | 请求类型 | 是否必须 | 数据类型 |
---|---|---|---|---|
text | 需要分词的文本, 支持中、英、日等多种语言 | Body:form-data | true | string |
token | 使用API时系统需要验证的身份信息 | Headers | true | string |
POST
参数名称 | 参数说明 | 请求类型 | 是否必须 | 数据类型 |
---|---|---|---|---|
text | 需要分词的文本, 支持中、英、日等多种语言 | Body:form-data | true | string |
token | 使用API时系统需要验证的身份信息 | Headers | true | string |
POST
参数名称 | 参数说明 | 请求类型 | 是否必须 | 数据类型 |
---|---|---|---|---|
text | 需要分词的文本, 支持中、英、日等多种语言 | Body:form-data | true | string |
token | 使用API时系统需要验证的身份信息 | Headers | true | string |
POST
参数名称 | 参数说明 | 请求类型 | 是否必须 | 数据类型 |
---|---|---|---|---|
text | 需要分词的文本, 支持中、英、日等多种语言 | Body:form-data | true | string |
token | 使用API时系统需要验证的身份信息 | Headers | true | string |
POST
参数名称 | 参数说明 | 请求类型 | 是否必须 | 数据类型 |
---|---|---|---|---|
text | 需要分词的文本, 支持中、英、日等多种语言 | Body:form-data | true | string |
token | 使用API时系统需要验证的身份信息 | Headers | true | string |
POST
参数名称 | 参数说明 | 请求类型 | 是否必须 | 数据类型 |
---|---|---|---|---|
text | 需要分词的文本, 支持中、英、日等多种语言 | Body:form-data | true | string |
token | 使用API时系统需要验证的身份信息 | Headers | true | string |
{{item.dictionaryName}}