中文自然语言处理--pyhanlp 进行命名实体识别和提取
通过简单的pyhanlp 分词然后根据词性获取实体对象from pyhanlp import *# 词性切分sentence = u'''上线三年就成功上市,拼多多上演了互联网企业的上市奇迹,却也放大平台上存在的诸多问题,拼多多在美国上市。'''# 词性标注+切分# 此处以代码的方式插入自定义词语,在实际项目中也可以用词典文件的方式CustomDictionary.insert("拼多多", "电
·
通过简单的pyhanlp 分词然后根据词性获取实体对象
from pyhanlp import *
# 词性切分
sentence = u'''上线三年就成功上市,拼多多上演了互联网企业的上市奇迹,却也放大平台上存在的诸多问题,拼多多在美国上市。'''
# 词性标注+切分
# 此处以代码的方式插入自定义词语,在实际项目中也可以用词典文件的方式
CustomDictionary.insert("拼多多", "电商企业 1")
analyzer = PerceptronLexicalAnalyzer()
analyzer.enableCustomDictionaryForcing(True)
segs = analyzer.analyze(sentence)
print(segs)
arr = str(segs).split(" ")
print(arr)
# 定义一个函数,从得到的结果中,根据词性获取指定词性的词
def get_result(arr):
re_list = []
ner = ['n', 'ns']
for x in arr:
temp = x.split("/")
if (temp[1] in ner):
re_list.append(temp[0])
return re_list
result = get_result(arr)
print(result)
原文:
https://soyoger.blog.csdn.net/article/details/108729398
更多推荐




所有评论(0)