通过简单的pyhanlp 分词然后根据词性获取实体对象

from pyhanlp import *

# 词性切分
sentence = u'''上线三年就成功上市,拼多多上演了互联网企业的上市奇迹,却也放大平台上存在的诸多问题,拼多多在美国上市。'''
# 词性标注+切分
# 此处以代码的方式插入自定义词语,在实际项目中也可以用词典文件的方式
CustomDictionary.insert("拼多多", "电商企业 1")
analyzer = PerceptronLexicalAnalyzer()
analyzer.enableCustomDictionaryForcing(True)
segs = analyzer.analyze(sentence)
print(segs)
arr = str(segs).split(" ")
print(arr)

# 定义一个函数,从得到的结果中,根据词性获取指定词性的词
def get_result(arr):
    re_list = []
    ner = ['n', 'ns']
    for x in arr:
        temp = x.split("/")
        if (temp[1] in ner):
            re_list.append(temp[0])
    return re_list

result = get_result(arr)
print(result)


原文:
https://soyoger.blog.csdn.net/article/details/108729398

Logo

一站式 AI 云服务平台

更多推荐