python自然语言处理实战 | 句法分析学习笔记

这是对涂铭等老师撰写的《Python自然语言处理实战：核心技术与算法》中第6章句法分析的学习笔记。这里写目录标题基于PCFG的中文句法分析实战总结基于PCFG的中文句法分析实战#coding=utf-8# 分词import jieba# PCFG句法分析from nltk.parse import stanfordimport osif __name__ == '__main__':string

Claire_chen_jia

799人浏览 · 2021-03-11 10:06:30

Claire_chen_jia · 2021-03-11 10:06:30 发布

这是对涂铭等老师撰写的《Python自然语言处理实战：核心技术与算法》中第6章句法分析的学习笔记。
在这里插入图片描述

基于PCFG的中文句法分析实战

#coding=utf-8

# 分词
import jieba

# PCFG句法分析
from nltk.parse import stanford
import os

if __name__ == '__main__':

    string = '明天是晴天'
    seg_list = jieba.cut(string, cut_all=False, HMM=True)
    seg_str = ' '.join(seg_list)

    print(seg_str)
    root = './'
    parser_path = root + 'stanford-parser.jar'
    model_path =  root + 'stanford-parser-4.0.0-models.jar'

    # 指定JDK路径
    if not os.environ.get('JAVA_HOME'):
        # set the JAVA_HOME environment:
        JAVA_HOME = r"D:\JDK\bin\java.exe"
        os.environ.setdefault('JAVA_HOME', JAVA_HOME)


    # PCFG模型路径
    pcfg_path = 'edu/stanford/nlp/models/lexparser/chinesePCFG.ser.gz'

    parser = stanford.StanfordParser(
        path_to_jar=parser_path,
        path_to_models_jar=model_path,
        model_path=pcfg_path
    )

    sentence = parser.raw_parse(seg_str)
    for line in sentence:
        print(line.leaves())
        line.draw()