level 13
“我的车是白色的”这一中文句子,符合【名词词组 是 形容词】这样的句式,程序尝试对中文句子进行分词,并建立一棵语法树。可以看到“我的车”是一个名词词组,它还可以细分为形容词(我的)和名词(车)。
把这棵树的叶子节点连起来,得到的结果是:我的 车 是 白色的 。这并没有什么问题。
要想让计算机把“我的车”这个名词词组看成一个整体,只能让它在这个节点上不再进行细分。
我之前接触的案例都是英文句子的文法解析,中文句子是不带空格的,我猜想中文NLP系统应该是先对句子进行机械分词,得到很多种分词方案,然后再调用语法分析程序,淘汰掉那些不符合语法的方案,不知道我说的对不对。

