ICTCLAS 词性标注集167


导言词性标注是自然语言处理中的一项基本任务,它将文本中的每个词分配一个词性标签,例如名词、动词、形容词等。ICTCLAS 词性标注集是中文词性标注领域广泛使用的一套词性标签体系,由清华大学自然语言处理与社会人文计算实验室开发。

ICTCLAS 词性标注集的主要特点ICTCLAS 词性标注集的主要特点包括:
层次化结构:ICTCLAS 词性标注集采用层次化结构,将词性分为根节点、一级分类、二级分类和三级分类四个层级,便于词性标注的进一步细分和扩展。
丰富性:ICTCLAS 词性标注集包含丰富的词性标签,可以满足大多数中文词性标注任务的需求。该标注集定义了20个根节点、57个一级分类、143个二级分类和330个三级分类,覆盖了中文词性的主要类别。
语义表示:ICTCLAS 词性标注集中的词性标签不仅仅是语法标签,还包含了一定的语义信息。例如,标注集将名词细分为普通名词、专有名词、代词等,反映了名词的不同语义类别。

ICTCLAS 词性标注集的标签体系ICTCLAS 词性标注集的标签体系如下:

根节点
一级分类
二级分类
三级分类


名词
普通名词
客观名词
物体名词





单位名词





性质名词




抽象名词
动作名词





事件名词



专有名词
机构名词
团体名词





人物名词



代词
人称代词
第一人称代词





第二人称代词





第三人称代词




指示代词
近指代词





远指代词




疑似代词
疑问代词





反问代词




无定代词
限定代词





泛指代词



数词
基数词
整数





分数




小数词
小数




序数词
序数


量词
通用量词
个数量词
度量词





时间量词




专指量词
次序量词





范围量词





组合量词


形容词
普通形容词
程度形容词
状态形容词





性状形容词




限定形容词
指示形容词





疑问形容词





反问形容词





无定形容词



处所形容词
泛指形容词
时间形容词




空间形容词





方位形容词



副词
程度副词
肯定副词
否定副词




疑问副词
反问副词




方式副词
动作方式副词





状态方式副词





处所方式副词





时间方式副词





程度方式副词





疑问方式副词




领属副词
物主领属副词




指向领属副词





程度副词
限制副词




范围副词
连词



并列连词
假设连词
条件连词




因果连词
转折连词




选择连词
递进连词




限制连词
承接连词




假设连词
疑问连词




反问连词




介词
支配性介词
方位介词





时间介词





原因介词




介宾性介词
方位介词





时间介词





原因介词





目的介词





对象介词





方式介词





条件介词





程度介词




动词
实义动词





使动动词





趋向动词





兼类动词




助动词





情态动词






时间情态动词





可能情态动词





能力情态动词





否定情态动词



否定词
纯否定词






副否定词




程度否定词




感叹词

2024-11-02


上一篇:CAD 链式标注:提升制图效率

下一篇:文档标注的参考文献和最佳实践