版权声明:凡由本人原创,如有转载请注明出处https://me.csdn.net/qq_41424519,谢谢合作 https://blog.csdn.net/qq_41424519/article/details/82021620
标签说明
标签方案中通常都使用一些简短的英文字符[串]来编码。
标签是打在token上的。
对于英文,token可以是一个单词(e.g. awesome),也可以是一个字符(e.g. a)。
对于中文,token可以是一个词语(分词后的结果),也可以是单个汉字字符。
为便于说明,以下都将token试作等同于字符。
标签列表如下:
- B,即Begin,表示开始:
- I,即Intermediate,表示中间
- E,即End,表示结尾
- 习近平:B-PER I-PER E-PER ;
- 天安门:B-LOC I-PER E-PER ;
- 国务院:B-ORG I-ORG E-ORG
- S,即Single,表示单个字符
- O,即Other,表示其他,用于标记无关字符