NLP基础:标注器Label Studio的入门使用

目录

一、环境准备

二、操作 

文章来源:


简介: 

Label Studio是一个开源的数据标注工具,它可以用于各种机器学习和深度学习项目。它的主要目的是帮助数据科学家和机器学习工程师快速、高效地标注数据,以构建和训练准确的机器学习模型。Label Studio支持多种数据类型的标注,如图像、文本、音频和视频等,还提供了许多功能和工具,如标注管理、批注、团队协作、数据可视化和自动化等。Label Studio是由心智大数据(MindsDB)开发和维护的开源软件,它在GitHub上提供了完整的文档和代码。

一、环境准备

我用的是pycharm,在anaconda中配置如下环境并进入该环境:

  • Python 3.8+
  • label-studio == 1.7.1
  • paddleocr >= 2.6.0.1

配置完后在控制台输入

扫描二维码关注公众号,回复: 15055422 查看本文章
label-studio start

然后就会自动登录网页,一般是http://localhost:8080/。新用户注册一下

二、操作 

进入后点击创建项目

起好名,选择natural language processing,再选择named entity recognition

 

 左边这个框可以编辑自己要标注的关键词

 点击import导入文本文件,我随便现弄了一个

 标注词按自己要求来

 导入后点击上面进行标注任务

一个一个标即可。 

 最后标完导出即可,可以json、csv等等


文章来源:

1.基于Label studio的训练数据标注指南:信息抽取(实体关系抽取)、文本分类等 - 腾讯云开发者社区-腾讯云

猜你喜欢

转载自blog.csdn.net/m0_62237233/article/details/130332657