版本: V1.0 | 交付方式: 人工服务 |
适用于: Windows/Linux | 上架日期: 2021-03-11 |
交付SLA: 30 自然日 |
文本标注是指标注员对需要进行标注的文本内容按照客户实际需求对文本进行分词、槽位、句法、情感、事件要素、语种互译等不同层级标注。结合Stardust平台的智能辅助工具助力标注人员,实现快速高效标注、质量监控等工作。我们通过“准入考核”、“动态测量”、“动态发题”和“人机结合”等标注方法确保了标注的全流程管理。智能化辅助标注工具,帮助人工实现快速标注及有效标注。全流程标注平台实现了数据标注的人员交互审核与验证功能,使得标注的数据质量更高,更适合人工智能应用场景的开发。已完全掌握文本项目特有的难点、易错点,并开发完成一系列技术支持,提升标注质量。具体技术如下:
- 预分类:通过对文本内容中标题或关键词进行提取及聚合,对全部数据进行内容分类。通过分类,可将特定领域的文本发放给相关专业标注员,提升标注质量及速度;
-预标注:通过特定词典整理、算法辅助等方式,对特定实体进行标注,如可自动标注时间、地点、人名、组织、专业术语等。通过预标注,一方面可节省标注成本,另一方面可达到提示作用;
-自动质检:通过设定特定规则,对不同标注结果进行自动校验,针对不合格的题目进行驳回并提示修改,提高质检速度及准确率;
-多字少字检查:通过分词方法及模型训练,将文本选择或文本输入的结果与原文进行比较,检查是否存在多一个字或少一个字的情况,可替代人眼进行更准确的检查。
规格 | SKU名称 | 数量值 | 单价 |
---|---|---|---|
数据标注 | 实体识别 | / | 0.10元/次 |
问答 | / | 0.20元/次 | |
排序 | / | 0.10元/次 | |
分类 | / | 0.10元/次 | |
判断 | / | 0.20元/次 |
一、需求: 国家新闻稿件文本标注。 二、项目难点: 1)NLP自然语言标注主观性强,难度大,需要标注员具有较强的中文语言能力和较好的政治素养; 2)项目前期,标注需求不够清晰,缺乏完善的标注规则体系;文章篇幅长,大标签数量22个,累积标签和选项达70-80个; 3)文章类型多,场景多,包含9大场景,数据形式多,包含文字、图片和视频等。 三、解决方案: 1)星尘自动化考试系统,部署对应需求的考题设置标注门槛对标注员进行筛选,保证标注员的质量; 2)对于不够完善的标注规则体系,项目配置的专属PM(项目经理),即时反馈标注过程遇到的标注问题并提供多个解决方案,推动优化完善标注规则体系; 3)对于复杂的标注场景与需求,星尘系统带有的预标注与自动质检大大地提高了标注的效率与质量。2. 某高校研究院:英文语料文本标注
一、需求: 对英文语料文本进行主体关键词识别提取、语义分析及对话情感打标。 二、项目难点: 1)英文语料内容复杂,需要标注员具备一定的英文水平; 2)对话情感主观性较强,难以判断;项目工期紧。 三、解决方案: 1)培训相关专业的优质标注员,将项目难点整理成培训手册; 2)优化标注流程,将语料文本进行多轮标注后再进行多层质检,以避免由于主观性产生的分歧; 3)采用算法辅助对文本进行预标注。
暂无,请等待更新
展开更多 商品问答 有疑问快问商家吧~ 我要提问 展开更多售后服务时间:7 * 12小时 售后服务内容:售后服务支持 服务热线:010-86462864 服务邮箱:bd@stardust.ai商品服务协议
订购此商品即为您同意《商品服务协议》
联系方式电话: 010-86462864
邮箱: contacts@stardust.ai
0 (0%) 好评 | 0 (0%) 中评 | 0 (0%) 差评 |