ModelFun

ModelFun

消 除 手 工 标 注 瓶 颈 , 释 放 AI 潜 力

ModelFun Flow数据自动化标注流程

通过构建标注规则,并训练投票模型构建自动化标注引擎,对指定类别的数据进行批量化自动标注。并通过分析标注结果及错误样本数,对标注规则进行快速迭代,提升数据标注质量。
场景落地
文本分类
NER抽取
信息抽取
情绪分析
对话分析
文档分类

上传数据集

  • 上传数据集
    多种格式的数据上传
  • 数据可视化
    方便查看未标注数据、测试集和标签集
  • 一键标注
    全流程自动化标注,快速冷启动

自动标注

  • 自动标注
    一键对所有未标注数据进行批量标注
  • 标注概览
    标注结果分为待审核数据和高置信数据,快速浏览标注结果
  • 手工精调
    对待审核数据进行手动标注,提升标注效果
1
2
3
4

构建规则

  • 构建规则
    支持可视化编辑及代码编写多种类型的规则构建方式
  • 规则概览
    统一查看每条规则的标注效果
  • 规则集成
    集成所有标注规则,训练标注引擎

模型训练

  • 模型训练
    支持LR和BERT两种类型的模型训练,对标注结果进行有效评估
  • 数据下载
    一键下载标注结果交付业务应用
  • 模型下载
    一键下载模型文件,快速进行本地化部署应用
  • 数据分析
    查看每个类别的错误样本,进行数据质量分析
场景说明

SimCLUE

使用modelfun进行大规模语义数据集构建与应用

痛点:

  • 传统大规模语义数据集标注和建模应用周期长
  • 费用高
  • 无法有效迭代

解决方案:

  • 使用多种方式构建规则并进行批量化标注
  • 规则集成,训练投票模型构建标注引擎
  • 分析标注错误样本,进行规则快速迭代

效果:

  • 标注时长由原来的300天缩短至7天
  • 标注成本节约30w