帮助文档
  • 帮助文档
  • 注册账号
    • 个人设置
    • 团队设置
  • 开发者文档
    • 开发者工具
      • Python SDK
      • CLI
      • Open API
        • Dataset Operation
        • Data Operation
      • 示例演示
        • 模型训练
        • 数据挖掘
  • 产品使用文档
    • TensorBay
      • TensorBay 适用于算法研究的各个阶段
      • 概念说明
      • 快速入门 - 开发者版
      • 快速入门 - 团队版
      • 数据集准备
        • 新建数据集
        • 管理云服务上的数据
          • 阿里云oss用户授权RAM
        • 利用数据集筛选快速新建
        • 数据合并拆分及复制移动
        • 通过Fork使用公开数据集
      • 数据版本管理
        • 管理数据文件
        • 管理标注数据
        • 管理数据集信息
        • 管理版本信息
        • 管理数据集分支
        • 数据集活动
        • 数据集设置
      • Pharos 数据可视化
        • 获取 Pharos
        • Pharos 使用指南
      • 团队协作
        • 创建团队空间
        • 资料/成员管理
        • 数据集管理
        • 团队活动日志
      • Action 流程自动化
        • 新建工作流
        • 运行工作流
        • 管理工作流
        • YAML语法说明
        • Crontab语法说明
        • 自动化配置
      • 如何与Pipeline集成
    • Open Datasets
      • 数据集概念
      • 查找公开数据集
      • 在线预览数据及标签分布
      • 在线使用并管理数据集
      • 下载公开数据集
      • 找不到想要的数据集?
  • APPs
    • GroundTruth Tools
      • 图片标注
      • 语音分类
    • TeraGood Service
      • 需求方使用手册
      • 运营方使用手册
      • 标注方使用手册
    • Sextant
      • 新建评估
      • 自定义Metrics
      • 参与评估
      • 查看评估结果
  • 更新日志
  • 格物钛官网
由 GitBook 提供支持
在本页
  • 数据集管理从0到1
  • 在算法研究中使用数据集
  • 加速数据集准备与版本管理

这有帮助吗?

  1. 产品使用文档
  2. TensorBay

TensorBay 适用于算法研究的各个阶段

上一页TensorBay下一页概念说明

最后更新于4年前

这有帮助吗?

数据集管理从0到1

  • 在TensorBay中,可通过以下三种方式管理自有数据:

  1. 上传自定义数据集,托管在TensorBay中;

  2. 将托管在其他云服务上的数据集转存到TensorBay上;

  3. 授权TensorBay读取和管理您在其他云服务上的数据。

  • 如果您还没有可用的数据集,Open Datasets 提供海量优质的,部分数据集支持 功能,直接云端读取,无需下载,省去数据结构转换,即刻使用。

  • 完成创建数据集后,可使用可视化功能,在线预览数据集、查看数据集标注标签分布等,快速使用TensorBay管理您的数据集。

在算法研究中使用数据集

  • 通过开发者工具,使用、读取数据和标注,在pipline中使用数据集。TensorBay提供了可直接复制的代码示例,附在每个功能的对应页面,方便随时查阅。

  • 通过开发者工具,可以直接上传、发布数据集,轻松实现数据集的迭代。此功能将在数据清洗与备份的流程中提高您的效率,只要完成了数据集发布,就可以在未来快捷地选用最合适的数据集版本。

加速数据集准备与版本管理

  • 如果只有原数据文件,且正在为数据标注、管理标注信息苦恼,可以使用应用中的或进行数据标注。团队版支持多人同时标注,事半功倍。

  • 面对数据集太小或存在严重的数据分布不平衡的问题,难以满足研究需求,可尝试或,缩短数据集的准备时间。

  • 如果需要进行数据清洗,强烈建议使用TensorBay强大的功能,不仅可以发布不同版本的数据,还能随时回退至任一已发布的版本,获得真正的清晰、可追溯的版本管理体验。

新建数据集
管理云服务上的数据
公开数据集
Fork
Python SDK、CLI或Open API来创建数据集
GroundTruth Tool
Teragood Service
合并数据集
根据标签筛选并新建数据集
数据版本管理