帮助文档
  • 帮助文档
  • 注册账号
    • 个人设置
    • 团队设置
  • 开发者文档
    • 开发者工具
      • Python SDK
      • CLI
      • Open API
        • Dataset Operation
        • Data Operation
      • 示例演示
        • 模型训练
        • 数据挖掘
  • 产品使用文档
    • TensorBay
      • TensorBay 适用于算法研究的各个阶段
      • 概念说明
      • 快速入门 - 开发者版
      • 快速入门 - 团队版
      • 数据集准备
        • 新建数据集
        • 管理云服务上的数据
          • 阿里云oss用户授权RAM
        • 利用数据集筛选快速新建
        • 数据合并拆分及复制移动
        • 通过Fork使用公开数据集
      • 数据版本管理
        • 管理数据文件
        • 管理标注数据
        • 管理数据集信息
        • 管理版本信息
        • 管理数据集分支
        • 数据集活动
        • 数据集设置
      • Pharos 数据可视化
        • 获取 Pharos
        • Pharos 使用指南
      • 团队协作
        • 创建团队空间
        • 资料/成员管理
        • 数据集管理
        • 团队活动日志
      • Action 流程自动化
        • 新建工作流
        • 运行工作流
        • 管理工作流
        • YAML语法说明
        • Crontab语法说明
        • 自动化配置
      • 如何与Pipeline集成
    • Open Datasets
      • 数据集概念
      • 查找公开数据集
      • 在线预览数据及标签分布
      • 在线使用并管理数据集
      • 下载公开数据集
      • 找不到想要的数据集?
  • APPs
    • GroundTruth Tools
      • 图片标注
      • 语音分类
    • TeraGood Service
      • 需求方使用手册
      • 运营方使用手册
      • 标注方使用手册
    • Sextant
      • 新建评估
      • 自定义Metrics
      • 参与评估
      • 查看评估结果
  • 更新日志
  • 格物钛官网
由 GitBook 提供支持
在本页
  1. 产品使用文档
  2. TensorBay

概念说明

上一页TensorBay 适用于算法研究的各个阶段下一页快速入门 - 开发者版

最后更新于3年前

这有帮助吗?

CtrlK
  • TensorBay版本管理
  • Dataset
  • Commit
  • Branch
  • Tag
  • Draft

这有帮助吗?

TensorBay版本管理

版本管理是TensorBay的主要功能,它可以帮助团队、个人进行数据开发的版本管理,完美解决难以比较数据修改内容、合并数据、取消修改、对一份数据进行并行开发、以及难以追溯数据开发生命周期等痛点问题。

Dataset

Dataset是TensorBay定义的用于快速迭代高质量数据集的特殊数据格式以及进行版本管理、团队管理以及数据编辑等操作的基本对象。

Commit

Commit的概念与Git类似,它记录了Dataset在某一时间点的快照。通过某个Dataset的历史全部Commits就可以对其所有迭代内容进行管理和追溯。针对Dataset的编辑必须Commit Draft后才能生效。

Branch

Branch是一系列Commits的一个引用位置。每个Dataset都会默认创建一个Main Branch,在对Dataset进行版本管理时,必须选定一个Branch。在Branch下对数据集进行修改后,Branch会自动更新到最新的Commit。

Tag

类似于Git的Tag的概念,用户可以对数据版本信息进行标记,方便版本查找和溯源。

Draft

编辑Dataset的工作区,只有在新建Draft后才可以对Dataset进行数据层面的修改(数据修改、数据集信息修改)。用户可以选择Dataset内的任意一个Branch来创建新Draft。