概念说明
最后更新于
版本管理是TensorBay的主要功能,它可以帮助团队、个人进行数据开发的版本管理,完美解决难以比较数据修改内容、合并数据、取消修改、对一份数据进行并行开发、以及难以追溯数据开发生命周期等痛点问题。
Dataset是TensorBay定义的用于快速迭代高质量数据集的特殊数据格式以及进行版本管理、团队管理以及数据编辑等操作的基本对象。
Commit的概念与Git类似,它记录了Dataset在某一时间点的快照。通过某个Dataset的历史全部Commits就可以对其所有迭代内容进行管理和追溯。针对Dataset的编辑必须Commit Draft后才能生效。
Branch是一系列Commits的一个引用位置。每个Dataset都会默认创建一个Main Branch,在对Dataset进行版本管理时,必须选定一个Branch。在Branch下对数据集进行修改后,Branch会自动更新到最新的Commit。
类似于Git的Tag的概念,用户可以对数据版本信息进行标记,方便版本查找和溯源。
编辑Dataset的工作区,只有在新建Draft后才可以对Dataset进行数据层面的修改(数据修改、数据集信息修改)。用户可以选择Dataset内的任意一个Branch来创建新Draft。