帮助文档
  • 帮助文档
  • 注册账号
    • 个人设置
    • 团队设置
  • 开发者文档
    • 开发者工具
      • Python SDK
      • CLI
      • Open API
        • Dataset Operation
        • Data Operation
      • 示例演示
        • 模型训练
        • 数据挖掘
  • 产品使用文档
    • TensorBay
      • TensorBay 适用于算法研究的各个阶段
      • 概念说明
      • 快速入门 - 开发者版
      • 快速入门 - 团队版
      • 数据集准备
        • 新建数据集
        • 管理云服务上的数据
          • 阿里云oss用户授权RAM
        • 利用数据集筛选快速新建
        • 数据合并拆分及复制移动
        • 通过Fork使用公开数据集
      • 数据版本管理
        • 管理数据文件
        • 管理标注数据
        • 管理数据集信息
        • 管理版本信息
        • 管理数据集分支
        • 数据集活动
        • 数据集设置
      • Pharos 数据可视化
        • 获取 Pharos
        • Pharos 使用指南
      • 团队协作
        • 创建团队空间
        • 资料/成员管理
        • 数据集管理
        • 团队活动日志
      • Action 流程自动化
        • 新建工作流
        • 运行工作流
        • 管理工作流
        • YAML语法说明
        • Crontab语法说明
        • 自动化配置
      • 如何与Pipeline集成
    • Open Datasets
      • 数据集概念
      • 查找公开数据集
      • 在线预览数据及标签分布
      • 在线使用并管理数据集
      • 下载公开数据集
      • 找不到想要的数据集?
  • APPs
    • GroundTruth Tools
      • 图片标注
      • 语音分类
    • TeraGood Service
      • 需求方使用手册
      • 运营方使用手册
      • 标注方使用手册
    • Sextant
      • 新建评估
      • 自定义Metrics
      • 参与评估
      • 查看评估结果
  • 更新日志
  • 格物钛官网
由 GitBook 提供支持
在本页
  • 普通数据集
  • 融合数据集

这有帮助吗?

  1. 产品使用文档
  2. Open Datasets

数据集概念

数据集常见名词解释

上一页Open Datasets下一页查找公开数据集

最后更新于3年前

这有帮助吗?

在使用TensorBay和搜索数据集的过程中,主要涉及两类数据集的相关概念:普通数据集(Dataset)和融合数据集(FusionDataset)以下将给出其中常见的名词解释。

普通数据集

普通数据集是最常见的数据集,例如:MNIST、THUCNews等数据集,其数据文件之间没有特别关联或来自于单一的传感器。

  • Dataset:普通数据集

一个普通数据集包含一定数量的数据文件、标注信息以及与数据集相关的信息。每一个数据集可包含零到多个Segment和零到多个Catalog。

  • Segment:数据集划分

在TensorBay数据集结构中,Segment是仅次于普通数据集(Dataset)的数据级别。每一个Segment包含一定量的数据。例如:所有训练样本可以整合在同一个名为 “Train“ 的Segment中。

  • Catalog & SubCatalog:含多种标注类型的标注表 & 含单一标注类型的标注表

含多种标注类型的标注表(Catalog)包含该数据集中标注数据的所有标签meta信息。每一个含单一标注类型的标注表(SubCatalog)仅包含一种类型的meta信息。

  • Data:数据

在TensorBay数据集结构中,数据是最基本的数据级别。每条数据包含一个数据样本文件、该数据的标注标签及其他数据信息(例如:时间信息等)。

【示例】普通数据集的数据结构:

融合数据集

融合数据集是由多传感器收集的数据组成的数据集,常见于无人驾驶领域,例如:nuScenes和KITTI-tracking数据集。

  • FusionDataset:融合数据集

融合数据集支持数据来自多个传感器,包含所有Frames、标签、传感器和其他信息。一个融合数据集可包含多个FusionSegment。

  • FusionSegment

FusionSegment是仅次于融合数据集(FusionDataset)的数据级别。每一个FusionSegment包含一定量的Frames来储存不同传感器的信息。

  • Sensor:传感器

传感器(Sensor)在FusionSegment中用来记录收集信息的设备。目前,我们支持以下四种类别的传感器,每个传感器(Sensor)可储存传感器相关信息,包含传感器名称、外部参数和内部参数(仅限相机类别传感器参数标定)。

传感器

对应数据类别

相机(Camera)

图像(image)

鱼眼相机(FisheyeCamera)

图像(image)

激光雷达(Lidar)

点云(point cloud)

雷达(Radar)

点云(point cloud)

  • Frame:帧

帧(Frame)是FusionSegment的组成部分。一个帧(Frame)包含同一时间来自不同传感器的多种类型的数据文件。

  • Data in FusionDataset:融合数据集中的数据

一个帧(Frame)中的每个数据对应一个传感器(Sensor)收集的数据文件。融合数据集中的数据与普通数据集中的数据定义相同。