开源点云数据集

一、引言

点云数据是自动驾驶、机器人、3D重建、室内外场景理解、森林资源调查等方向的核心素材。本文整理了目前最常用、最活跃的开源点云数据集以及对应的获取链接。

二、自动驾驶类数据集

2.1 KITTI

KITTI 是最早也是最经典的自动驾驶数据集,在德国卡尔斯鲁厄附近的市区、郊区和高速路上采集,包含双目相机图像、激光雷达点云、GPS/IMU 数据,标注了车辆、行人、骑行者、路牌等常见物体。主要用来做 3D 物体检测、语义分割、视觉里程计、光流估计这些基础任务。
网址:http://www.cvlibs.net/datasets/kitti/

2.2 SemanticKITTI

SemanticKITTI 是 KITTI 的语义升级版,把所有激光雷达点云都做了逐点标注,一共有 28 个类别(道路、车辆、行人、植被、建筑、杆子等),数据同样来自德国城市和郊区。主要用来训练和评估大规模室外点云的语义分割、实例分割和序列理解算法。
网址:http://semantic-kitti.org/

2.3 nuScenes

nuScenes 在美国波士顿和新加坡采集,提供了非常完整的传感器组合:6 个摄像头、5 个雷达、1 个激光雷达,标注了车辆、行人、骑行者、交通锥等 23 类物体,覆盖各种天气和光照条件。主要用于 3D 检测、跟踪、预测、端到端驾驶等研究。
网址:https://www.nuscenes.org/

2.4 Waymo Open Dataset

Waymo 数据集规模很大,在美国多个城市采集,包含高分辨率激光雷达、多视角摄像头图像和非常精细的 3D 标注框,标注物体有车辆、行人、骑行者、交通灯、施工区域等。主要用来做 3D 检测、跟踪、多模态融合和复杂场景的长尾行为预测。
网址:https://waymo.com/open/

2.5 PandaSet

PandaSet 是小马智行和 Hesai 合作发布的,用 Pandar64 和 PandarGT 激光雷达在美国城市道路采集,配有多视角摄像头,标注了车辆、行人、骑行者、路标、动物等。主要适合研究自动驾驶感知、物体检测和固态激光雷达相关的多传感器融合。
网址:https://pandaset.org/

2.6 Zenseact Open Dataset (ZOD)

ZOD 是 Zenseact 发布的欧洲多国数据集,用 Velodyne VLS128 + VLP16 激光雷达、雷达和摄像头采集,标注车辆、行人、骑行者、交通标志、动物等物体,覆盖大量真实道路场景。主要用于 3D 检测、跟踪、雷达-激光融合和感知鲁棒性研究。
网址:https://zod.zenseact.com/

三、物体分类与分割类数据集

3.1 ModelNet40 / ModelNet10

ModelNet 是普林斯顿大学做的合成数据集,把 CAD 模型转成点云,ModelNet40 有 40 类常见物体(椅子、桌子、飞机、汽车、瓶子等),ModelNet10 精简到 10 类。主要用来测试 3D 形状分类算法和各种点云深度学习模型的基准性能。
网址:https://modelnet.cs.princeton.edu/

3.2 ShapeNet

ShapeNet 规模更大,由斯坦福和普林斯顿联合做,包含 5 万多个 3D CAD 模型(可转点云),覆盖 55 类日常物体(飞机、椅子、灯具、汽车等),还带部件标注。主要用于形状分类、部件分割、形状补全和生成式模型训练。
网址:https://shapenet.org/

3.3 PartNet

PartNet 是 ShapeNet 的细粒度扩展,包含 2.6 万多个模型,覆盖 24 类物体(椅子、桌子、刀具、储物柜等),每个物体都有层次化的部件标注(3 个粒度级别)。主要用来做细粒度部件分割和 3D 物体结构理解。
网址:https://cs.stanford.edu/~kaichun/partnet/

四、室内场景类数据集

4.1 S3DIS

S3DIS 是斯坦福大学在美国采集的 6 个大型建筑物室内点云(办公室、会议室、走廊等),每个点都标注了 13 类标签(墙、地板、天花板、门、家具等)。主要用于室内点云语义分割、大场景理解和机器人导航。
网址:https://buildingparser.stanford.edu/dataset.html

4.2 ScanNet

ScanNet 用 RGB-D 相机在美国各种室内场景扫了很多房间,重建了点云和网格,提供了 21 类物体的语义和实例标注(床、椅子、桌子、显示器等)。主要用来做室内语义分割、实例分割、3D 重建和具身 AI 研究。
网址:http://www.scan-net.org/

4.3 Rohbau3D

Rohbau3D 是德国建筑工地真实扫描的室内点云,主要包含墙、柱、梁、楼梯、门窗开口等建筑结构元素。主要用来研究建筑场景的点云分割、组件识别和数字孪生应用。
网址:https://github.com/RauchLukas/rohbau3d

五、室外城市场景类数据集

5.1 Semantic3D

Semantic3D 用地面激光扫描仪在欧洲采集了很多室外场景(教堂、街道、广场、村庄等),总共超过 40 亿点,标注了 8 类(地面、建筑、植被、车辆等)。主要用于大规模室外点云语义分割和高精度城市场景解析。
网址:http://www.semantic3d.net/

5.2 Paris-Lille-3D

Paris-Lille-3D 用移动激光扫描车在法国巴黎和里尔街头采集,点云密度很高,标注了 10 类(道路、建筑、植被、车辆、杆子等)。主要用来做城市道路语义分割和移动激光点云处理。
网址:https://npm3d.fr/paris-lille-3d

5.3 Toronto-3D

Toronto-3D 在加拿大多伦多城市道路上用移动激光扫描采集,约 7800 万点,标注了 8 类(道路、建筑、植被、车辆等)。主要用于城市道路点云语义分割和基础设施分析。
网址:https://github.com/WeikaiTan/Toronto-3D

六、森林与植被类数据集

6.1 WHU-TLS

WHU-TLS 是武汉大学团队采集的地面激光扫描数据集,覆盖森林、公园、山地、地铁站等多种场景,总共 115 个测站、17.4 亿点。主要用来做点云配准、森林结构分析和多环境 3D 重建的基准测试。
网址:http://3s.whu.edu.cn/ybs/en/benchmark.htm

6.2 NEON Airborne LiDAR

NEON 是美国国家生态观测网络的航空激光雷达数据,覆盖全美 81 个生态站点,包括森林、草地等,标注树木、植被、地形等。主要用来提取森林参数、监测生态变化和多时相分析。
网址:https://www.neonscience.org/

6.3 BioDiv-3DTrees

BioDiv-3DTrees 采集了欧洲 19 种树木的 4952 棵单木点云(地面 TLS + 无人机 ULS),附带 3386 个 QSM 模型和图结构表示,标注树干、枝条、树冠等。主要用于单木分割、树木结构建模、生物多样性研究和 QSM 重建。
网址:https://doi.org/10.25625/8PB1IF

Logo

昇腾计算产业是基于昇腾系列(HUAWEI Ascend)处理器和基础软件构建的全栈 AI计算基础设施、行业应用及服务,https://devpress.csdn.net/organization/setting/general/146749包括昇腾系列处理器、系列硬件、CANN、AI计算框架、应用使能、开发工具链、管理运维工具、行业应用及服务等全产业链

更多推荐