开源点云数据集

本文整理了当前最常用的开源点云数据集，涵盖自动驾驶、物体分类、室内外场景及森林植被等多个领域。自动驾驶类包括KITTI、nuScenes等经典数据集；物体分类类如ModelNet40和ShapeNet提供丰富的3D模型；室内场景类S3DIS和ScanNet适用于语义分割；室外城市场景类Semantic3D等支持高精度解析；森林植被类WHU-TLS等用于生态分析。这些数据集为3D感知、重建和AI研究

敲下一点一滴

272人浏览 · 2026-03-09 16:47:11

敲下一点一滴 · 2026-03-09 16:47:11 发布

开源点云数据集

一、引言

点云数据是自动驾驶、机器人、3D重建、室内外场景理解、森林资源调查等方向的核心素材。本文整理了目前最常用、最活跃的开源点云数据集以及对应的获取链接。

二、自动驾驶类数据集

2.1 KITTI

KITTI 是最早也是最经典的自动驾驶数据集，在德国卡尔斯鲁厄附近的市区、郊区和高速路上采集，包含双目相机图像、激光雷达点云、GPS/IMU 数据，标注了车辆、行人、骑行者、路牌等常见物体。主要用来做 3D 物体检测、语义分割、视觉里程计、光流估计这些基础任务。
网址:http://www.cvlibs.net/datasets/kitti/

2.2 SemanticKITTI

SemanticKITTI 是 KITTI 的语义升级版，把所有激光雷达点云都做了逐点标注，一共有 28 个类别（道路、车辆、行人、植被、建筑、杆子等），数据同样来自德国城市和郊区。主要用来训练和评估大规模室外点云的语义分割、实例分割和序列理解算法。
网址:http://semantic-kitti.org/

2.3 nuScenes

nuScenes 在美国波士顿和新加坡采集，提供了非常完整的传感器组合：6 个摄像头、5 个雷达、1 个激光雷达，标注了车辆、行人、骑行者、交通锥等 23 类物体，覆盖各种天气和光照条件。主要用于 3D 检测、跟踪、预测、端到端驾驶等研究。
网址:https://www.nuscenes.org/

2.4 Waymo Open Dataset

Waymo 数据集规模很大，在美国多个城市采集，包含高分辨率激光雷达、多视角摄像头图像和非常精细的 3D 标注框，标注物体有车辆、行人、骑行者、交通灯、施工区域等。主要用来做 3D 检测、跟踪、多模态融合和复杂场景的长尾行为预测。
网址:https://waymo.com/open/

2.5 PandaSet

PandaSet 是小马智行和 Hesai 合作发布的，用 Pandar64 和 PandarGT 激光雷达在美国城市道路采集，配有多视角摄像头，标注了车辆、行人、骑行者、路标、动物等。主要适合研究自动驾驶感知、物体检测和固态激光雷达相关的多传感器融合。
网址:https://pandaset.org/

2.6 Zenseact Open Dataset (ZOD)

ZOD 是 Zenseact 发布的欧洲多国数据集，用 Velodyne VLS128 + VLP16 激光雷达、雷达和摄像头采集，标注车辆、行人、骑行者、交通标志、动物等物体，覆盖大量真实道路场景。主要用于 3D 检测、跟踪、雷达-激光融合和感知鲁棒性研究。
网址:https://zod.zenseact.com/

三、物体分类与分割类数据集

3.1 ModelNet40 / ModelNet10

ModelNet 是普林斯顿大学做的合成数据集，把 CAD 模型转成点云，ModelNet40 有 40 类常见物体（椅子、桌子、飞机、汽车、瓶子等），ModelNet10 精简到 10 类。主要用来测试 3D 形状分类算法和各种点云深度学习模型的基准性能。
网址:https://modelnet.cs.princeton.edu/

3.2 ShapeNet

ShapeNet 规模更大，由斯坦福和普林斯顿联合做，包含 5 万多个 3D CAD 模型（可转点云），覆盖 55 类日常物体（飞机、椅子、灯具、汽车等），还带部件标注。主要用于形状分类、部件分割、形状补全和生成式模型训练。
网址:https://shapenet.org/

3.3 PartNet

PartNet 是 ShapeNet 的细粒度扩展，包含 2.6 万多个模型，覆盖 24 类物体（椅子、桌子、刀具、储物柜等），每个物体都有层次化的部件标注（3 个粒度级别）。主要用来做细粒度部件分割和 3D 物体结构理解。
网址:https://cs.stanford.edu/~kaichun/partnet/

四、室内场景类数据集

4.1 S3DIS

S3DIS 是斯坦福大学在美国采集的 6 个大型建筑物室内点云（办公室、会议室、走廊等），每个点都标注了 13 类标签（墙、地板、天花板、门、家具等）。主要用于室内点云语义分割、大场景理解和机器人导航。
网址:https://buildingparser.stanford.edu/dataset.html

4.2 ScanNet

ScanNet 用 RGB-D 相机在美国各种室内场景扫了很多房间，重建了点云和网格，提供了 21 类物体的语义和实例标注（床、椅子、桌子、显示器等）。主要用来做室内语义分割、实例分割、3D 重建和具身 AI 研究。
网址:http://www.scan-net.org/

4.3 Rohbau3D

Rohbau3D 是德国建筑工地真实扫描的室内点云，主要包含墙、柱、梁、楼梯、门窗开口等建筑结构元素。主要用来研究建筑场景的点云分割、组件识别和数字孪生应用。
网址:https://github.com/RauchLukas/rohbau3d

五、室外城市场景类数据集

5.1 Semantic3D

Semantic3D 用地面激光扫描仪在欧洲采集了很多室外场景（教堂、街道、广场、村庄等），总共超过 40 亿点，标注了 8 类（地面、建筑、植被、车辆等）。主要用于大规模室外点云语义分割和高精度城市场景解析。
网址:http://www.semantic3d.net/

5.2 Paris-Lille-3D

Paris-Lille-3D 用移动激光扫描车在法国巴黎和里尔街头采集，点云密度很高，标注了 10 类（道路、建筑、植被、车辆、杆子等）。主要用来做城市道路语义分割和移动激光点云处理。
网址:https://npm3d.fr/paris-lille-3d

5.3 Toronto-3D

Toronto-3D 在加拿大多伦多城市道路上用移动激光扫描采集，约 7800 万点，标注了 8 类（道路、建筑、植被、车辆等）。主要用于城市道路点云语义分割和基础设施分析。
网址:https://github.com/WeikaiTan/Toronto-3D

六、森林与植被类数据集

6.1 WHU-TLS

WHU-TLS 是武汉大学团队采集的地面激光扫描数据集，覆盖森林、公园、山地、地铁站等多种场景，总共 115 个测站、17.4 亿点。主要用来做点云配准、森林结构分析和多环境 3D 重建的基准测试。
网址:http://3s.whu.edu.cn/ybs/en/benchmark.htm

6.2 NEON Airborne LiDAR

NEON 是美国国家生态观测网络的航空激光雷达数据，覆盖全美 81 个生态站点，包括森林、草地等，标注树木、植被、地形等。主要用来提取森林参数、监测生态变化和多时相分析。
网址:https://www.neonscience.org/

6.3 BioDiv-3DTrees

BioDiv-3DTrees 采集了欧洲 19 种树木的 4952 棵单木点云（地面 TLS + 无人机 ULS），附带 3386 个 QSM 模型和图结构表示，标注树干、枝条、树冠等。主要用于单木分割、树木结构建模、生物多样性研究和 QSM 重建。
网址:https://doi.org/10.25625/8PB1IF

昇腾开源生态专区

昇腾计算产业是基于昇腾系列（HUAWEI Ascend）处理器和基础软件构建的全栈 AI计算基础设施、行业应用及服务，https://devpress.csdn.net/organization/setting/general/146749包括昇腾系列处理器、系列硬件、CANN、AI计算框架、应用使能、开发工具链、管理运维工具、行业应用及服务等全产业链

更多推荐

源码交付破局异构算力：基于GB28181/RTSP与Docker的AI视频平台架构实战

在安防行业深耕十年的架构师生涯中，我见证了无数技术团队在基础设施的泥潭中挣扎。传统的视频监控项目交付往往面临三大“拦路虎”：协议碎片化：海康、大华、宇视等厂商私有协议林立，GB28181国标对接调试周期长，RTSP/RTMP流媒体服务在高并发下稳定性难以保障。异构算力适配难：客户现场环境极其复杂，既有x86架构的NVIDIA GPU服务器，又有ARM架构的华为昇腾、瑞芯微NPU边缘盒子。为不同芯片

昇腾开源生态专区

大模型推理引擎vLLM(18): vLLM中的SBO(single batch overlapping)功能代码实现分析

昇腾开源生态专区

【vllm 】 kv cache

有KV offloading配置：先尝试CPU转移，失败后才抢占运行中请求无KV offloading配置：直接使用RECOMPUTE抢占运行中请求RECOMPUTE始终可用：作为默认的兜底机制，确保系统稳定性这种设计提供了最大的灵活性，充分利用CPU内存扩展GPU容量，同时保证在极端情况下仍能正常运行。