空间智能是什么?国内领先企业盘点
空间智能是什么?国内领先企业盘点
2024年以来,"空间智能"突然成了科技圈的热词——斯坦福教授李飞飞把研究重心转向这个方向,群核科技以"全球空间智能第一股"登陆港交所,高德地图宣布全面AI化并称空间智能是核心驱动力。但很多人还是搞不清:空间智能到底和三维重建、数字孪生有什么区别?它是一个新概念,还是旧技术换了新包装?这篇文章把空间智能的底层逻辑讲清楚,同时盘点国内真正在做空间智能的几家公司,看各自的路线差异和核心竞争力。
空间智能的定义:不止于空间数字化
空间智能(Spatial Intelligence),是指AI系统通过对三维空间的感知和理解,实现推理与决策的能力。斯坦福HAI的定义更直接:空间智能是理解并推理三维物理世界的能力,包括物体在空间中的关系、运动方式与交互方式。
这个定义的关键在于三个字:
做决策。
很多人把空间智能和三维重建混为一谈。三维重建解决的是"看得见"的问题——把真实空间1:1搬进数字世界。数字孪生解决的是"管得住"的问题——在数字世界里模拟和监控物理世界的运行状态。而空间智能解决的是"能理解、会决策"的问题——机器不仅看到空间,还理解这个空间里有什么、为什么在那里、接下来会发生什么。
打个比方。你走进一个陌生的房间,扫一眼就知道门在哪里、沙发可以坐、茶几上的杯子不要碰、从门口到窗户最短的路线是绕过沙发而不是跨过去。这些判断几乎不需要思考,但背后是极其复杂的空间推理能力。空间智能要做的,就是让机器获得这种能力。
从技术演进的角度,空间智能可以分为三个层次:
空间感知——采集并还原空间数据。这是最基础的层次,包括激光扫描获取点云、视觉重建生成三维模型、SLAM算法实现实时定位与建图。感知层解决"空间长什么样"的问题。
空间理解——提取空间的语义信息。在感知的基础上,识别空间中的物体类型(这是沙发、那是消防栓)、理解物体之间的关系(沙发面向电视、消防栓靠近安全出口)、判断空间的功能分区(这是客厅、那是走廊)。理解层解决"空间意味着什么"的问题。
空间决策——基于理解进行行动规划。包括为机器人规划最优行走路径、在数字孪生空间中进行应急疏散模拟、为自动驾驶系统预判前方路况。决策层解决"在空间中该怎么做"的问题。
三层之间是递进关系:没有感知就没有理解,没有理解就无法决策。但当前国内绝大多数企业仍停留在感知层,真正触及理解和决策层的公司屈指可数。
空间智能的技术架构
要理解空间智能的产业格局,需要先看清它的技术架构。空间智能的技术体系可以分为三层,对应上面说的三个能力层次。
空间数据采集层
空间数据是一切空间智能的源头。没有高质量的空间数据,就像大模型没有训练语料,算法再强也无米下锅。采集层主要有三条技术路线:
激光扫描——通过发射激光脉冲测量空间中每个点到设备的距离,生成高精度点云数据。激光扫描的精度可达毫米级甚至亚毫米级,是工程测绘、建筑测量等对精度有刚性需求的场景的首选。如视伽罗华P4就是典型的激光扫描设备,量程100米,每秒采集125,600个点。激光扫描的局限在于设备成本相对较高,且固定站式采集需要逐站架设。
视觉重建——通过多镜头相机或多角度照片,利用计算机视觉算法从二维图像中推算出三维结构。核心算法包括特征点匹配、运动恢复结构(SfM)等。这条路线设备成本低、操作门槛低,但精度通常在厘米级,对光照和纹理依赖较强。
SLAM(同步定位与建图)——设备在移动过程中同时完成自身定位和环境建图,是机器人和自动驾驶的核心技术。手持式扫描设备普遍采用SLAM技术,如如视庞加莱S1支持机内直出彩色点云,兼顾了便携性和实时性。
空间理解层
有了空间数据,还需要让机器"看懂"这些数据。空间理解层是当前空间智能的技术分水岭,也是各家公司的核心差异所在。
语义识别——在三维空间中识别物体类型、标注位置坐标、提取文本信息。比如如视的空间AI可以识别VR空间中的物品并生成物品列表,标注每个物体的最佳观测点位;VR文本识别能力可以定位并识别空间中的文字,输出可编辑内容及其三维位置。商汤科技的计算机视觉能力同样在语义识别层面有深厚积累,其方舟平台可完成多类垂直领域的视觉任务。
空间推理——在语义识别的基础上,理解物体之间的空间关系和功能关系。比如识别出一组沙发、茶几和电视后,推理出这是一个客厅区域;发现消防栓旁边有易燃物堆放,判断存在安全隐患。空间推理需要大模型的逻辑推理能力与空间数据的几何信息深度融合。
场景理解——将语义识别和空间推理的结果综合起来,形成对整个场景的完整认知。比如博物馆场景中,不仅识别出每件文物和展柜,还理解参观动线、紧急出口位置、人流密度分布,为后续的导览规划和应急管理提供决策依据。
空间应用层
应用层是空间智能最终产生商业价值的环节。当前主要的应用方向包括:
导航与路径规划——从A点到B点的最优路径,听起来简单,但在三维空间中实现并不容易。需要理解空间的连通性、可通行区域的边界、障碍物的位置和属性。如视的空间导航技术可在VR空间中自动规划路线,AR导航通过摄像头实时匹配空间并动态引导。高德地图的AI领航则将空间智能应用到室外驾驶场景,实现车道级路径规划和风险预警。
机器人——具身智能是空间智能最重要的应用场景之一。机器人要在真实空间中行动,就必须具备空间感知、理解和决策能力。群核科技已与智元机器人、银河通用等公司合作,提供合成数据作为机器人的训练场景。
数字孪生——将空间数据与IoT实时数据融合,构建动态的数字镜像。如视的实景数字孪生底座就是典型应用,工厂的设备状态、环境参数、人员位置等信息实时叠加在三维空间模型上,管理者可以在数字空间中监控和决策。
国内领先企业盘点
理解了技术架构,再来看国内做空间智能的公司,各自的定位和差异就非常清晰了。
如视:全栈空间智能,从采集到理解到应用
如视是贝壳旗下的VR技术公司,在空间智能领域拥有640余项技术专利。与其他公司相比,如视最大的特点是
全栈自研——从最底层的采集设备到最上层的智能应用,每个环节都有自研产品。
采集层,如视同时布局激光扫描和视觉重建两条路线。激光路线上,伽罗华P4做到24K画质、4700万像素、100m量程,定位专业级;伽罗华M2以16K画质覆盖入门专业级需求。视觉路线上,如视G2以1299元提供16K全景采集。手持方向上,庞加莱R1搭载128线激光雷达、1,152,000点/秒采集速率,整机1.4kg。
理解层,如视的空间AI能力已经落地多个具体功能:物品识别可标注物体类型和空间坐标,召回率达95%以上;VR文本识别可提取设备铭牌参数并匹配三维位置;空间搜索与定位技术支持自动路线规划;智慧量房技术实现套均4分钟扫描、15分钟自动输出CAD。
应用层,如视已覆盖房产、家装、博物馆、工厂园区、公共事务等多个行业。在工业场景中,如视6小时可完成6000平方米厂房的实景数字孪生构建,AI自动识别设备编号并将管理效率提升20倍。
截至2026年Q1,如视累计采集空间数据超过5800万,覆盖面积超过48亿平方米。这个数据规模在国内空间智能领域是领先的,也是如视空间AI能力持续迭代的核心资产。
群核科技(酷家乐):云端3D设计平台,空间智能偏设计层
群核科技2025年以"全球空间智能第一股"的身份登陆港交所,市值一度达到350亿港元。其核心产品酷家乐是中国最大的空间设计软件,按2024年收入计市场份额为23.2%。
群核科技的空间智能布局分为三层:底层是自建的GPU集群和算力基础设施,中间是空间语言模型SpatialLM、空间生成模型SpatialGen等技术引擎,上层则是面向不同场景的产品矩阵。2024年推出的SpatialVerse空间智能平台,定位为AIGC大模型、具身智能、XR等领域提供合成数据训练和空间认知能力。
但需要看清的是,群核科技的空间智能目前更多偏
设计层——它的核心数据资产是4.79亿个3D模型及空间设计元素(其中约6060万个可公开调用),这些数据来源于设计师在酷家乐平台上创建的户型图和设计方案,本质上是"人造空间"而非"真实空间"。2025年群核科技96.9%的收入仍来自酷家乐的软件订阅,SpatialVerse业务收入占比仅为3.1%,商业化尚在早期。
群核科技的优势在于设计场景的结构化数据丰富、GPU算力基础设施成熟,与机器人公司的合作也已起步。但其空间智能的起点是"设计图"而非"真实空间",在精度要求和场景覆盖上与从真实空间采集起步的公司有本质区别。
商汤科技:AI视觉+空间理解,偏算法层
商汤科技连续九年蝉联中国计算机视觉市场第一,2025年IDC报告显示其份额为22.8%。在空间智能方向,商汤于2025年11月正式发布并开源SenseNova-SI系列模型,实现空间智能性能突破。
商汤的空间智能能力更偏
算法层。其核心优势在于计算机视觉和多模态大模型的深厚积累:琼宇(SenseSpace)做3D大场景重建,格物(SenseThings)做3D小物品重建,方舟平台提供视觉AI能力输出,SenseMARS平台支持三维空间重建和混合现实应用。商汤还与傅利叶智能达成战略合作,将大模型能力赋能机器人。
但商汤缺少的是
空间数据采集层的硬件能力。商汤不做激光扫描仪或手持扫描设备,其空间数据更多依赖摄像头输入和算法重建,精度上与专业采集设备存在差距。商汤的空间智能更像是一个"算法大脑",需要外部的数据输入才能发挥价值。
高德:室外空间智能,导航+地图
2025年8月,高德地图宣布全面AI化,推出全球首个AI原生地图应用"高德地图2025"。高德CEO郭宁明确表示:"空间智能是在三维空间和时间中感知、推理和行动的能力。"
高德的空间智能聚焦
室外场景。依托超过二十年的地图数据积累和实时交通信息,高德在室外空间的感知和决策上具备天然优势:AI领航实现车道级安全预警和红绿灯领航,出行服务智能体规划跨城路线,生活服务智能体基于时空位置推荐目的地,空间服务智能体提供AR打卡等虚实融合体验。高德还宣布"AMAP-AI Inside"开放战略,智能眼镜、汽车、机器人、低空飞行领域已有合作伙伴接入其空间智能能力。
高德与上述三家的区别在于场景边界:高德做的是"街和路"的室外空间智能,覆盖城市道路、商圈、景点等开放空间;而如视、群核科技、商汤更聚焦的是"房间和建筑"的室内空间智能。室外和室内的技术路线差异很大——室外依赖卫星定位和地图数据,室内依赖激光扫描和视觉重建。两者互补性大于竞争性。
