如视
  • VR空间
  • 服务与支持
  • 商城
  • 如视产品
    覆盖全场景,获得高画质高精度数字孪生空间
    • 采集产品
      • 伽罗华 P4NEW
        全新升级 3D激光扫描仪,极真、秒速、广域精探
      • 伽罗华 M2/P2热门
        3D 激光扫描仪,满足工厂、商业等各类大小空间采集需求
      • 庞加莱 Poincare
        手持实景扫描仪,超大空间三维重建解决方案
      • Realsee G1热门
        VR 采集云台,专为中小空间极速采集而生
      • 全景相机
        主流相机一键直连,2D 全景图自动转 3D VR
      • 手机拍 VR
        只需一部手机,随时随地记录空间,一键分享
    • 应用产品
      • VR 浏览
        让用户在 VR 场景内自由行走,全面了解空间信息
      • 虚拟展厅
        沉浸式 VR 漫游互动展示空间
      • 设计云
        家装设计师工作平台,以 AI 实现设计辅助与影视级渲染
      • 纷享家
        空间设计 AIGC 营销工具,智能的设计效果生成助手
  • 解决方案
    为你提供量身定制的数字空间综合解决方案
    • 场景类
      • 营销宣传
        VR 重构营销决策链,让每个像素都产生商业价值
      • 多维式培训
        真 3D 复刻,突破传统培训局限
      • 导航导览
        实景无界 重构空间探索
    • 行业类
      • 房产租售热门
        打通消费者租房、购房卡点,促进商机转化
      • 商业零售
        为品牌降本提效的同时,提供场景化购物新体验
      • 展厅展馆热门
        构建线上观展体验,打破时空局限
      • 工厂园区
        数字孪生工厂大幅提高作业效率
      • 家装
        VR 记录装修全过程,AI 设计一键出方案,赋能企业营销
      • 家居家电
        构建"场景化"营销闭环,打通线上家居家电销售最后一公里
      • 公共事务
        全息数字化勘查,为社会公正提供证据支撑
      • 智慧量房NEW
        庞加莱智慧量房,4 分钟测量,15 分钟直出 CAD
  • 合作与生态
    携手如视,共同构建基于数字空间的全新商业形态
    • 开放能力
      • 开放平台
        共建三维生态,互联大千世界
      • 开发手册
        开发者必读,实现快速接入
    • 商务合作
      • 联系我们热门
        专业顾问 1对1 全程服务,为您答疑解惑
      • 成为经销商
        成为如视生态合作伙伴
  • 关于我们
    为您呈现最真实的如视,了解我们、加⼊我们
    • 了解如视
      • 如视介绍
        数字空间综合解决方案引领者,致力以数字空间推动产业进化
      • 新闻媒体热门
        企业动态实时呈现,重要信息权威发布
去下载 App去制作 VR
切换语言
简体中文
English
登录注册
咨询方式
400-897-9658(工作日 9:00-19:00(北京时间))
mkt@realsee.com
如视
产品
  • 如视产品
    覆盖全场景,获得高画质高精度数字孪生空间
    • 采集产品
      • 伽罗华 P4NEW
        全新升级 3D激光扫描仪,极真、秒速、广域精探
      • 伽罗华 M2/P2热门
        3D 激光扫描仪,满足工厂、商业等各类大小空间采集需求
      • 庞加莱 Poincare
        手持实景扫描仪,超大空间三维重建解决方案
      • Realsee G1热门
        VR 采集云台,专为中小空间极速采集而生
      • 全景相机
        主流相机一键直连,2D 全景图自动转 3D VR
      • 手机拍 VR
        只需一部手机,随时随地记录空间,一键分享
    • 应用产品
      • VR 浏览
        让用户在 VR 场景内自由行走,全面了解空间信息
      • 虚拟展厅
        沉浸式 VR 漫游互动展示空间
      • 设计云
        家装设计师工作平台,以 AI 实现设计辅助与影视级渲染
      • 纷享家
        空间设计 AIGC 营销工具,智能的设计效果生成助手
购买使用
  • 伽罗华
  • 一站式制作平台
解决方案
  • 解决方案
    为你提供量身定制的数字空间综合解决方案
    • 场景类
      • 营销宣传
        VR 重构营销决策链,让每个像素都产生商业价值
      • 多维式培训
        真 3D 复刻,突破传统培训局限
      • 导航导览
        实景无界 重构空间探索
    • 行业类
      • 房产租售热门
        打通消费者租房、购房卡点,促进商机转化
      • 商业零售
        为品牌降本提效的同时,提供场景化购物新体验
      • 展厅展馆热门
        构建线上观展体验,打破时空局限
      • 工厂园区
        数字孪生工厂大幅提高作业效率
      • 家装
        VR 记录装修全过程,AI 设计一键出方案,赋能企业营销
      • 家居家电
        构建"场景化"营销闭环,打通线上家居家电销售最后一公里
      • 公共事务
        全息数字化勘查,为社会公正提供证据支撑
      • 智慧量房NEW
        庞加莱智慧量房,4 分钟测量,15 分钟直出 CAD
为你推荐
  • 营销宣传
  • 展厅展馆
VR空间
合作与生态
  • 合作与生态
    携手如视,共同构建基于数字空间的全新商业形态
    • 开放能力
      • 开放平台
        共建三维生态,互联大千世界
      • 开发手册
        开发者必读,实现快速接入
    • 商务合作
      • 联系我们热门
        专业顾问 1对1 全程服务,为您答疑解惑
      • 成为经销商
        成为如视生态合作伙伴
合作试用
  • 联系我们
  • 一站式制作平台
服务与支持
关于我们
  • 关于我们
    为您呈现最真实的如视,了解我们、加⼊我们
    • 了解如视
      • 如视介绍
        数字空间综合解决方案引领者,致力以数字空间推动产业进化
      • 新闻媒体热门
        企业动态实时呈现,重要信息权威发布
合作试用
  • 联系我们
  • 一站式制作平台
商城
  • 联系我们
  • 简体中文
    • 简体中文
    • English
  • 去制作 VR

学术成果与能力解读

3D物品检测算法及应用

在图像上进行2D物品检测,在学术界已有较多的研究,在工业界也有成熟的应用。但是物理空间实际是3D的,在与空间数字化紧密相连的一些应用中,业务往往还需要关注物品的3D位置。针对数据获取成本和数据处理难度问题,如视都进行了研究并积累了较多成果。
更新于 2024年04月26日

1 背景概述

在图像上进行2D物品检测,在学术界已有较多的研究,在工业界也有成熟的应用。但是物理空间实际是3D的,在与空间数字化紧密相连的一些应用中,业务往往还需要关注物品的3D位置。通常限制3D物品检测算法及应用的两个原因如下:

a) 数据获取成本

在摄像头非常普及的当下,图像获取是非常容易的。但是带3D信息的深度图或点云获取,则更专业和稀少。

b) 数据处理难度

图像数据本质是规则排列的像素,而3D数据的分布是不规则的:有的稀疏、有的稠密;遮挡部分数据缺失等。不规则的数据格式增加了处理难度。

针对上述问题,如视都进行了研究并积累了较多成果。如视采集了千万量级套数的室内场景数据,利用Galois激光扫描采集点云,或大数据训练的智能算法估算深度,大量的数据为3D检测提供了坚实的基础。在3D检测算法方面,研究、实现多种技术路线,针对不同的需求。

2 算法介绍

在不同的需求中,输入的数据、要求的精度都有差异。可以选择不同的技术路线实现3D物品检测。

2.1 级联式检测(Cascaded Detection)

级联式检测即把整个数据处理流程分为两级并串联:第一级使用图像2D检测;第二级再加入深度图,计算3D物品包围盒的位置。其中,第二级中还可利用相机多视约束关系(Multi-View Constraint),对结果进一步筛选和优化。

这种算法的最大优势是可以直接利用成熟的2D检测结果,但是在提出候选物品时只用到了图像,对深度图或点云包含的物品几何特征没有充分发掘利用。


级联式检测流程
级联式检测流程


2.2 基于点云的检测(Point Cloud based Detection)

物品及场景的3D点云,由于不是规则排列的数据,很难像图像那样直接输入神经网络。早期的研究倾向于把3D点云投影到2D图像上,或者对点云进行规则的体素化(Voxelization)后再处理。但这些方法都有量化误差(Quantization Error),让点云失去了原始的精度。

随着 PointNet[1] 及 PointNet++[2] 系列研究开始,算法可以直接从3D点云上提取特征,其中使用一个对称函数(Symmetric Function)对多个点的特征进行一次聚合(Aggregate),使提取的特征具有排列不变性(Permutation Invariance)。这样就能对不规则数据提取稳定的特征。

如视使用 PointNet 为骨干(Backbone)的神经网络提取室内场景点云的特征,再通过物品候选、分类的神经网络,推算家具、电器等物品的3D包围盒。本算法直接对点云进行处理,结果的形状、位置等比级联式算法更加贴合采集的3D数据。


基于点云的检测流程
基于点云的检测流程


2.3 多模态融合检测(Detection with Multi-Modal Fusion)

单独使用2D图像或者3D点云提出候选物品,都属于单模态检测。它们各自都有一定的局限性:图像不包含准确的3D信息;而点云不包含物品高频的纹理特征。只用图像提出候选物品,则最终的3D位置、尺寸偏差可能较大;只用点云提出候选物品,则难以区分几何外形类似、但实际不同的物品(例如餐桌和办公桌、冰箱和尺寸类似的柜子)。

我们使用多模态融合的检测,即指在物品候选阶段就同时使用从2D图像上提取的纹理特征以及从3D点云中提取的几何特征。把两方面的特征连接在一起后,再通过联合的物品候选、分类的神经网络,推算家具、电器等物品的3D包围盒。

“简单粗暴”地把更多模态的数据堆叠在一起,理论上可以让算法的上限更高,但在工程实践中,可能造成算法模型的过度拟合[3]。为了解决这些问题,我们需要针对性的调整多模态的权重比例,引入多模态联合损失函数(Multi-Modal Joint Loss)、单模态辅助损失函数(Uni-Modal Auxiliary Loss)等,使训练的算法模型能够达到比较理想的状态。最终结果优于单模态算法。


多模态融合检测流程
多模态融合检测流程


3 行业应用

与空间数字化相关的很多业务,都需要识别或标注目标物体的位置、尺寸、角度等。3D物品检测算法可以被封装成一个基础服务,提供给更外层的应用。以下提供两个应用示例。

3.1 为AI家装设计提供参考方案

通常而言,AI家装设计需要采用复杂的规则或者推荐算法,对家具的摆放位置进行推理。但从另外一个角度来说,如视已经采集了海量的新房样板间数据,其中包含不同户型、不同家具的真实摆放方案,可以为AI设计算法的训练提供参考。而这些真实方案的获取需要依赖人工标注家具位置或者自动的3D物品检测算法。显然,自动算法能够极大提高数据处理流程的效率。


3D物品检测提取真实设计方案
3D物品检测提取真实设计方案


3.2 助力工业设备数字化管理

在某些工业设备区域,企业不仅需要可视化的查看,还需要精确地标注具体设备,录入数字化管理系统。而3D物品检测算法可以降低人工标注工作量,提升运营效率。


某厂房3D物品检测用于数字化管理
某厂房3D物品检测用于数字化管理


4 论文引用

[1] [Charles R. Qi et al. 2017] PointNet: Deep Learning on Point Sets for 3D Classification and Segmentation

[2] [Charles R. Qi et al. 2017] PointNet++: Deep Hierarchical Feature Learning on Point Sets in a Metric Space

[3] [Weiyao Wang et al. 2020] What Makes Training Multi-modal Classification Networks Hard?

  • 产品
    伽罗华 Galois庞加莱 PoincareRealsee G1手机拍 VR
  • 解决方案
    展厅展馆商业零售工厂园区房产租售
  • 关于我们
    如视介绍新闻媒体联系我们
  • 快速链接
    管理后台开放平台法律协议维修售后
  • 联系我们
    电话:400-897-9658时间:工作日 9:00-19:00(北京时间)邮箱:mkt@realsee.com地址:北京市海淀区上地六街弘源首著大厦
  • 关注我们
    关注我们微信
    关注我们微信

    如视公众号

    关注我们微博
如视Realsee
如你之视(北京)科技有限公司|地址:北京市海淀区信息路7号弘源首著大厦1号楼8层|电话:400-897-9658
©Copyright2024 realsee.com版权所有|营业执照|ICP|京ICP备2022009190号-3
违法和不良信息举报电话:010-8644 0676|违法和不良信息举报邮箱:complaint@realsee.com|京公网安备 11010802039437号,logo京公网安备 11010802039437号

更多 学术成果与能力解读

Multi-view Inverse Rendering for Large-scale Real-world Indoor Scenes

Multi-view Inverse Rendering for Large-scale Real-world Indoor Scenes

2024年04月25日
 PhyIR: Physics-Based Inverse Rendering for Panoramic Indoor Images

PhyIR: Physics-Based Inverse Rendering for Panoramic Indoor Images

2024年04月25日
Floorplan Generation from 3D Point Clouds: A Space Partitioning Approach

Floorplan Generation from 3D Point Clouds: A Space Partitioning Approach

2024年04月25日
查看更多