如视
  • 产品
  • 解决方案
  • VR空间
  • 合作与生态
  • 服务与支持
  • 关于我们
  • 商城
  • 如视产品
    覆盖全场景,获得高画质高精度数字孪生空间
    • 采集产品
      • 伽罗华 P4NEW
        全新升级 3D激光扫描仪,极真、秒速、广域精探
      • 伽罗华 M2/P2热门
        3D 激光扫描仪,满足工厂、商业等各类大小空间采集需求
      • 庞加莱 Poincare
        手持实景扫描仪,超大空间三维重建解决方案
      • Realsee G1热门
        VR 采集云台,专为中小空间极速采集而生
      • 全景相机
        主流相机一键直连,2D 全景图自动转 3D VR
      • 手机拍 VR
        只需一部手机,随时随地记录空间,一键分享
    • 应用产品
      • VR 浏览
        让用户在 VR 场景内自由行走,全面了解空间信息
      • 虚拟展厅
        沉浸式 VR 漫游互动展示空间
      • 设计云
        家装设计师工作平台,以 AI 实现设计辅助与影视级渲染
      • 纷享家
        空间设计 AIGC 营销工具,智能的设计效果生成助手
  • 解决方案
    为你提供量身定制的数字空间综合解决方案
    • 场景类
      • 营销宣传
        VR 重构营销决策链,让每个像素都产生商业价值
      • 多维式培训
        真 3D 复刻,突破传统培训局限
      • 导航导览
        实景无界,重构空间探索体验
      • 远程协作
        打造全真协同生态,跨域协作效率跃升
      • 现场踏勘
        三维全息记录,助力踏勘效能新突破
    • 行业类
      • 房产租售热门
        打通消费者租房、购房卡点,促进商机转化
      • 商业零售
        为品牌降本提效的同时,提供场景化购物新体验
      • 展厅展馆热门
        构建线上观展体验,打破时空局限
      • 工厂园区
        数字孪生工厂大幅提高作业效率
      • 家装
        VR 记录装修全过程,AI 设计一键出方案,赋能企业营销
      • 家居家电
        构建场景化营销闭环,打通线上家居家电销售最后一公里
      • 公共事务
        全息数字化勘查,为社会公正提供证据支撑
      • 智慧量房NEW
        庞加莱智慧量房,4 分钟测量,15 分钟直出 CAD
  • 合作与生态
    携手如视,共同构建基于数字空间的全新商业形态
    • 开放能力
      • 开放平台
        共建三维生态,互联大千世界
      • 开发手册
        开发者必读,实现快速接入
      • 如视数据
        海量空间数据,开放共创
    • 商务合作
      • 联系我们热门
        专业顾问 1对1 全程服务,为您答疑解惑
      • 成为经销商
        成为如视生态合作伙伴
  • 关于我们
    为您呈现最真实的如视,了解我们、加⼊我们
    • 了解如视
      • 如视介绍
        数字空间综合解决方案引领者,致力以数字空间推动产业进化
      • 新闻媒体热门
        企业动态实时呈现,重要信息权威发布
去下载 App去制作 VR
切换语言
简体中文
English
登录注册
咨询方式
400-897-9658(工作日 9:00-19:00(北京时间))
mkt@realsee.com
如视
产品
  • 如视产品
    覆盖全场景,获得高画质高精度数字孪生空间
    • 采集产品
      • 伽罗华 P4NEW
        全新升级 3D激光扫描仪,极真、秒速、广域精探
      • 伽罗华 M2/P2热门
        3D 激光扫描仪,满足工厂、商业等各类大小空间采集需求
      • 庞加莱 Poincare
        手持实景扫描仪,超大空间三维重建解决方案
      • Realsee G1热门
        VR 采集云台,专为中小空间极速采集而生
      • 全景相机
        主流相机一键直连,2D 全景图自动转 3D VR
      • 手机拍 VR
        只需一部手机,随时随地记录空间,一键分享
    • 应用产品
      • VR 浏览
        让用户在 VR 场景内自由行走,全面了解空间信息
      • 虚拟展厅
        沉浸式 VR 漫游互动展示空间
      • 设计云
        家装设计师工作平台,以 AI 实现设计辅助与影视级渲染
      • 纷享家
        空间设计 AIGC 营销工具,智能的设计效果生成助手
购买使用
  • 伽罗华
  • 一站式制作平台
解决方案
  • 解决方案
    为你提供量身定制的数字空间综合解决方案
    • 场景类
      • 营销宣传
        VR 重构营销决策链,让每个像素都产生商业价值
      • 多维式培训
        真 3D 复刻,突破传统培训局限
      • 导航导览
        实景无界,重构空间探索体验
      • 远程协作
        打造全真协同生态,跨域协作效率跃升
      • 现场踏勘
        三维全息记录,助力踏勘效能新突破
    • 行业类
      • 房产租售热门
        打通消费者租房、购房卡点,促进商机转化
      • 商业零售
        为品牌降本提效的同时,提供场景化购物新体验
      • 展厅展馆热门
        构建线上观展体验,打破时空局限
      • 工厂园区
        数字孪生工厂大幅提高作业效率
      • 家装
        VR 记录装修全过程,AI 设计一键出方案,赋能企业营销
      • 家居家电
        构建场景化营销闭环,打通线上家居家电销售最后一公里
      • 公共事务
        全息数字化勘查,为社会公正提供证据支撑
      • 智慧量房NEW
        庞加莱智慧量房,4 分钟测量,15 分钟直出 CAD
为你推荐
  • 营销宣传
  • 展厅展馆
VR空间
合作与生态
  • 合作与生态
    携手如视,共同构建基于数字空间的全新商业形态
    • 开放能力
      • 开放平台
        共建三维生态,互联大千世界
      • 开发手册
        开发者必读,实现快速接入
      • 如视数据
        海量空间数据,开放共创
    • 商务合作
      • 联系我们热门
        专业顾问 1对1 全程服务,为您答疑解惑
      • 成为经销商
        成为如视生态合作伙伴
合作试用
  • 联系我们
  • 一站式制作平台
服务与支持
关于我们
  • 关于我们
    为您呈现最真实的如视,了解我们、加⼊我们
    • 了解如视
      • 如视介绍
        数字空间综合解决方案引领者,致力以数字空间推动产业进化
      • 新闻媒体热门
        企业动态实时呈现,重要信息权威发布
合作试用
  • 联系我们
  • 一站式制作平台
商城
  • 联系我们
  • 简体中文
    • 简体中文
    • English
  • 去制作 VR

学术成果与能力解读

EDM: Efficient Deep Feature Matching

更新于 2025年08月08日

Abstract

Recent feature matching methods have achieved remarkable performance but lack efficiency consideration. In this paper, we revisit the mainstream detector-free matching pipeline and improve all its stages considering both accuracy and efficiency. We propose an Efficient Deep feature Matching network, EDM. We first adopt a deeper CNN with fewer dimensions to extract multi-level features. Then we present a Correlation Injection Module that conducts feature transformation on high-level deep features, and progressively injects feature correlations from global to local for efficient multi-scale feature aggregation, improving both speed and performance. In the refinement stage, a novel lightweight bidirectional axis-based regression head is designed to directly predict subpixel-level correspondences from latent features, avoiding the significant computational cost of explicitly locating keypoints on high-resolution local feature heatmaps. Moreover, effective selection strategies are introduced to enhance matching accuracy. Extensive experiments show that our EDM achieves competitive matching accuracy on various benchmarks and exhibits excellent efficiency, offering valuable best practices for real-world applications.


图片1.png

Figure 1. Comparison of Matching Accuracy and Latency. Our method achieves competitive accuracy with lower latency. Models are evaluated on the ScanNet dataset to get AUC@5◦ accuracy, while the latency for an image pair with 640×480 resolution is measured on a single NVIDIA 3090 GPU.



https://vr-public.realsee-cdn.cn/release/pagepress/HrMFRAlh/uploads/cd3e2aa3-27f6-48bf-abec-81b861c75932.png

Figure 2. Pipeline Overview. (a) A deeper CNN backbone is adopted to extract multi-level feature maps. (b) In the Correlation Injection Module, we alternately apply self-attention and cross-attention a total of L times to capture and transform the correlations between deep feature FA_d and FB_d. Subsequently, two Injection Layers are employed to progressively inject feature correlations from deep to local levels.(c) After the CIM, the coarse features FA_c and FB_c are flattened and then correlated to produce the similarity matrix. To establish coarse matches, we determine the row-wise maxima in the probability matrix and select the top K values among them. (d) For fine-level matching, the corresponding fine features are extracted by the indices obtained from the coarse matching process. We treat the fine features FA_q and FB_q as queries, while considering the same features but in reversed order, FB_r and FA_r, as eferences. The query and reference features are encoded separately and then merged together. Then, a lightweight regression head is designed to estimate the reference offsets on the X and Y axes, respectively. The final matches are obtained by adding the coarse matches to their corresponding offsets.

 


https://vr-public.realsee-cdn.cn/release/pagepress/nGtpmIuU/uploads/667c7506-c27b-436e-9946-0e64cd6b87cc.png

Figure 3. Bidirectional Refinement. For a coarse matching pair, the center point of one grid serves as query for fine matching, and its corresponding reference point is offset from the center point in another grid, exhibiting duality.



https://vr-public.realsee-cdn.cn/release/pagepress/uHjkwxLl/uploads/5d3e1786-9c67-4b01-aacd-fc4821459c31.png

Table 1. Results of Relative Pose Estimation on the MegaDepth Dataset and ScanNet Dataset. The models are trained on the MegaDepth dataset to evaluate all methods on both datasets. The AUC of relative pose error at multiple thresholds, and the average inference time on the ScanNet dataset for pairwise image of 640×480 resolution is provided


 

https://vr-public.realsee-cdn.cn/release/pagepress/MBPsrSDP/uploads/4c5f5a7c-69c7-44f6-84ce-5950dfa942a6.png

.Table 2. Homography estimation on HPatches.



https://vr-public.realsee-cdn.cn/release/pagepress/kRGCVuyh/uploads/f4b498a6-c824-43c6-92f0-0c557c916ca8.png

 


Figure 4. Attention Visualization. (a) Deep correlations. The green dots represent the query points. (b) Injection weights. Significant response values usually located in detail-rich regions.


https://vr-public.realsee-cdn.cn/release/pagepress/rgIoSJyM/uploads/58fe388a-45be-4b5e-aec6-02636c739b11.png

Table 3. Comparison of image size on the MegaDepth dataset.



https://vr-public.realsee-cdn.cn/release/pagepress/bMcdtsFB/uploads/596af833-83b1-47da-9cee-d15cce6508ca.png

Table 4. Runtime comparisons for each stage on ScanNet dataset.



https://vr-public.realsee-cdn.cn/release/pagepress/xAdZztAU/uploads/1f52f638-cc72-4cae-be9e-915dfadb0d26.png

Figure 5. Qualitative Comparisons. Compared with LoFTR and EfficientLoFTR, our method is more robust in scenarios with large viewpoint changes and repetitive semantics. The red color indicates epipolar error beyond 5e-4 in the normalized image coordinates.


 

https://vr-public.realsee-cdn.cn/release/pagepress/OufTAJeO/uploads/d2eed0e7-14c6-49a4-9919-a9c93dd855c6.png

Table 5. Ablation studies on the MegaDepth dataset at all steps, with average running times measured at 1152×1152 resolution.

  • 产品
    • 伽罗华 Galois
    • 庞加莱 Poincare
    • Realsee G1
    • 手机拍 VR
  • 解决方案
    • 展厅展馆
    • 商业零售
    • 工厂园区
    • 房产租售
  • 关于我们
    • 如视介绍
    • 新闻媒体
    • 联系我们
  • 快速链接
    • 管理后台
    • 开放平台
    • 法律协议
    • 维修售后
  • 联系我们
    • 电话:400-897-9658
    • 时间:工作日 9:00-19:00(北京时间)
    • 邮箱:mkt@realsee.com
    • 地址:北京市海淀区上地六街弘源首著大厦
  • 关注我们
    扫描下方二维码关注我们公众号关注我们微博
    扫码关注我们的微信公众号
    微信公众号
如视Realsee
如你之视(北京)科技有限公司|地址:北京市海淀区信息路7号弘源首著大厦1号楼8层|电话:400-897-9658
©Copyright2024 realsee.com版权所有|营业执照|ICP|京ICP备2022009190号-3
违法和不良信息举报电话:010-8644 0676|违法和不良信息举报邮箱:complaint@realsee.com|京公网安备 11010802039437号,logo京公网安备 11010802039437号

更多 学术成果与能力解读

Multi-view Inverse Rendering for Large-scale Real-world Indoor Scenes

Multi-view Inverse Rendering for Large-scale Real-world Indoor Scenes

2024年04月25日
 PhyIR: Physics-Based Inverse Rendering for Panoramic Indoor Images

PhyIR: Physics-Based Inverse Rendering for Panoramic Indoor Images

2024年04月25日
Floorplan Generation from 3D Point Clouds: A Space Partitioning Approach

Floorplan Generation from 3D Point Clouds: A Space Partitioning Approach

2024年04月25日
查看更多