研究目的
位姿估计问题是机器人学、计算机图形学、摄影测量学和计算机视觉中的核心问题之一。在机器人学中,位姿估计常用于手眼协调系统。在计算机图形学中,位姿估计在将计算机生成对象与摄影场景相结合的任务中起着重要作用,例如增强现实中确定头部姿态的地标跟踪或对象的交互式操作。在摄影测量学和计算机视觉中,位姿估计是三维重建和物体识别过程的核心。
研究成果
本文提出了一种完整的框架,用于估计多视角图像的位姿。在该框架下,可以恢复无序或有序多视角图像的内参相机和位姿参数。鲁棒的近似单应性估计是关键环节,它能为光束平差法提供良好的初始参数,并将无序多视角图像转换为有序多视角图像。该方法重点在于获取带尺度信息的内参相机和位姿参数,并通过光束平差法提高这些参数的精度。
研究不足
该方法在实际应用中可能存在若干局限性:(1) 运动恢复结构(SfM)仅能估算各相机的相对位姿而无法获取尺度信息;虽然SfM可恢复非退化配置下的内参,但该过程可能不稳定;(2) 多视图图像的相对位姿可通过SfM获取。当图像带有地理参考标记时,可通过相似变换获得绝对位姿。然而若相对位姿精度较低,则无法获得高精度的绝对位姿。