使用LSTM学习多视图表示以进行3D形状识别和检索

时间:2024-05-06 20:21:10
【文件属性】:

文件名称:使用LSTM学习多视图表示以进行3D形状识别和检索

文件大小:2.1MB

文件格式:PDF

更新时间:2024-05-06 20:21:10

3D shape, multi-view, object recognition,

3D模型的形状表示是计算机视觉,多媒体分析和计算机图形学中的重要主题。 最近的基于多视图的方法展示了3D形状识别和检索的有希望的性能。 然而,大多数基于多视图的方法忽略了多视图的相关性或遭受高计算成本。 在本文中,我们提出了一种新颖的基于多视图的3D形状识别和检索网络架构器。 我们的网络将卷积神经网络(CNN)与长期短期记忆(LSTM)结合在一起,可以从多个视图中利用相关信息。 训练有素的带有残留连接的CNN首先用于提取从3D形状渲染的每个视图图像的低级特征。 然后,使用LSTM和序列投票层将这些特征聚合为形状描述符。 高速公路网络和三步训练策略也被采用来促进深层网络的优化。 在两个公共数据集上的实验结果表明,该方法在3D形状识别和3D形状检索方面都具有良好的表现。


网友评论