Compositionally Generalizable 3D Structure Prediction

2020-12-30 2020-12-30 约 1484 字预计阅读 3 分钟

Compositionally generalizable 3D structure prediction

arXiv preprint arXiv:2012.02493

Songfang Han, Jiayuan Gu, Kaichun Mo, Li Yi, Siyu Hu, Xuejin Chen, Hao Su

UCSD, USTC, Stanford Google

object parts, single view, partnet dataset

编者按

用geometry primitives来代表部件（具体来说，oriented bounding cuboids，长方体），每个部件有 $p_i=[c_x,c_y,c_z,s_x,s_y,s_z,q]$
- 遵循StructureNet的设定
  Structurenet: Hierarchical graph networks for 3d shape generation 2019
所有模块都是有监督的；part真值来自于PartNet的3D labels
步骤：
- MaskRCNN来提取部件instance mask
- identify parallelism for part pairs，对每组平行的部件预测他们共享的edge direction
- identify translational symmetry within part pairs，对每组平动对称的部件预测他们共享的edge length
- 预测部件pairs之间的连接性，提取一个基于连接性的部件树
- 预测邻接部件的相对位置，在遍历部件树的时候组装整个形状
[isolation principle] 重度依赖部件masks作为模块的输入来引起对局部区域的关注
[relativity principle] 依赖于pairwise关系

主要用的是基于连接性的关系
首先识别空间上接触的部件pair，然后预测他们之间的相对位置
选择【接触关系】原因：
- 接触的部件空间上接近，互相之间有strong arrangement constraints
- 当没有遮挡情况下，评估两个部件有没有接触在图像上都不太难，并不需要类别级别的知识
- 这种关系非常普遍
- 对于新类别的物体也可以很好地迁移
==思考==
- 这里的想法和我们非常一致，我们扩展到更多类型的关系应该就可以实现
主要方法
- 训练一个连接性分类器，预测parts pair是否在原来的3D shape 互相接触
- 用连接性类构建一个part tree
  - 首先构建一个连接图，把连接性分数高的pair连接起来
  - 然后贪婪地构建一个spanning tree
    - 具体：通过预测出的大小，选最大的part作为root node，然后迭代地选剩下的最大的部件连到当前树上
    - 如果图中包含多个连接起来的components，那就构建part forest