NeRF in the Wild: Neural Radiance Fields for Unconstrained Photo Collections

2021-07-13 2021-07-13 约 723 字预计阅读 2 分钟

<NeRF-W> Nerf in the wild: Neural radiance fields for unconstrained photo collections

CVPR2021 Proceedings of the IEEE/CVF conference on computer vision and pattern recognition

Ricardo Martin-Brualla, Noha Radwan, Mehdi SM Sajjadi, Jonathan T Barron, Alexey Dosovitskiy, Daniel Duckworth

Google

variable illumination, transient components/occluders

编者按

image-dependent appearance and illumination variations
但，static geometry 是 shared across all images
在一个学出来的低维空间建模曝光、光照、天气、后处理等；
利用Generative Latent Optimization，为每张照片单独最优化出来一个外观嵌入
- 纯隐式：就是单独为每张图片存、初始化一个 latent embedding，让color额外以这个为condition（就是 直接一起拼到MLP 上），然后最优化

allow transient objects to be jointly estimated and disentangled from a static representation of the 3D world
注意这里的话语：进一步==减少瞬态物体对稳态/静态物体表征的影响==
网络可以 identify、discount 瞬态物体的影响，从而只有稳态物体的真实渲染

并不认为每张照片都是相同地可以被依赖：让 transient field 额外 emit 一个 uncertainty
- 每个观测到的像素都是 noisy 的：aleatoric
- 这个 noise 是 input-dependent 的：heteroscedastic
将每个像素的颜色建模为一个 isotropic各向同性（即没有协方差）的正太分布
- transient network 额外以一个 image-dependent 的 latent 为 condition
- transient network 额外输出一个方差 field：$\beta_i(t)$
- 这个方差 field 以和 $\mathbf{c}$ 相似的方式渲染到像素/射线 $\mathbf{r}$ 上
- 然后用和 uncertainty 一文中一模一样的式子来涵盖不确定性
  - 回顾