解读 | 2019年10篇计算机视觉精选论文（上）

<div id="js_content">
<img src="https://201907.oss-cn-shanghai.aliyuncs.com/cs/5606289-955c9c7b0d93a217a3ee0bebb1bc9bed" width="960">
作者 | 神经小兮
来源 | HyperAI超神经（ID:HyperAI）
2019 年转眼已经接近尾声，我们看到，这一年计算机视觉（CV）领域又诞生了大量出色的论文，提出了许多新颖的架构和方法，进一步提高了视觉系统的感知和生成能力。因此，我们精选了 2019 年十大 CV 研究论文，帮你了解该领域的最新趋势。
我们看到，近年来，计算机视觉（CV）系统已经逐渐成功地应用在医疗保健，安防，运输，零售，银行，农业等领域，也正在逐渐改变整个行业的面貌。 
<img src="https://201907.oss-cn-shanghai.aliyuncs.com/cs/5606289-406d6c3757679c2c1db3ff9617ee465f" width="1280">
而今年，CV 领域依然硕果累累，诞生了多篇优秀论文。我们选择了其中十篇论文，以供大家参考、学习，了解该领域的最新趋势与前沿技术。
这十篇论文涵盖了卷积网络的优化，计算机视觉中的无监督学习，图像生成和机器生成图像的评估，视觉语言导航，使用自然语言为两个图像标注变化等。
以下是我们精选的 10 篇论文目录，先一睹为快：
1.EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks
EfficientNet：卷积神经网络模型缩放的反思
2.Learning the Depths of Moving People by Watching Frozen People
通过观看静止的人来学习移动的人的深度
3.Reinforced Cross-Modal Matching and Self-Supervised Imitation Learning for Vision-Language Navigation
增强的跨模态匹配和自我监督的模仿学习，用于视觉语言导航
4.A Theory of Fermat Paths for Non-Line-of-Sight Shape Reconstruction
非视线形状重构的费马路径理论
5.Reasoning-RCNN: Unifying Adaptive Global Reasoning into Large-scale Object Detection
Reasoning-RCNN：将自适应全局推理统一到大规模目标检测中
6.Fixing the Train-Test Resolution Discrepancy
修复训练测试分辨率差异
7.SinGAN: Learning a Generative Model from a Single Natural Image
SinGAN：从单个自然图像中学习生成模型
8.Local Aggregation for Unsupervised Learning of Visual Embeddings
视觉聚合的无监督学习的局部聚合
9.Robust Change Captioning
强大的更改字幕
10.HYPE: A Benchmark for Human eYe Perceptual Evaluation of Generative Models
HYPE：人类对生成模型的 eYe 感知评估的基准
接下来，我们将从核心思想、关键成就、未来技术应用等方面，详细介绍这 10 篇论文。限于篇幅，我们将解读分为上、中、下三个篇章，欢迎大家持续关注后续内容推送。
1
<img src="https://201907.oss-cn-shanghai.aliyuncs.com/cs/5606289-1d14bcde194c037739470862cd85f6ed" width="700">
《EfficientNet：卷积神经网络模型缩放的反思》
论文地址：https://arxiv.org/pdf/1905.11946.pdf
 摘要 
卷积神经网络（ConvNets）通常是在固定资源预算下开发的，如果有更多资源可用，则会进行扩展以获得更高的精度。在本文中，我们系统地研究了模型缩放，并发现仔细平衡网络的深度，宽度和分辨率，可以带来更好的性能。基于此观察结果，我们提出了一种新的缩放方法，该方法使用简单而高效的复合系数来均匀缩放深度/宽度/分辨率的所有维度。我们证明了此方法在扩展 MobileNets 和 ResNet 方面的有效性。
更进一步，我们使用神经体系结构搜索来设计一个新的基准网络，并对其进行扩展以获得称为 EfficientNets 的模型系列，该模型系列比以前的 ConvNets 具有更高的准确性和效率。特别是，我们的 EfficientNe

解读 | 2019年10篇计算机视觉精选论文（上）

浏览过的版块