解读 | 2019年10篇计算机视觉精选论文(上)

论坛 期权论坛     
匿名技术用户   2021-1-15 14:55   381   0
<div id="js_content">
<p><img src="https://201907.oss-cn-shanghai.aliyuncs.com/cs/5606289-955c9c7b0d93a217a3ee0bebb1bc9bed" width="960"></p>
<p>作者 | 神经小兮</p>
<p>来源 | HyperAI超神经(ID:HyperAI)</p>
<p>2019 年转眼已经接近尾声,我们看到,这一年计算机视觉(CV)领域又诞生了大量出色的论文,提出了许多新颖的架构和方法,进一步提高了视觉系统的感知和生成能力。因此,我们精选了 2019 年十大 CV 研究论文,帮你了解该领域的最新趋势。</p>
<p>我们看到,近年来,计算机视觉(CV)系统已经逐渐成功地应用在医疗保健,安防,运输,零售,银行,农业等领域,也正在逐渐改变整个行业的面貌。<br></p>
<p style="text-align: center"><img src="https://201907.oss-cn-shanghai.aliyuncs.com/cs/5606289-406d6c3757679c2c1db3ff9617ee465f" width="1280"></p>
<p>而今年,CV 领域依然硕果累累,诞生了多篇优秀论文。我们选择了其中十篇论文,以供大家参考、学习,了解该领域的最新趋势与前沿技术。</p>
<p>这十篇论文涵盖了卷积网络的优化,计算机视觉中的无监督学习,图像生成和机器生成图像的评估,视觉语言导航,使用自然语言为两个图像标注变化等。</p>
<p>以下是我们精选的 10 篇论文目录,先一睹为快:</p>
<p>1.EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks</p>
<p><strong>EfficientNet:</strong><strong></strong><strong></strong><strong></strong><strong>卷积神经网络模型缩放的反思</strong><strong></strong></p>
<p>2.Learning the Depths of Moving People by Watching Frozen People</p>
<p><strong>通过观看静止的人来学习移动的人的深度</strong><strong></strong></p>
<p>3.Reinforced Cross-Modal Matching and Self-Supervised Imitation Learning for Vision-Language Navigation</p>
<p><strong>增强的跨模态匹配和自我监督的模仿学习,用于视觉语言导航</strong><strong></strong></p>
<p>4.A Theory of Fermat Paths for Non-Line-of-Sight Shape Reconstruction</p>
<p><strong>非视线形状重构的费马路径理论</strong><strong></strong></p>
<p>5.Reasoning-RCNN: Unifying Adaptive Global Reasoning into Large-scale Object Detection</p>
<p><strong>Reasoning-RCNN:</strong><strong></strong><strong></strong><strong></strong><strong>将自适应全局推理统一到大规模目标检测中</strong><strong></strong></p>
<p style="text-align: left">6.Fixing the Train-Test Resolution Discrepancy</p>
<p><strong>修复训练测试分辨率差异</strong><strong></strong></p>
<p>7.SinGAN: Learning a Generative Model from a Single Natural Image</p>
<p><strong>SinGAN:</strong><strong></strong><strong></strong><strong></strong><strong>从单个自然图像中学习生成模型</strong><strong></strong></p>
<p>8.Local Aggregation for Unsupervised Learning of Visual Embeddings</p>
<p><strong>视觉聚合的无监督学习的局部聚合</strong><strong></strong></p>
<p>9.Robust Change Captioning</p>
<p><strong>强大的更改字幕</strong><strong></strong></p>
<p>10.HYPE: A Benchmark for Human eYe Perceptual Evaluation of Generative Models</p>
<p><strong>HYPE:</strong><strong></strong><strong></strong><strong></strong><strong>人类对生成模型的 eYe 感知评估的基准</strong><strong></strong></p>
<p>接下来,我们将从核心思想、关键成就、未来技术应用等方面,详细介绍这 10 篇论文。限于篇幅,我们将解读分为上、中、下三个篇章,欢迎大家持续关注后续内容推送。</p>
<p>1</p>
<p style="text-align: center"><img src="https://201907.oss-cn-shanghai.aliyuncs.com/cs/5606289-1d14bcde194c037739470862cd85f6ed" width="700"></p>
<p style="text-align: center"><strong>《EfficientNet:</strong><strong></strong><strong></strong><strong></strong><strong>卷积神经网络模型缩放的反思》</strong><strong></strong></p>
<p style="text-align: center"><strong>论文地址:</strong><strong></strong><strong></strong><strong></strong><strong>https://arxiv.o</strong><strong>rg/pdf/1905.11946.pdf</strong><strong></strong></p>
<p><strong> 摘要 </strong></p>
<p>卷积神经网络(ConvNets)通常是在固定资源预算下开发的,如果有更多资源可用,则会进行扩展以获得更高的精度。在本文中,我们系统地研究了模型缩放,并发现仔细平衡网络的深度,宽度和分辨率,可以带来更好的性能。基于此观察结果,我们提出了一种新的缩放方法,该方法使用简单而高效的复合系数来均匀缩放深度/宽度/分辨率的所有维度。我们证明了此方法在扩展 MobileNets 和 ResNet 方面的有效性。</p>
<p>更进一步,我们使用神经体系结构搜索来设计一个新的基准网络,并对其进行扩展以获得称为 EfficientNets 的模型系列,该模型系列比以前的 ConvNets 具有更高的准确性和效率。特别是,我们的 EfficientNe
分享到 :
0 人收藏
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:7942463
帖子:1588486
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP