CVPR 2021 | Involution:超越 Convolution 和 Self-attention 的神经网络新算子

论坛 期权论坛     
选择匿名的用户   2021-5-23 00:55   0   0
<div id="js_content">
<p><img src="https://beijingoptbbs.oss-cn-beijing.aliyuncs.com/cs/5606289-5f630671ab80ed1827b5417a81d549e0.png"></p>
<p>本文是对我们CVPR 2021被接收的文章 Involution: Inverting the Inherence of Convolution for Visual Recognition的解读,同时也分享一些我们对网络结构设计(CNN和Transformer)的理解。这篇工作主要是我和SENet的作者胡杰一起完成的,也非常感谢HKUST的两位导师陈启峰和张潼老师的讨论。</p>
<p style="text-align: right">作者:青源研究组成员 李铎</p>
<img src="https://beijingoptbbs.oss-cn-beijing.aliyuncs.com/cs/5606289-c8afba7471e69f70b199ab8bd6375b29.png">
论文地址:arxiv.org/abs/2103.06255
<br>
<p><strong>01</strong></p>
<p style="text-align: center"><strong>概要</strong></p>
<p>我们的贡献点简单来讲:</p>
<p>(1)提出了一种新的神经网络算子(operator或op)称为<code>involution</code>,它比<code>convolution</code>更轻量更高效,形式上比<code>self-attention</code>更加简洁,可以用在各种视觉任务的模型上取得精度和效率的双重提升。</p>
<p>(2)通过<code>involution</code>的结构设计,我们能够以统一的视角来理解经典的卷积操作和近来流行的自注意力操作。</p>
<p>论文链接:https://arxiv.org/abs/2103.06255</p>
<p>代码和模型链接:https://github.com/d-li14/involution</p>
<p>欢迎大家star~ 后续有相关材料的更新会放在主页:https://duoli.org/</p>
<h2>[Motivation] 与convolution的反对称性</h2>
<blockquote>
  <p>这部分内容主要来自原文Section 2,Section 3</p>
</blockquote>
<p>普通convolution的kernel享有空间不变性(spatial-agnostic)和通道特异性(channel-specific)两大基本特性;而involution则恰恰相反,具有通道不变性(channel-agnostic)和空间特异性(spatial-specific)。</p>
<h2>convolution</h2>
<p>convolution kernel的大小写作
    <svg style="vertical-align: -0.357ex;width: 24.903ex;height: 1.952ex;" viewbox="0 -705 11007.1 862.8">
     <g fill="currentColor" stroke="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)">
      <g>
       <g>
        <path d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path>
       </g>
       <g transform="translate(722.2, 0)">
        <path d="M630 29Q630 9 609 9Q604 9 587 25T493 118L389 222L284 117Q178 13 175 11Q171 9 168 9Q160 9 154 15T147 29Q147 36 161 51T255 146L359 250L255 354Q174 435 161 449T147 471Q147 480 153 485T168 490Q173 490 175 489Q178 487 284 383L389 278L493 382Q570 459 587 475T609 491Q630 491 630 471Q630 464 620 453T522 355L418 250L522 145Q606 61 618 48T630 29Z"></path>
       </g>
       <g transform="translate(1722.4, 0)">
        <path d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path>
       </g>
       <g transform="translate(2444.7, 0)">
        <path d="M630 29Q630 9 609 9Q604 9 587 25T493 118L389 222L284 117Q178 13 175 11Q171 9 168 9Q160 9 154 15T147 29Q147 36 161 51T255 146L359 250L255 354Q174 435 161 449T147 471Q147 480 153 485T168 490Q173 490 175 489Q178 487 284 383L389 278L493 382Q570 459 587 475T609 491Q630 491 630 471Q630 464 620 453T522 355L418 250L522 145Q606 61 618 48T630 29Z"></path>
       </g>
       <g transform="translate(3444.9, 0)">
        <g>
         <path d="M50 252Q50 367 117 473T286 641T490 704Q580 704 633 653Q642 643 648 636T656 626L657 623Q660 623 684 649Q691 655 699 663T715 679T725 690L740 705H746Q760 705 760 698Q760 694 728 561Q692 422 692 421Q690 416 687 415T669 413H653Q647 419 647 422Q647 423 648 429T650 449T651 481Q651 552 619 605T510 659Q484 659 454 652T382 628T299 572T226 479Q194 422 175 346T156 222Q156 108 232 58Q280 24 350 24Q441 24 512 92T606 240Q610 253 612 255T628 257Q648 257 648 248Q648 243 647 239Q618 132 523 55T319 -22Q206 -22 128 53T50 252Z"></path>
        </g>
        <g transform="translate(715, -150) scale(0.707)">
         <path d="M201 -11Q126 -11 80 38T34 156Q34 221 64 279T146 380Q222 441 301 441Q333 441 341 440Q354 437 367 433T402 417T438 387T464 338T476 268Q476 161 390 75T201 -11ZM121 120Q121 70 147 48T206 26Q250 26 289 58T351 142Q360 163 374 216T388 308Q388 352 370 375Q346 405 306 405Q243 405 195 347Q158 303 140 230T121 120Z"></path>
        </g>
       </g>
       <g transform="translate(4775.1, 0)">
        <path d="M630 29Q630 9 609 9Q604 9 587 25T493 118L389 222L284 117Q178 13 175 11Q171 9 168 9Q160 9 154 15T147 29Q147 36 161 51T255 146L359 250L255 354Q174 435 161 449T147 471Q147 480 153 485T168 490Q173 490 175 489Q178 487 284 383L389 278L493 382Q570 459 587 475T609 491Q630 491 630 471Q630 464 620 453T522 355L418 250L522 145Q606 61 618 48T630 29Z"></path>
       </g>
       <g transform="translate(5775.3, 0)">
        <g>
         <path d="M50 252Q50 367 117 473T286 641T490 704Q580 704 633 653Q642 643 648 636T656 626L657 623Q660 623 684 649Q691 655
分享到 :
0 人收藏
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:3875789
帖子:775174
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP