TRANSFORMER (1) 코드로 이해하는 Swin Transformer 리뷰 microsoft에서 고안한 Swin Transformer: Hierarchical Vision Transformer using Shifted Windows 논문에 대한 내용을 담고 있다. 본 논문만으로는 한번에 이해 안되는 부분이 몇몇 존재 했다. (예를들어 각 윈도우 내에서의 Self-attention 결과를 어떻게 다음 단계로 넘겨주는지?) 따라서 오피셜 코드를 살펴볼 수 밖에 없었고, 논문의 이해를 돕기위한 코드에 대한 설명을 포스팅으로 공유하고자 한다. Paper, Official Github microsoft/Swin-Transformer This is an official implementation for "Swin Transformer: Hierarchical Vision Transform.. 이전 1 다음