<aside> 💡 P Stage3에서 Segmentation, Detection 대회를 진행하면서 성능과 효율 두 마리 토끼를 다 잡을 수 있었던 EfficientDet 모델을 알게 되었고, 어떤 아이디어에서부터 시작됐는지, 어떻게 두 마리 토끼를 다 잡을 수 있었는지 알아보고 대회에 적용해보기 위해 논문을 찾아 봄.

</aside>

EfficientDet을 알기 위해서는 우선 EfficientNet을 알아야 한다.

✔️EfficientNet

EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks

CNN에서 성능(accuracy)을 올리기 위해 기존 모델을 확장시키는 방법을 주로 사용해 왔다. 유명한 모델 중 하나인 resnet으로 예를 들 수 있다. (resnet18, resnet50, resnet101...)

https://s3-us-west-2.amazonaws.com/secure.notion-static.com/61f0967a-839e-4276-bdce-5dbb69fff8a6/Untitled.png

위의 그림과 같이 model을 확장시키는 다양한 방법들이 있다.

본 논문에서는 width($w$), depth($d$), resolution($r$) 세 가지를 나누어 하나의 scale factor만 변화시키며 정확도를 측정함. 아래의 결과를 보면 resolution을 키웠을 때, 나머지 factor보다 꾸준히 성능이 증가하는 것을 볼 수 있다.

https://s3-us-west-2.amazonaws.com/secure.notion-static.com/fb895df5-5b72-4462-b820-25e66dd5c0cd/Untitled.png

아래는 위 그림과 비슷하게 depth, resolution를 고정시키고 width의 변화만 주면서 정확도가 어떻게 변하는지 확인한 실험. depth보다는 resolution을 키우는 것이 정확도 향상에 더욱 효과적인 것을 알 수 있다. 또한 1개 혹은 2개의 factor보다 3가지(width, depth, resolution) 모두 키워주는 것**(이하 Compound Scaling)**이 가장 성능 향상 효과를 많이 보았다.

https://s3-us-west-2.amazonaws.com/secure.notion-static.com/bab0df2e-2836-48d0-a0d5-8b3dde401673/Untitled.png