본문 바로가기

Computer Vision

[연구노트] 22.03.23 Video Swin Transformer

1. 셋업 설정은 직접하지말고 저자가 준대로 바로 설치할 수 있는지 readme.md를 꼼꼼히 볼것 

 

 

 

2. mmcv version은 내 cuda, torch 버전 반드시 제대로 확인해보고 설치할 것:

 

3. 다음의 자잘한 메모들 ...

  • 현재 셋업은 pytorch 1.7.0 버전으로 함
  • CUDA는 nvidia-smi 해서 나온거보다 높은 버전으로
  • 데이터 path 설정하고 class 개수 반드시 체크하기 (config 파일 수정 주의)
  • Transformer 기반이기 때문에.. 작은 양의 데이터로 scratch 부터 학습하면 성능이 당연히 안나옴
    • pretrained backbone을 활용할것 : 저자들이 제시하는 백본 맞추기
  • 제공하는 checkpoint를 백본으로 다시 학습하면 classification 사이즈 안맞음
    • —> model.backbone.use_checkpoint=True
    • mmcv에서 제공하는 Config 모듈에서 Config.fromfile.merge_from_dict 의 활용

<결론> readme 를 잘 읽자, mmcv 를 잘 분석하자 

 

 

728x90