본문 바로가기

Computer Vision

[연구노트] 22.03.23 Video Swin Transformer

최규원 2023. 3. 23. 22:40

1. 셋업 설정은 직접하지말고 저자가 준대로 바로 설치할 수 있는지 readme.md를 꼼꼼히 볼것

2. mmcv version은 내 cuda, torch 버전 반드시 제대로 확인해보고 설치할 것:

3. 다음의 자잘한 메모들 ...

현재 셋업은 pytorch 1.7.0 버전으로 함
CUDA는 nvidia-smi 해서 나온거보다 높은 버전으로
데이터 path 설정하고 class 개수 반드시 체크하기 (config 파일 수정 주의)
Transformer 기반이기 때문에.. 작은 양의 데이터로 scratch 부터 학습하면 성능이 당연히 안나옴
- pretrained backbone을 활용할것 : 저자들이 제시하는 백본 맞추기
제공하는 checkpoint를 백본으로 다시 학습하면 classification 사이즈 안맞음
- —> model.backbone.use_checkpoint=True
- mmcv에서 제공하는 Config 모듈에서 Config.fromfile.merge_from_dict 의 활용

<결론> readme 를 잘 읽자, mmcv 를 잘 분석하자

728x90

'Computer Vision' 카테고리의 다른 글

[Github] How to add, commit, and push your code / Github에서 add, commit, and push 하는 법 (0)	2023.03.31
[연구노트] VBLC 실험 관련 메모 (0)	2023.03.23
cv2.error: OpenCV(3.4.2) /tmp/build/..../work/modules/imgcodecs/src/loadsave.cpp:684: error: (-2:Unspecified error) could not find a writer for the specified extension in function 'imwrite_' (0)	2023.01.23
yaml 파일을 통한 conda 가상환경 셋업 (가상 환경 옮기기) (0)	2022.12.23
Domain Adaptation에서의 Open set 과 Partial set의 차이 (0)	2022.12.19

티스토리툴바