본문 바로가기

AI

YOLO image size

개인으로 만들어낸 이미지만 해도 21,000장을 넘어섰다. coco dataset의 일부와 합쳐서 사용중이니 학습에 사용하고 있는 이미지는 46,000장 가량 된다. 하지만 내가 직접 이미지를 마킹해서 학습시켜서 그런건지, 아니면 원래 내가 원하는 수준의 성능은 안나오는 건지 모르겠지만 감지 성능이 성에 차지 않았다.

 

YOLO의 감지(detect) 능력을 조금이라도 키워 보겠다고, 방법을 찾아 다니다 보면 해외 사이트 등에서 YOLO image resize를 수정해서 사용해 보라고 조언한다.

 

물론 image resize를 하지 말고, height와 width를 건들지 말라고도 한다. 하지만 궁금해서 한번 해봤다. (네트워크의 size는 건들지 않았다.)

 

※주장: image의 height와 width가 낮게 학습시키고, 감지(image detect, streamming, etc...)할 때는 height와 width가 높아야 감지가 잘 된다. 

 

  • 테스트한 image size: 416, 608, 1152

 

< .cfg 파일에서 height와 width를 설정 할 수 있다 >

 

  • 실험 내용: 이미지 46,462장을 .cfg의 height와 width를 변경하여, 각각 학습 시킨뒤 생성된 각각의 .weights파일을 이용하여, 다른 2개의 image size로 동영상을 감지해본다.

예) 416size로 학습시킨 .weights파일을 이용해서, 나머지 608, 1152 size로 설정된 .cfg로 감지(detect)시킨다.

 

 

#결과

해당 실험을 3번 반복하여 진행했다. 결과라고 할 것 없이 크게 유의미한 변화는 발생하지 않았다. 그러나 416 - 608(학습 - 감지)조합이 적어도 실험해본 환경에서는 가장 오류없이 감지하는 듯 보였다.

 

특별히 더 좋아지거나, 더 나빠지거나 하는 모습은 딱히 없어, 학습용 - 감지용 .cfg를 나누는 것 보다 통일해서 사용하는 것이 파일을 관리하기에 더 좋아보인다.

 

이 결과가 오로지 내게만 발생하는 결과일지는 모르겠다. 적어도 나의 실험환경에서는 큰 변화가 없었다.