[자율주행 AI 챌린지] DDRNet 사설 데이터셋 훈련.(ETRI)

사용 데이터셋 <a href="https://nanum.etri.re.kr/share/kakao_admin/kamoVehicleImageSegmentation2025?lang=ko_KR" target="_top" class="ke-link">https://nanum.etri.re.kr/share/kakao_admin/kamoVehicleImageSegmentation2025?lang=ko_KR</a><div class="figure-open" contenteditable="false" data-ke-type="opengraph" data-ke-align="alignCenter" data-og-type="website" data-og-title="ETRI AI 나눔" data-og-description="1. 데이터 명세 데이터 정의자율주행 차량에서 주변 객체 및 도로 환경을 Pixel-wise Semantic Segmentation 형태로 인식하기 위한 인공지능 학습 데이터셋데이터 수집- 수집차량 : 카니발- 센서  · 카메" data-og-host="nanum.etri.re.kr" data-og-source-url="https://nanum.etri.re.kr/share/kakao_admin/kamoVehicleImageSegmentation2025?lang=ko_KR" data-og-url="https://nanum.etri.re.kr/share/kakao_admin/kamoVehicleImageSegmentation2025?lang=ko_KR" data-og-image="https://scrap.kakaocdn.net/dn/biOTt5/hyZG7MOkNH/EMuSkfBco2jngDBJJQD1Kk/img.png?width=300&height=149&face=0_0_300_149,https://scrap.kakaocdn.net/dn/bwicPd/hyZJe4AwrG/SZKkwv2XaUCKoYk5t5YR3K/img.png?width=858&height=494&face=0_0_858_494"><a href="https://nanum.etri.re.kr/share/kakao_admin/kamoVehicleImageSegmentation2025?lang=ko_KR" target="_blank" data-source-url="https://nanum.etri.re.kr/share/kakao_admin/kamoVehicleImageSegmentation2025?lang=ko_KR"><div class="og-image"><img class="thumb_img" src="https://scrap.kakaocdn.net/dn/biOTt5/hyZG7MOkNH/EMuSkfBco2jngDBJJQD1Kk/img.png?width=300&height=149&face=0_0_300_149,https://scrap.kakaocdn.net/dn/bwicPd/hyZJe4AwrG/SZKkwv2XaUCKoYk5t5YR3K/img.png?width=858&height=494&face=0_0_858_494" alt="" xxxxonerror="this.src="//img1.kakaocdn.net/thumb/C200x200/?fname=https%3A%2F%2Ft1.daumcdn.net%2Fcafe_image%2Fcafe_meta_image_190529.png""></div><div class="og-text">ETRI AI 나눔1. 데이터 명세 데이터 정의자율주행 차량에서 주변 객체 및 도로 환경을 Pixel-wise Semantic Segmentation 형태로 인식하기 위한 인공지능 학습 데이터셋데이터 수집- 수집차량 : 카니발- 센서  · 카메nanum.etri.re.kr</div></a></div>- 데이터 파일 · 센서데이터 : 카메라 이미지 데이터 (.jpg)  · 레이블 데이터 : 세그멘테이션 및 클래스 정보 (.json) - 클래스 구분 : 42종 (도로 시설물 및 동적객체) - 각 클래스의 정보는 제공되지 않음.(메일로 질의했으나 답변 X) DDRNet에 대한 공식 깃허브<a href="https://github.com/ydhongHIT/DDRNet" target="_blank" class="ke-link">https://github.com/ydhongHIT/DDRNet</a><div class="figure-open" contenteditable="false" data-ke-type="opengraph" data-ke-align="alignCenter" data-og-type="website" data-og-title="GitHub - ydhongHIT/DDRNet: The official implementation of "Deep Dual-resolution Networks for Real-time and Accurate Semantic Seg" data-og-description="The official implementation of "Deep Dual-resolution Networks for Real-time and Accurate Semantic Segmentation of Road Scenes" - ydhongHIT/DDRNet" data-og-host="github.com" data-og-source-url="https://github.com/ydhongHIT/DDRNet" data-og-url="https://github.com/ydhongHIT/DDRNet" data-og-image="https://scrap.kakaocdn.net/dn/mDsPo/hyZI07jk2G/CmBbdWCj3EEM9DT2aWghw1/img.png?width=1200&height=600&face=0_0_1200_600,https://scrap.kakaocdn.net/dn/s8zEY/hyZINz6T5m/kipBNKGSZkilcYMKBxK9a1/img.png?width=1200&height=600&face=0_0_1200_600"><a href="https://github.com/ydhongHIT/DDRNet" target="_blank" data-source-url="https://github.com/ydhongHIT/DDRNet"><div class="og-image"><img class="thumb_img" src="https://scrap.kakaocdn.net/dn/mDsPo/hyZI07jk2G/CmBbdWCj3EEM9DT2aWghw1/img.png?width=1200&height=600&face=0_0_1200_600,https://scrap.kakaocdn.net/dn/s8zEY/hyZINz6T5m/kipBNKGSZkilcYMKBxK9a1/img.png?width=1200&height=600&face=0_0_1200_600" alt="" xxxxonerror="this.src="//img1.kakaocdn.net/thumb/C200x200/?fname=https%3A%2F%2Ft1.daumcdn.net%2Fcafe_image%2Fcafe_meta_image_190529.png""></div><div class="og-text">GitHub - ydhongHIT/DDRNet: The official implementation of "Deep Dual-resolution Networks for Real-time and Accurate Semantic SegThe official implementation of "Deep Dual-resolution Networks for Real-time and Accurate Semantic Segmentation of Road Scenes" - ydhongHIT/DDRNetgithub.com</div></a></div><div class="figure-img" data-ke-type="image" data-ke-style="alignCenter" data-ke-mobilestyle="widthOrigin"><img src="https://t1.daumcdn.net/cafeattach/1RgNt/906364e6ba95f283e8b3bde439f5d90fba231cf7" class="txc-image" data-img-src="https://t1.daumcdn.net/cafeattach/1RgNt/906364e6ba95f283e8b3bde439f5d90fba231cf7" data-origin-width="836" data-origin-height="173"></div>DDRNet에 대한 공식 학습을 돌리기 위해서는 다음과 같은 깃허브를 참조할 수 있다고 하여 진행하였으나pytorch와 numpy버전이 일치하게 되어 학습이 돌아가도 Loss값이 전혀 개선되지 않는 일이 발생하여 최종적으로 semantic-segmentation github로 학습. DDRNet.pytorch (학습 진행시 Loss값과 ACC값이 전혀 개선되지 않음.) Segmentation-Pytorch (DataLoader를 직접 튜닝하는 과정에서 모델 자체 구조를 변경해야 하는 일 발생.)deci.ai (github 내부 구조도 파악에 실패.)PaddleSeg (semantic-segmentation에서 학습이 진행되어 보류) 사용 깃허브<a href="https://github.com/sithu31296/semantic-segmentation" target="_blank" class="ke-link">https://github.com/sithu31296/semantic-segmentation</a><div class="figure-open" contenteditable="false" data-ke-type="opengraph" data-ke-align="alignCenter" data-og-type="website" data-og-title="GitHub - sithu31296/semantic-segmentation: SOTA Semantic Segmentation Models in PyTorch" data-og-description="SOTA Semantic Segmentation Models in PyTorch. Contribute to sithu31296/semantic-segmentation development by creating an account on GitHub." data-og-host="github.com" data-og-source-url="https://github.com/sithu31296/semantic-segmentation" data-og-url="https://github.com/sithu31296/semantic-segmentation" data-og-image="https://scrap.kakaocdn.net/dn/zmqzM/hyZIYn44yU/tKpXw0xxMKucfw4DynS8KK/img.png?width=1200&height=600&face=0_0_1200_600,https://scrap.kakaocdn.net/dn/gTrwg/hyZJfblP4m/fX80SAkB92SzpNzE1iRm51/img.png?width=1200&height=600&face=0_0_1200_600"><a href="https://github.com/sithu31296/semantic-segmentation" target="_blank" data-source-url="https://github.com/sithu31296/semantic-segmentation"><div class="og-image"><img class="thumb_img" src="https://scrap.kakaocdn.net/dn/zmqzM/hyZIYn44yU/tKpXw0xxMKucfw4DynS8KK/img.png?width=1200&height=600&face=0_0_1200_600,https://scrap.kakaocdn.net/dn/gTrwg/hyZJfblP4m/fX80SAkB92SzpNzE1iRm51/img.png?width=1200&height=600&face=0_0_1200_600" alt="" xxxxonerror="this.src="//img1.kakaocdn.net/thumb/C200x200/?fname=https%3A%2F%2Ft1.daumcdn.net%2Fcafe_image%2Fcafe_meta_image_190529.png""></div><div class="og-text">GitHub - sithu31296/semantic-segmentation: SOTA Semantic Segmentation Models in PyTorchSOTA Semantic Segmentation Models in PyTorch. Contribute to sithu31296/semantic-segmentation development by creating an account on GitHub.github.com</div></a></div> 코드 수정 부분<ul style="list-style-type: disc;" data-ke-list-type="disc"><li>configs/etri.yaml파일 생성</li><li>models/ddrnet.py 코드에서 클래스의 개수가 다른 경우를 보완</li><li>data파일 추가.</li><li>가중치 파일 다운로드 : DDRNet-23slim.pth</li></ul>configs/etri.yaml파일 생성 DEVICE          : cuda              # device used for training and eval‎uation (cpu, cuda, cuda0, cuda1, ...)SAVE_DIR        : 'output'         # output folder name used for saving the model, logs and inference results MODEL:                                      NAME          : DDRNet                                           # name of the model you are using  BACKBONE      : DDRNet-23slim                                                 # model variant  PRETRAINED    : 'C:/semantic-segmentation/DDRNet-23slim.pth'              # backbone model's weight  DATASET:  NAME          : ETRI                                          # dataset name to be trained with (camvid, cityscapes, ade20k)  ROOT          : 'data/etri'                                   # dataset root path  IGNORE_LABEL  : 255 TRAIN:  IMAGE_SIZE    : [512, 512]    # training image size in (h, w)  BATCH_SIZE    : 2               # batch size used to train  EPOCHS        : 200             # number of epochs to train  EVAL‎_INTERVAL : 20              # eval‎uation interval during training  AMP           : false           # use AMP in training  DDP           : false           # use DDP training LOSS:  NAME          : OhemCrossEntropy          # loss function name (ohemce, ce, dice)  CLS_WEIGHTS   : false            # use class weights in loss calculation OPTIMIZER:  NAME          : adamw           # optimizer name  LR            : 0.01           # initial learning rate used in optimizer  WEIGHT_DECAY  : 0.01            # decay rate used in optimizer  SCHEDULER:  NAME          : warmuppolylr    # scheduler name  POWER         : 0.9             # scheduler power  WARMUP        : 10              # warmup epochs used in scheduler  WARMUP_RATIO  : 0.1             # warmup ratio   EVAL‎:  MODEL_PATH    : 'output/etri/best.pth'     # trained model file path  IMAGE_SIZE    : [1024, 1024]                            # eval‎uation image size in (h, w)                         MSF:     ENABLE      : false                                   # multi-scale and flip eval‎uation      FLIP        : true                                    # use flip in eval‎uation      SCALES      : [0.5, 0.75, 1.0, 1.25, 1.5, 1.75]       # scales used in MSF eval‎uation                 TEST:  MODEL_PATH    : 'output/etri/best.pth'    # trained model file path  FILE          : 'data/etri/test'                    # filename or foldername   IMAGE_SIZE    : [1024, 1024]                            # inference image size in (h, w)  OVERLAY       : true                                    # save the overlay result (image_alpha+label_alpha)  models/ddrnet.py 클래스 개수 보완 (DDRNet.init_pretrained())<div class="figure-img" data-ke-type="image" data-ke-style="alignCenter" data-ke-mobilestyle="widthOrigin"><img src="https://t1.daumcdn.net/cafeattach/1RgNt/0e483a5ed50187e61707bcde1aef417a8208c7e8" class="txc-image" data-img-src="https://t1.daumcdn.net/cafeattach/1RgNt/0e483a5ed50187e61707bcde1aef417a8208c7e8" data-origin-width="1083" data-origin-height="250"></div>  학습 결과DDRNet의 원본은 클래스의 수가 12이고 ETRI는 42개의 클래스를 가진 데이터셋.가중치를 가져온다 하여도 해당 클래스의 학습에 도움이 되는가에 대해서는 불확실.Eval‎uating이 20Epoch마다 진행되는 이유는 내부 코드의 기본값이 Eval‎uating을 20Epoch마다 진행되도록 되어있기 때문다음 학습으로 동일한 환경에 1Epoch마다 Eval‎uating을 진행할 때로 재학습 예정. <div class="figure-img" data-ke-type="image" data-ke-style="alignLeft" data-ke-mobilestyle="widthOrigin"><img src="https://t1.daumcdn.net/cafeattach/1RgNt/bb6ceb05938b7e31e2847ecc9a554553e4347884" class="txc-image" data-img-src="https://t1.daumcdn.net/cafeattach/1RgNt/bb6ceb05938b7e31e2847ecc9a554553e4347884" data-origin-width="1076" data-origin-height="480"></div><div class="figure-img" data-ke-type="image" data-ke-style="alignLeft" data-ke-mobilestyle="widthOrigin"><img src="https://t1.daumcdn.net/cafeattach/1RgNt/807e6be97e067ac568470f2cd27316b0f057f6ce" class="txc-image" data-img-src="https://t1.daumcdn.net/cafeattach/1RgNt/807e6be97e067ac568470f2cd27316b0f057f6ce" data-origin-width="1082" data-origin-height="550"></div> <div class="figure-img" data-ke-type="image" data-ke-style="alignCenter" data-ke-mobilestyle="widthOrigin"><img src="https://t1.daumcdn.net/cafeattach/1RgNt/c2f6d843b3b24ed332077377eb954f3df1f73615" class="txc-image" data-img-src="https://t1.daumcdn.net/cafeattach/1RgNt/c2f6d843b3b24ed332077377eb954f3df1f73615" data-origin-width="1000" data-origin-height="600"></div><div class="figure-img" data-ke-type="image" data-ke-style="alignCenter" data-ke-mobilestyle="widthOrigin"><img src="https://t1.daumcdn.net/cafeattach/1RgNt/a3639d29ce2850b3456630bb9133affa09816c16" class="txc-image" data-img-src="https://t1.daumcdn.net/cafeattach/1RgNt/a3639d29ce2850b3456630bb9133affa09816c16" data-origin-width="1000" data-origin-height="600"></div> 학습되어있는 모델로 추론 돌린 결과.추론 명령어python .\tools\infer.py --cfg .\configs\etri.yaml <div class="table-wrap"><table data-ke-type="table" data-ke-align="alignLeft" style="width: 100%;" border="1"><tbody><tr><td style="width: 50%;"><div class="figure-img" data-ke-type="image" data-ke-style="alignCenter" data-ke-mobilestyle="widthOrigin"><img src="https://t1.daumcdn.net/cafeattach/1RgNt/6d5d9c5b8e4e69f6bdf4e82a9476e9cc66d08c37" class="txc-image" data-img-src="https://t1.daumcdn.net/cafeattach/1RgNt/6d5d9c5b8e4e69f6bdf4e82a9476e9cc66d08c37" data-origin-width="1920" data-origin-height="1200"></div></td><td style="width: 50%;"><div class="figure-img" data-ke-type="image" data-ke-style="alignCenter" data-ke-mobilestyle="widthOrigin"><img src="https://t1.daumcdn.net/cafeattach/1RgNt/5c3148372b2b9491ed4cf915a86cd1ac1700ce8e" class="txc-image" data-img-src="https://t1.daumcdn.net/cafeattach/1RgNt/5c3148372b2b9491ed4cf915a86cd1ac1700ce8e" data-origin-width="1920" data-origin-height="1200"></div></td></tr><tr><td style="width: 50%;"><div class="figure-img" data-ke-type="image" data-ke-style="alignCenter" data-ke-mobilestyle="widthOrigin"><img src="https://t1.daumcdn.net/cafeattach/1RgNt/87863562e571d00155f2e0bd20f9471bccee735c" class="txc-image" data-img-src="https://t1.daumcdn.net/cafeattach/1RgNt/87863562e571d00155f2e0bd20f9471bccee735c" data-origin-width="2048" data-origin-height="1024"></div></td><td style="width: 50%;"><div class="figure-img" data-ke-type="image" data-ke-style="alignCenter" data-ke-mobilestyle="widthOrigin"><img src="https://t1.daumcdn.net/cafeattach/1RgNt/96819517bd6b55afeb81e11ff459f7df18725123" class="txc-image" data-img-src="https://t1.daumcdn.net/cafeattach/1RgNt/96819517bd6b55afeb81e11ff459f7df18725123" data-origin-width="2048" data-origin-height="1024"></div></td></tr></tbody></table></div> <div class="figure-img" data-ke-type="image" data-ke-style="alignCenter" data-ke-mobilestyle="widthOrigin"><img src="https://t1.daumcdn.net/cafeattach/1RgNt/f4ede920383a9461a664e067f2d05c5f208f8358" class="txc-image" data-img-src="https://t1.daumcdn.net/cafeattach/1RgNt/f4ede920383a9461a664e067f2d05c5f208f8358" data-origin-width="1920" data-origin-height="1200"><div class="figcaption">Train에 쓰인 Dataset</div></div><div class="figure-img" data-ke-type="image" data-ke-style="alignCenter" data-ke-mobilestyle="widthOrigin"><img src="https://t1.daumcdn.net/cafeattach/1RgNt/a5441418272e1b3713d261738d435bc6bdf8a6e9" class="txc-image" data-img-src="https://t1.daumcdn.net/cafeattach/1RgNt/a5441418272e1b3713d261738d435bc6bdf8a6e9" data-origin-width="2048" data-origin-height="1024"><div class="figcaption">외부 Test dataset</div></div>이미지 한장에 대한 순수 추론 시간Elapsed time : 8.76ms ~ 10.39ms추론 이미지 사이즈 : Train : [1024x1664], 외부 Test : [1024x2048]  간단한 형태의 클래스는 어느정도 인식하는 것을 확인 가능. 원본 모델과의 비교는 데이터셋이 일치하지 않아 비교 불가.