[자율주행 AI 챌린지] TensorRT를 이용한 모델 최적화

1. pth to ONNX 변환TensorRT로 최적화하기 위해서 pth파일을 ONNX로 변환해주기 def convert_to_onnx(args):    device = torch.device('cpu')    print(f"Using device: {device}")     model = load_deeplabv3_mobilenet(        args.weight_path,        args.num_classes,        device,        output_stride=args.output_stride,        separable_conv=args.separable_conv    )       # ONNX로 변환 전에 반드시 eval‎ 모드로 설정    model.eval‎()    model.to(device)     print()    print(f"Train Mode? {model.training}")  # False여야 함    print(f"Instance of nn.Module? {isinstance(model, nn.Module)}")    print()     dummy_input = torch.randn(1, 3, 1024, 1024, device=device)     dynamic_axes = {        'input': {2: 'height', 3: 'width'},        'output': {2: 'height', 3: 'width'}    }     output_onnx_path = 'onnx_converted_model.onnx'     torch.onnx.export(        model.module,  # DataParallel 래핑된 경우        dummy_input,        output_onnx_path,        export_params=True,        opset_version=11,        do_constant_folding=True,        input_names=['input'],        output_names=['output'],        dynamic_axes=dynamic_axes    )     print(f"ONNX convert finished: {output_onnx_path}")    print()     # ===== 검증 =====    ONNX_MODEL_PATH = output_onnx_path    INPUT_H = 1024    INPUT_W = 1024     device = torch.device("cpu")       # model.module 사용 (ONNX 변환 시와 동일)    model.module.eval‎()    model.module.to(device)     # ONNX Runtime 세션    so = ort.SessionOptions()    ort_session = ort.InferenceSession(        ONNX_MODEL_PATH,        providers=['CPUExecutionProvider']    )    input_name = ort_session.get_inputs()[0].name    output_name = ort_session.get_outputs()[0].name     # 동일한 입력    np.random.seed(42)    dummy_input_np = np.random.randn(1, 3, INPUT_H, INPUT_W).astype(np.float32)    dummy_input_torch = torch.from_numpy(dummy_input_np).to(device)     # PyTorch 추론    with torch.no_grad():        pytorch_output = model.module(dummy_input_torch)        pytorch_output_np = pytorch_output.cpu().numpy()     # ONNX Runtime 추론    ort_inputs = {input_name: dummy_input_np}    ort_output = ort_session.run([output_name], ort_inputs)[0]     # 출력 비교    print(f"PyTorch output shape: {pytorch_output_np.shape}")    print(f"ONNX output shape: {ort_output.shape}")    print(f"PyTorch output range: [{pytorch_output_np.min():.6f}, {pytorch_output_np.max():.6f}]")    print(f"ONNX output range: [{ort_output.min():.6f}, {ort_output.max():.6f}]")       try:        np.testing.assert_allclose(            pytorch_output_np,            ort_output,            rtol=1e-02,  # 1% 상대 오차            atol=1e-04   # 절대 오차        )        print("✅ 검증 성공: PyTorch와 ONNX의 출력이 거의 일치합니다.")     except AssertixxonError as e:        print("❌ 검증 실패: PyTorch와 ONNX의 출력이 다릅니다.")        print(e) <div class="figure-img" data-ke-type="image" data-ke-style="alignCenter" data-ke-mobilestyle="widthOrigin"><img src="https://t1.daumcdn.net/cafeattach/1RgNt/aa9397013d8809f223af6d5d1f3a247a18efa609_re_1762139743767" class="txc-image" data-img-src="https://t1.daumcdn.net/cafeattach/1RgNt/aa9397013d8809f223af6d5d1f3a247a18efa609_re_1762139743767" data-origin-width="1038" data-origin-height="944"></div><hr data-ke-style="style5">2. TensorRT를 사용하여 모델 최적화  TensorRT 설치 방법1. pip install tensorrt<div class="figure-img" data-ke-type="image" data-ke-style="alignCenter" data-ke-mobilestyle="widthOrigin"><img src="https://t1.daumcdn.net/cafeattach/1RgNt/5b58a62b3e99c86a10b1acb8e5a55d3eaf691fc1_re_1762139743767" class="txc-image" data-img-src="https://t1.daumcdn.net/cafeattach/1RgNt/5b58a62b3e99c86a10b1acb8e5a55d3eaf691fc1_re_1762139743767" data-origin-width="1026" data-origin-height="38"></div>학교 방화벽에 의한 문제인것 같음 2. 공식 사이트에서 설치<div class="figure-img" data-ke-type="image" data-ke-style="alignCenter" data-ke-mobilestyle="widthOrigin"><img src="https://t1.daumcdn.net/cafeattach/1RgNt/1f297efc22345acc51d68c47a3d48a0450dd90c5_re_1762139743767" class="txc-image" data-img-src="https://t1.daumcdn.net/cafeattach/1RgNt/1f297efc22345acc51d68c47a3d48a0450dd90c5_re_1762139743767" data-origin-width="792" data-origin-height="532"><div class="figcaption">cuda 버전에 맞게 설치하기</div></div><div class="figure-img" data-ke-type="image" data-ke-style="alignCenter" data-ke-mobilestyle="widthOrigin"><img src="https://t1.daumcdn.net/cafeattach/1RgNt/24479492163fe46c0717c492f711b07a8e8e126d_re_1762139743767" class="txc-image" data-img-src="https://t1.daumcdn.net/cafeattach/1RgNt/24479492163fe46c0717c492f711b07a8e8e126d_re_1762139743767" data-origin-width="530" data-origin-height="497"><div class="figcaption">환경 변수 추가</div></div><div class="figure-img" data-ke-type="image" data-ke-style="alignCenter" data-ke-mobilestyle="widthOrigin"><img src="https://t1.daumcdn.net/cafeattach/1RgNt/afaed2dfbfddca8e909cf19d8c4e329fc385dce4_re_1762139743767" class="txc-image" data-img-src="https://t1.daumcdn.net/cafeattach/1RgNt/afaed2dfbfddca8e909cf19d8c4e329fc385dce4_re_1762139743767" data-origin-width="1027" data-origin-height="284"><div class="figcaption">추가되었는지 확인</div></div><div class="figure-img" data-ke-type="image" data-ke-style="alignCenter" data-ke-mobilestyle="widthOrigin"><img src="https://t1.daumcdn.net/cafeattach/1RgNt/41c65a3ded267d6ffa94308e43a1fc883a0997ff_re_1762139743767" class="txc-image" data-img-src="https://t1.daumcdn.net/cafeattach/1RgNt/41c65a3ded267d6ffa94308e43a1fc883a0997ff_re_1762139743767" data-origin-width="591" data-origin-height="445"></div>tensorrt 설치 중에 버전 충돌 등의 문제가 생겨 해결중입니다.