chap 10

1. 예측확률이 0.5이상인 객체만 바운딩 박스를 그려라#import argparseimport globfrom pathlib import Pathimport open3d#from visual_utils import open3d_vis_utils asd Vimport numpy as npimport torchfrom pcdet.config import cfg, cfg_from_yaml_filefrom pcdet.datasets import DatasetTemplatefrom pcdet.models import build_network, load_data_to_gpufrom pcdet.utils import common_utils class DemoDataset(DatasetTemplate):    def __init__(self, dataset_cfg, class_names, training=True, root_path=None, logger=None, ext='.bin'):        """        Args:            root_path:            dataset_cfg:            class_names:            training:            logger:        """        super().__init__(            dataset_cfg=dataset_cfg, class_names=class_names, training=training, root_path=root_path, logger=logger        )        self.root_path = root_path        self.ext = ext        data_file_list = glob.glob(str(root_path / f'*{self.ext}')) if self.root_path.is_dir() else [self.root_path]         data_file_list.sort()        self.sample_file_list = data_file_list     def __len__(self):        return len(self.sample_file_list)   def __getitem__(self, index):        if self.ext == '.bin':            points = np.fromfile(self.sample_file_list[index], dtype=np.float32).reshape(-1, 4)        elif self.ext == '.npy':            points = np.load(self.sample_file_list[index])        else:            raise NotImplementedError         input_dict = {            'points': points,            'frame_id': index,        }         data_dict = self.prepare_data(data_dict=input_dict)        return data_dict def model_inference(cfg_file, data_path, ckpt_path):    #ext = '.bin'    cfg_from_yaml_file(cfg_file, cfg)    logger = common_utils.create_logger()        demo_dataset = DemoDataset(dataset_cfg=cfg.DATA_CONFIG, class_names=cfg.CLASS_NAMES, training=False, root_path=Path(data_path))    print(f'Total number of samples: \t{len(demo_dataset)}')    model = build_network(model_cfg=cfg.MODEL, num_class=len(cfg.CLASS_NAMES), dataset=demo_dataset)    model.load_params_from_file(filename=ckpt_path, logger=logger, to_cpu=True)    model.cuda()    model.eval‎()    pcd = []    pred_dict = {}    with torch.no_grad():        for idx, data_dict in enumerate(demo_dataset):            logger.info(f'Visualized sample index: \t{idx + 1}')            data_dict = demo_dataset.collate_batch([data_dict])            load_data_to_gpu(data_dict)            pred_dicts, _ = model.forward(data_dict)            pcd = torch.Tensor.tolist(data_dict['points'][:, 1:4])            pred_dict['pred_boxes'] = torch.Tensor.tolist(pred_dicts[0]['pred_boxes'])            pred_dict['pred_scores'] = torch.Tensor.tolist(pred_dicts[0]['pred_scores'])            pred_dict['pred_labels'] = torch.Tensor.tolist(pred_dicts[0]['pred_labels'])     return pred_dict, pcd if __name__ == '__main__':     cfg_file = "pointpillar.yaml"    #cfg_file = "pointrcnn.yaml"    #cfg_file = "second.yaml"    #cfg_file = "voxel_rcnn_car.yaml"    #cfg_file = "pv_rcnn.yaml"     data_path = "000000.bin"    #data_path = "000008.bin"            ckpt_path = "pointpillar_7728.pth"    #ckpt_path = "pointrcnn_7870.pth"    #ckpt_path = "second_7862.pth"    #ckpt_path = "voxel_rcnn_car_84.54.pth"    #ckpt_path = "pv_rcnn_8369.pth"        pred_dict,pcd = model_inference(cfg_file=cfg_file, data_path=data_path, ckpt_path=ckpt_path)       vis = open3d.visualization.Visualizer()    vis.create_window(window_name="kitti")    vis.get_render_option().point_size = 2.0    vis.get_render_option().background_color = np.zeros(3)    axis_pcd = open3d.geometry.TriangleMesh.create_coordinate_frame(size=1.0, origin=[0, 0, 0])    vis.add_geometry(axis_pcd)     pts = open3d.geometry.PointCloud()    pts.points = open3d.utility.Vector3dVector(pcd)    pts.colors = open3d.utility.Vector3dVector(np.ones((len(pcd), 3)))    vis.add_geometry(pts)     box_color = [[0,1,0],[0,1,1],[1,1,0],[1,1,1]]     for i in range(len(pred_dict['pred_boxes'])):            score = pred_dict['pred_scores'][i]            if score < 0.5:                continue            center = pred_dict['pred_boxes'][i][0:3]            lwh = pred_dict['pred_boxes'][i][3:6]            axis_angles = np.array([0, 0, pred_dict['pred_boxes'][i][6]])            rot = open3d.geometry.get_rotation_matrix_from_axis_angle(axis_angles)            box3d = open3d.geometry.OrientedBoundingBox(center, rot, lwh)            box3d.color = box_color[pred_dict['pred_labels'][i]-1]             vis.add_geometry(box3d)                       vis.run()    vis.destroy_window()<div class="figure-img" data-ke-type="image" data-ke-style="alignLeft" data-ke-mobilestyle="widthOrigin"><img src="https://t1.daumcdn.net/cafeattach/1RgNt/04356dc21841964e5a429c58f42a4a5ec64b16a8" class="txc-image" width="562" height="412" data-img-src="https://t1.daumcdn.net/cafeattach/1RgNt/04356dc21841964e5a429c58f42a4a5ec64b16a8" data-origin-width="1163" data-origin-height="853"></div>    2. 레이블 파일에 있는 3d 바운딩박스 정보를 예측결과와 같이 그려보 라, 색상은 달리하여 정답과 예측결과가 얼마나 일치하는지 확인하 라.#import argparseimport globfrom pathlib import Pathimport open3d#from visual_utils import open3d_vis_utils asd Vimport numpy as npimport torchfrom pcdet.config import cfg, cfg_from_yaml_filefrom pcdet.datasets import DatasetTemplatefrom pcdet.models import build_network, load_data_to_gpufrom pcdet.utils import common_utils class DemoDataset(DatasetTemplate):    def __init__(self, dataset_cfg, class_names, training=True, root_path=None, logger=None, ext='.bin'):        """        Args:            root_path:            dataset_cfg:            class_names:            training:            logger:        """        super().__init__(            dataset_cfg=dataset_cfg, class_names=class_names, training=training, root_path=root_path, logger=logger        )        self.root_path = root_path        self.ext = ext        data_file_list = glob.glob(str(root_path / f'*{self.ext}')) if self.root_path.is_dir() else [self.root_path]         data_file_list.sort()        self.sample_file_list = data_file_list     def __len__(self):        return len(self.sample_file_list)     def __getitem__(self, index):        if self.ext == '.bin':            points = np.fromfile(self.sample_file_list[index], dtype=np.float32).reshape(-1, 4)        elif self.ext == '.npy':            points = np.load(self.sample_file_list[index])        else:            raise NotImplementedError         input_dict = {            'points': points,            'frame_id': index,        }         data_dict = self.prepare_data(data_dict=input_dict)        return data_dict def model_inference(cfg_file, data_path, ckpt_path):    #ext = '.bin'    cfg_from_yaml_file(cfg_file, cfg)    logger = common_utils.create_logger()        demo_dataset = DemoDataset(dataset_cfg=cfg.DATA_CONFIG, class_names=cfg.CLASS_NAMES, training=False, root_path=Path(data_path))    print(f'Total number of samples: \t{len(demo_dataset)}')    model = build_network(model_cfg=cfg.MODEL, num_class=len(cfg.CLASS_NAMES), dataset=demo_dataset)    model.load_params_from_file(filename=ckpt_path, logger=logger, to_cpu=True)    model.cuda()    model.eval‎()    pcd = []    pred_dict = {}    with torch.no_grad():        for idx, data_dict in enumerate(demo_dataset):            logger.info(f'Visualized sample index: \t{idx + 1}')            data_dict = demo_dataset.collate_batch([data_dict])            load_data_to_gpu(data_dict)            pred_dicts, _ = model.forward(data_dict)            pcd = torch.Tensor.tolist(data_dict['points'][:, 1:4])            pred_dict['pred_boxes'] = torch.Tensor.tolist(pred_dicts[0]['pred_boxes'])            pred_dict['pred_scores'] = torch.Tensor.tolist(pred_dicts[0]['pred_scores'])            pred_dict['pred_labels'] = torch.Tensor.tolist(pred_dicts[0]['pred_labels'])     return pred_dict, pcd if __name__ == '__main__':     cfg_file = "pointpillar.yaml"    data_path = "000008.bin"    ckpt_path = "pointpillar_7728.pth"        pred_dict,pcd = model_inference(cfg_file=cfg_file, data_path=data_path, ckpt_path=ckpt_path)       vis = open3d.visualization.Visualizer()    vis.create_window(window_name="kitti")    vis.get_render_option().point_size = 2.0    vis.get_render_option().background_color = np.zeros(3)    axis_pcd = open3d.geometry.TriangleMesh.create_coordinate_frame(size=1.0, origin=[0, 0, 0])    vis.add_geometry(axis_pcd)     pts = open3d.geometry.PointCloud()    pts.points = open3d.utility.Vector3dVector(pcd)    pts.colors = open3d.utility.Vector3dVector(np.ones((len(pcd), 3)))    vis.add_geometry(pts)     box_color = [[0,1,0],[0,1,1],[1,1,0],[1,1,1]]     for i in range(len(pred_dict['pred_boxes'])):        if(pred_dict['pred_scores'][i]<0.5):            continue        center = pred_dict['pred_boxes'][i][0:3]        lwh = pred_dict['pred_boxes'][i][3:6]        axis_angles = np.array([0, 0, pred_dict['pred_boxes'][i][6]])        rot = open3d.geometry.get_rotation_matrix_from_axis_angle(axis_angles)        box3d = open3d.geometry.OrientedBoundingBox(center, rot, lwh)        box3d.color = box_color[pred_dict['pred_labels'][i]-1]         vis.add_geometry(box3d)                       vis.run()    vis.destroy_window()<div class="figure-img" data-ke-type="image" data-ke-style="alignCenter" data-ke-mobilestyle="widthOrigin"><img src="https://t1.daumcdn.net/cafeattach/1RgNt/9f0ddeaf94a590021df990550a04cb42133cb6e3" class="txc-image" data-img-src="https://t1.daumcdn.net/cafeattach/1RgNt/9f0ddeaf94a590021df990550a04cb42133cb6e3" data-origin-width="1562" data-origin-height="824"></div>   3. 추론 결과를 이용하여 영상 파일에 3d 바운딩 박스를 그려라, 먼저 라이다 좌표계에서 8개의 3차원 꼭지점 좌표(get_box_points 함수 이용)를 구하고 좌표변환 행렬(Tr_vel_to_cam -> R0_rect -> P2)을 이용하여 영상 좌표계의 8개의 2차원 꼭지점으로 변환하고 opencv 함수를 이용하여 라인을 그려라 import cv2from utils import Calibration#import argparseimport globfrom pathlib import Pathimport open3d as o3d#from visual_utils import open3d_vis_utils asd Vimport numpy as npimport torchfrom pcdet.config import cfg, cfg_from_yaml_filefrom pcdet.datasets import DatasetTemplatefrom pcdet.models import build_network, load_data_to_gpufrom pcdet.utils import common_utils class DemoDataset(DatasetTemplate):    def __init__(self, dataset_cfg, class_names, training=True, root_path=None, logger=None, ext='.bin'):        """        Args:            root_path:            dataset_cfg:            class_names:            training:            logger:        """        super().__init__(            dataset_cfg=dataset_cfg, class_names=class_names, training=training, root_path=root_path, logger=logger        )        self.root_path = root_path        self.ext = ext        data_file_list = glob.glob(str(root_path / f'*{self.ext}')) if self.root_path.is_dir() else [self.root_path]         data_file_list.sort()        self.sample_file_list = data_file_list     def __len__(self):        return len(self.sample_file_list)     def __getitem__(self, index):        if self.ext == '.bin':            points = np.fromfile(self.sample_file_list[index], dtype=np.float32).reshape(-1, 4)        elif self.ext == '.npy':            points = np.load(self.sample_file_list[index])        else:            raise NotImplementedError         input_dict = {            'points': points,            'frame_id': index,        }         data_dict = self.prepare_data(data_dict=input_dict)        return data_dict def model_inference(cfg_file, data_path, ckpt_path):    #ext = '.bin'    cfg_from_yaml_file(cfg_file, cfg)    logger = common_utils.create_logger()        demo_dataset = DemoDataset(dataset_cfg=cfg.DATA_CONFIG, class_names=cfg.CLASS_NAMES, training=False, root_path=Path(data_path))    print(f'Total number of samples: \t{len(demo_dataset)}')    model = build_network(model_cfg=cfg.MODEL, num_class=len(cfg.CLASS_NAMES), dataset=demo_dataset)    model.load_params_from_file(filename=ckpt_path, logger=logger, to_cpu=True)    model.cuda()    model.eval‎()    pcd = []    pred_dict = {}    with torch.no_grad():        for idx, data_dict in enumerate(demo_dataset):            logger.info(f'Visualized sample index: \t{idx + 1}')            data_dict = demo_dataset.collate_batch([data_dict])            load_data_to_gpu(data_dict)            pred_dicts, _ = model.forward(data_dict)            pcd = torch.Tensor.tolist(data_dict['points'][:, 1:4])            pred_dict['pred_boxes'] = torch.Tensor.tolist(pred_dicts[0]['pred_boxes'])            pred_dict['pred_scores'] = torch.Tensor.tolist(pred_dicts[0]['pred_scores'])            pred_dict['pred_labels'] = torch.Tensor.tolist(pred_dicts[0]['pred_labels'])     return pred_dict, pcd if __name__ == '__main__':    cfg_file = "pointpillar.yaml"    data_path = "000008.bin"    ckpt_path = "pointpillar_7728.pth"    label_path = "/mnt/c/chan/data_object_label_2/training/label_2/000008.txt"    calib_path = "/mnt/c/chan/data_object_calib/training/calib/000008.txt"    image_path = "/mnt/c/chan/data_object_image_2/training/image_2/000008.png"    calib = Calibration(calib_path)    pred_dict, pcd = model_inference(cfg_file=cfg_file, data_path=data_path, ckpt_path=ckpt_path)    lineset = [[1,0], [0,2], [1,7], [2,7], [2,5], [3,0], [6,1], [7,4], [5,4], [4,6], [3,6], [3,5]]    box_color = [[0,255,0],[0,255,255],[255,255,0],[255,255,255]]     image = cv2.imread(image_path)     for i in range(len(pred_dict['pred_boxes'])):        if pred_dict['pred_scores'][i] < 0.5:            continue         center = pred_dict['pred_boxes'][i][0:3]        lwh = pred_dict['pred_boxes'][i][3:6]        angle = pred_dict['pred_boxes'][i][6]        axis_angles = np.array([0, 0, angle])        rot = o3d.geometry.get_rotation_matrix_from_axis_angle(axis_angles)        box3d = o3d.geometry.OrientedBoundingBox(center, rot, lwh)        corners_3d = np.asarray(box3d.get_box_points())  # shape: (8,3)         # 변환: (3D -> 2D)        corners_3d_hom = np.hstack((corners_3d, np.ones((8, 1)))).T  # shape: (4, 8)        corners_cam = calib['R0_rect'] @ (calib['Tr_velo_to_cam'] @ corners_3d_hom)        corners_2d = calib['P2'] @ corners_cam         corners_2d[0, :] /= corners_2d[2, :]        corners_2d[1, :] /= corners_2d[2, :]        corners_2d = corners_2d[:2, :]  # shape: (2, 8)         # 점 번호와 점 찍기        for j in range(8):            pt = (int(corners_2d[0, j]), int(corners_2d[1, j]))            cv2.circle(image, pt, 5, (255, 0, 0), -1)            cv2.putText(image, str(j), pt, cv2.FONT_HERSHEY_SIMPLEX, 0.6, (0, 0, 255), 1)         # 선 그리기        label_idx = pred_dict['pred_labels'][i]        color = box_color[label_idx - 1]  # 클래스 ID가 1부터 시작한다고 가정        for line in lineset:            pt1 = (int(corners_2d[0, line[0]]), int(corners_2d[1, line[0]]))            pt2 = (int(corners_2d[0, line[1]]), int(corners_2d[1, line[1]]))            cv2.line(image, pt1, pt2, color, 2)     cv2.imshow("Detection Result", image)    cv2.waitKey(0)    cv2.destroyAllWindows()<div class="figure-img" data-ke-type="image" data-ke-style="alignCenter" data-ke-mobilestyle="widthOrigin"><img src="https://t1.daumcdn.net/cafeattach/1RgNt/f82bf8f117bcc80b49cdc607eac7195e32fc4e67" class="txc-image" data-img-src="https://t1.daumcdn.net/cafeattach/1RgNt/f82bf8f117bcc80b49cdc607eac7195e32fc4e67" data-origin-width="1257" data-origin-height="439"></div>