# 천개의 파일 내용을 하나의 엑셀 파일로 만들기
import time
import os
import pyexcel as px
import sys
print("작업 시작 ... ")
start_time = time.time() # 시작 시간 설정
directory = "personal_info"
outfile_name = "merge_ID.xlsx"
input_files = os.listdir(directory)
CONTENTS = [] # 데이터가 저장될 리스트
HEADERS = [] # 헤더를 저장할 리스트
contents_has_header = False # 헤더 입력을 위한 불리언 변수
for file_name in input_files:
if ".txt" not in file_name: # .txt 파일이 아닌 경우에 대한 처리
continue
file = open(directory + "/" + file_name, encoding='utf8')
contents = [] # 내용을 저장할 리스트를 만듭니다.
# 파일의 내용물을 한 줄씩 읽어오면서 작업을 수행
for line in file:
# 양식이 잘못된 라인은 스킵
if " : " not in line:
continue
# 텍스트파일의 헤더와 내용물을 분리합니다.
header, content = line.strip().split(" : ")
# 아직 헤더가 입력되지 않았다면 헤더 작성
if not contents_has_header:
HEADERS.append(header)
contents.append(content) # 읽어온 데이터를 정리합니다.
# 아직 헤더가 입력되지 않았다면 헤더를 입력
if not contents_has_header:
CONTENTS.append(HEADERS)
contents_has_header = True
CONTENTS.append(contents) # CONTENTS 에 헤더와 내용물을 입력
file.close()
# CONTENTS에 저장된 자료를 엑셀파일로 출력
px.save_as(array=CONTENTS, dest_file_name=outfile_name)
print("작업 종료.")
# 작업에 총 몇 초가 걸렸는지 출력합니다.
end_time = time.time()
print("총 작업 시간 : " + str(end_time - start_time) + " 초.")
카페 게시글
RPA
파일 다루기
천개의 파일 내용을 하나의 엑셀 파일로 만들기
주인장
추천 0
조회 39
21.08.18 00:43
댓글 0
다음검색