요새 chatgpt로 넘 재밌게 놀고 있습니다. 웃게에 글을 거의 안쓰는데
저처럼 코딩을 아예 모르는사람도 이런걸 할 수 있구나 소개해드리려고 글 씁니다 !!
관련자분들이 보시면 어이없을 수도 있어요 ㅋㅋ
먼저 삼성증권에서 영상생성모델 소라ai의 공개로 인한 산업 전반에 관한 리서치를 발간했는데요.
이 리서치를 읽으려고 하니까 pdf 페이지가 116페이지임 ..
그래서 gpt4o의 성능확인도 할겸 pdf 파일을 넣고 요약 해달라고 했습니다.
그런데 배경이 화려해서 그런지 인식을 하지 못한다고 하네요. 그래서 8번째 페이지만 요약해달라고 해봤습니다.
그런데 pdf파일로는 텍스트 인식이 안되니까 알아서 이미지로 변환해서 텍스트로 인식했다고 하네요??
그래서 이미지 파일로 변경해서 해보려니 5개씩 업로드를 하라고 합니다.. 116개를 어느새??
그래서 쉬운 방법을 물어봤더니 pdf파일 전체를 이미지로 한답니다. 그러고 혼자 분석 하더니 실패하고 또 혼자 텍스트 파일로 업로드 하라고 대안을 알려줍니다.
pdf파일을 텍스트파일로 변환하는 방법을 물어보니 코드를 알려줬습니다. 이 코드를 Thonny에 복붙하니까 오류 떠서 오류도 그대로 복붙해서 다시 전달해줍니다. (Thonny도 gpt가 추천해줌.)
아하 슬래시를 거꾸로 써서 안됐구나.. 이렇게 방법도 알려주고 알아서 복붙하기 편하라고 수정된 코드를 다시 올려줍니다.
이걸 몆 번 반복합니다.
PyPDF2의 최근 버전에서 PdfFileReader가 PdfReader로 변경되었습니다. 따라서 이를 반영한 코드를 사용해야 합니다.
다음은 수정된 코드입니다:
이런식으로 계속해서 수정해서 알려주면 그대로 복붙하고 오류뜨면 오류 복붙해서 붙이고 하면 끝입니다.
변환된 txt파일을 업로드 하니까 요약을 잘 뽑아줍니다.
그런데 쓰고 보니 앞으로 gpt를 사용할 때나 파일을 변환할때 유용할 것 같아서 코드를 업그레이드 시키고 싶어졌습니다.
이전에는 코드안에 pdf파일 이름을 지정해서 그 파일만 가능했지만 코드를 실행했을때 pdf파일을 선택하고 변환된 txt파일을
저장할 위치를 지정할 수 있게 해달라고 했습니다
tkinter도 깔으라고 해서 깔고 실행을 시켜보니 한번에 작동이 잘 됐는데 이후에 또 업데이트 하느라 중간은 스크린샷이 없습니다
코드로 작동하면 항상 thonny를 켜야하고 다른컴퓨터에서는 사용을 못하니 exe 실행파일로 만드는 방법을 물어봤습니다.
모르는거 몆번 더 물어봐가면서 PDF_TO_TXT 파일을 만드는데 성공했습니다.
이걸 실행하면
이렇게 pdf파일을 고를 수 있게 창이 뜨고 .. pdf파일을 찾아 넣으면 어디로 저장할 건지 선택합니다. 그럼 txt 파일이 생기고..
이런 식으로 텍스트가 아주 잘 추출이 됐습니다. 근데 하는 김에 기능을 추가 하고 싶어졌습니다ㅎㅎ
이렇게 엑셀로 변환하는 코드, 워드로 변환하는 코드를 따로 알려줬습니다. 한글파일은 공식적으로 배포되지 않는
라이브러리 라면서 (pyhwp) 다른 방법을 얘기하길래 그냥 워드랑 엑셀만 추가해보기로 했습니다.
그냥 생각나는 대로 말해도 찰떡같이 알아듣고 만들어줍니다 !! 그래서 만들어진 프로그램을 실행시켜 보니까 ...
변환하고 싶은 파일 확장자를 직접 텍스트로 치게 만들어놨습니다ㅋㅋ 그래서
변환할 파일 형식을 물어볼 때 텍스트를 입력하는 방식이 아니라 버튼으로 눌러서 선택할 수 있었으면 좋겠어.
이렇게 말하고 다시 수정된 코드를 받아 실행 시켰습니다.
이렇게 버튼이 나오고 버튼을 누르면 각 파일들이 생겨납니다ㅋㅋ txt한번 xslx한번 docx한번 누르면 3개가 생깁니다.
이렇게... 코드를 완성시키고 아까 알려준대로 exe파일로 만들어서 쓰려고 합니다ㅎㅎ
물론 다른 방법들이 많이 있겠지만 저처럼 가끔씩 쓰는 사람들은 할때마다 구글링해서 찾고 가끔 잘 되지도 않는 경우가 많아서
이렇게 직접 만들어보니 뿌듯합니다ㅎㅎ
그리고 웃게에 글을 안써봐서 이미지랑 같이 업로드하는게 생각보다 힘드네요..
글 읽기 불편해도 끝까지 읽어주신 분들 감사합니다.
참고로 chatgpt plus 유료 구독해서 gpt4o만 사용했습니다.
유튜브 보면 전공자 분들은 더 대단한 것도 엄청 만들어 쓰시더라구요.
쌩초짜 30대도 이정도는 하니까 여러분들도 도전해보세요!
첫댓글 진짜 개발자도 자리가 없어진다
오우
미쳣넼ㅋㅋㅋㅋㅋㅋㅋ
서치도 재능이라 개발자하시죠
사실 이거 만들기 전에 고객 포인트 적립 같은것도 만들어보고 했는데ㅜㅜ 장사랑 병행하다보니 깊게 파고 들 시간이 없어요 넘 재밌긴 해요ㅋㅋ
와우....ㄷㄷ
ㄷㄱ
나보다 잘하잖아..
알고리즘만 생각해낼 수 있다면 뭐든 가능해진 세상
유료결제 해야되죠?
무료로 gpt쓰는 방법도 있는걸로 알아요. 저는 구독한지 좀 되서 무료로 되는지 유료만 되는지 잘 모르겠어요
chatgpt로 엑셀 vba짜서 실무에 쓰는중인데 업무속도 엄청 빨라짐
와 쉽지않던데 역시 사람마다 활용도가 다르네요 대단하십니다
ㄷㄱ
그냥 활용을 잘 하시는 듯 ㅋㅋㅋ
와
Gpt4
ㄷㄱㄷㄱ
그냥 코딩에 뛰어드셨어도 잘하셨겠어요 응용력이 ㅅㅌㅊ
오 잘하셨네여
ㄷㄱ
ㄷㄱ 코딩
ㄷㄱ
코딩댓글
ㄷㄱ
ㄷㄱ
ㄷㄱ