Chat GPT는 2015년 12월 설립된 인공지능 기업 OpenAI에서 개발되었다.
ChatGPT는 2015년 12월 설립된 인공지능 기업 오픈에이아이(OpenAI)에서 개발되었다. OpenAI는 미국의 기업가이며 투자자인 일론 머스크(Elon Musk), 샘 알트만(Sam Altman)과 인공지능 분야 연구원 미국의 존 슐만(John Schulman), 러시아 출신 일리야 서츠케버(Ilya Sutskever), 폴란드 출신 보치엑 자렘바(Wojciech Zaremba), 미국의 컴퓨터 시스템 전문가 그렉 브록만(Greg Brockman)이 책임감 있고 안전한 방식으로 인공지능을 홍보하고 개발하는 것을 목표로 설립한 스타트업으로, 고도의 기계 학습 모델 및 알고리즘을 포함한 최첨단 인공지능 기술을 연구, 개발한다.
ChatGPT의 기반은 2018년에 개발된 OpenAI의 지피티(GPT, Generative Pre-trained Transformer) 언어 모델이다. GPT는 단방향으로 텍스트를 생성하는 변환기 기반 언어 모델이었으며, 대량의 텍스트 데이터 뭉치를 기반으로 학습하여 기계 번역, 질문 답변 및 요약과 같은 다양한 언어 생성 작업에 맞게 개량되었다. 2018년에 개발된 GPT의 첫번째 버전인 GPT-1 이후, 훨씬 더 큰 규모의 데이트로 학습된 버전인 GPT-2가 2019년에 개발되었다. 2020년에는 GPT-3이 개발되었는데, 규모와 성능 측면에서 상당한 진전을 이루어냈다.
ChatGPT는 2019년에 GPT를 기반으로 개발되었으며, 대화형 언어 생성 작업을 위해 주어진 질문에 대한 응답으로 텍스트를 생성하도록 학습되었다. 개발 이후 ChatGPT는 가상 고객 서비스 에이전트, 챗봇 및 언어 기반 대화형 시스템과 같은 다양한 애플리케이션에서 사용되기 시작했으며, GPT 기능 향상에 비례하여 지속적으로 기능이 개선되었다. 2022년 12월에는 한번에 3,000단어 수준을 분석하는 GPT-3.5의 개발과 함께 이에 기반한 ChatGPT의 베타 버전이 일반인에게 공개되었다.
2023년 11월 6일에는 2023년 4월까지의 데이터를 학습한 GPT-4 터보(Turbo)가 공개되었다. 텍스트 전용 버전, 멀티모달 버전으로 출시되는 GPT-4 터보는 약 10만 단어를 프롬프트에 입력하는 것이 가능하며, 이미지 생성 AI인 '달리 3(DALL-E 3)’과 연동해 이미지 생성이 가능하고, 텍스트-음성 변환을 지원해 음성으로 응답할 수도 있다. 이미지 분석, 데이터 분석, 문서 업로드 및 PDF 검색 등을 지원한다.
ChatGPT는 딥 러닝 기술, 특히 트랜스포머 아키텍처(Transformer architecture)를 기본 도구로 사용한다. 트랜스포머 아키텍처는 텍스트의 분류와 자연어 처리 작업에 사용되는 도구로, 2017년 소개된 이래 인공지능 분야에서 가장 많이 인용된다. 이 도구는 질문의 의도와 중점에 따라 텍스트에 포함된 여러 요소의 중요성을 평가하여 중요도 순으로 배열하도록 설계되었다.
ChatGPT는 단순히 검색되거나 입력된 정보를 그대로 보여주는 수준을 넘어, 주어진 질문과 문맥을 바탕으로 텍스트를 생성하거나, 주어진 텍스트의 다음 단어나 문장을 예측할 수 있다. 또한 다양한 방식으로 텍스트를 분류할 수 있으며, 주어진 문맥과 정보를 바탕으로 질문에 응답할 수 있다. 또한 한 대화 상대방과의 이어진 대화 과정에서 대화의 상황을 인식하고 일관성 있는 응답을 생성할 수 있다. 특정한 주제어나 조건이 주어졌을 때, 이 조건을 충족하는 시나 소설, 수필의 작성이 가능하며 코딩 작업의 수행도 가능하다.
ChatGPT는 영어나 한국어뿐만 아니라 세계 여러 언어로 된 텍스트를 처리하고 생성할 수 있다. 그러나 어떤 언어로 된 텍스트를 이해하고 생성된 결과물의 품질은 그 언어 학습 데이터의 품질과 양에 따라 차이가 있다. 일반적으로 학습에 사용된 데이터가 다양하고 대표성이 높을수록 챗지피티 응답의 품질은 좋아진다. 한국어로 질문할 경우 한국어로 작성된 응답을 볼 수 있다.
ChatGPT는 찾고 싶은 정보가 있는 사이트를 제시해주는 구글과는 달리, 사전에 학습한 데이터에서 질문의 의도에 부합한 정보만을 수집해 이를 마치 사람처럼 문장으로 작성하여 응답한다는 점에서 큰 차이가 있다. 그러나 정확도에 대해서는 많은 논란이 있는데, 이는 ChatGPT가 질문의 의도에 부합하는 정보를 찾아서 제공하는 것이지, 그 정보가 옳은 정보인지를 확인하기는 어렵다는 점 때문이다. ChatGPT가 수집한 데이터 자체의 오류에 대해서 판단할 능력은 갖고 있지 않기 때문이다.
또한 ChatGPT가 학습한 데이터의 시점도 문제가 될 수 있다. 2022년 12월 일반에게 공개된 GPT-3.5 기반의 ChatGPT의 경우, 2021년까지 수집된 데이터로 학습했기 때문에 2022년 1월 이후의 정보는 반영되지 않은 응답을 제시할 것이다. 이는 실시간 검색을 기반으로 하는 구글이나 취재를 기반으로 하는 언론 보도와는 달리 정보의 시의성에서는 오류가 있을 가능성이 있음을 의미한다.
ChatGPT는 언어 모델의 인공지능이기 때문에 수치계산을 하지 않는다는 것도 주의해야 할 점이다. 어떤 수식의 답이나 통계를 요청하는 경우, ChatGPT는 해당 질문에 대해 수집한 정보 안에서 찾아낸 답이나 통계 수치를 제시할 뿐, 직접 연산을 수행하여 답을 도출하는 것이 아니기 때문이다.
이와 같이 수집한 데이터 뭉치를 바탕으로 ChatGPT와 같은 대화형 AI가 생성한 응답 가운데에는 질문의 의도에 부합하지 않거나 불충실하게 생성한 응답이 포함될 수 있다. 대화형 AI가 이와 같은 응답을 스스로 맞거나 존재하는 정보라고 착각하여 제시하는 경우를 인공지능 분야에서는 심리학에서의 개념을 빌려 ‘환각(hallucination)', 또는 '인공환각(artificial hallucination)' 효과라고 한다. 따라서 ChatGPT의 사용자는 ChatGPT의 응답 내용에 포함되어 있을지 모르는 환각 효과에도 주의할 필요가 있다.
2023년 2월 1일 월 20달러의 구독 서비스 ‘ChatGPT Plus’가 출시되었다. ChatGPT Plus 구독자에게는 더 빠른 응답의 제공, 이용자 폭주 관계없이 정상 접속 가능, 신규 서비스 우선 제공 등의 특전이 있다. ChatGPT Plus는 미국내 사용자를 대상으로 제공되며, 이후 다른 국가와 지역으로 확대될 예정이라고 발표되었다. 2023년 3월 14일에는 ChatGPT Plus를 통해서 대규모 AI 언어 모델(LLM) GPT-4가 공개되었으며, 마이크로소프트(MS)의 검색엔진 빙(Bing)에도 연동되었다. GPT-4는 25,000단어 이상을 한 번에 분석하는 것으로 알려졌다.
ChatGPT는 2023년 3월 한국의 업스테이지가 개발한 모바일 메신저용 대화 프로그램 애플리케이션 아숙업(AskUp)에도 연동되었다. 아숙업은 광학문자인식(OCR) 기술과 ChatGPT를 결합하여 카카오톡이나 라인을 통해 사용자가 이용할 수 있도록 한 프로그램으로, 사용자가 문서 이미지를 올리거나 텍스트로 질문하면 GPT3.5 및 GPT4 기반으로 생성된 인공지능의 답변을 받을 수 있다.
2023년 5월 18일에는 애플 모바일 운영체제인 iOS용 어플리케이션을 출시하여, 휴대용 모바일기기에서도 사용할 수 있도록 했다. 단, 당분간은 미국내 지역에서만 서비스가 제공되도록 했다. 5월 23일 마이크로소프트(MS)에서는 업무용 문서작성 도구인 워드와 파워포인트에 이어, 운영체제인 ‘윈도11’와 인터넷 브라우저 엣지에 ChatGPT 기반 인공지능 비서 '코파일럿'을 탑재했으며, ChatGPT의 유료 버전인 ChatGPT Plus에서 빙을 기본 검색엔진으로 채택했다고 발표했다.
항상 건강하고 행복하세요.