출처; 다음백과사전
정식 명칭은 구텐베르크 문학기록보관재단 프로젝트(Project Gutenberg Literary Archive Foundation).
디지털화된 공유작품들을 전자도서관에 보유하거나 전자책으로 만들어 웹 사이트에서 다운로드할 수 있도록 제공하는 자원봉사자들의 비영리 조직.
이 프로젝트는 1971년 7월 4일 일리노이대학교 학생이던 마이클 하트가 미국독립선언문을 무료로 배포하기 위해 이 학교의 컴퓨터 시스템에 글을 입력하면서 시작되었다. 그는 곧이어 윌리엄 셰익스피어의 작품와 성경으로도 같은 작업을 했다. 이렇게 시작된 것이 구텐베르크 프로젝트로, 가장 오래된 디지털 도서관이다. 1923년 이전에 출판된 모든 책의 저작권은 75년이 지나면 소멸되어, 이 시점부터는 공유물에 속하게 된다. 1923~77년에 출판된 작품들은 95년 간 저작권이 존속한다. 그 이후에 출판된 책들은 모두 작자의 사후 70년 후에 저작권이 소멸하거나, 또는 공저일 경우에는 출판된 후 95년이 지나면 소멸한다.
그 후 하트는 인터넷의 확산으로 전세계적으로 지대한 관심을 받기 전까지, 20년이 넘도록 100권의 책을 기록했다. 이 프로젝트는 전 세계에서 수백에서 수천 명의 자원봉사자들이 참여할 만큼 커졌고, 하트는 웹 사이트를 유지하기 위한 기금 마련 등 행정적인 업무에 치중하게 되었다. 1990년대에 검색이 시작된 공유작품 수와 기록된 작품 수는 1997년에 1,000권, 2002년 5,000권, 2003년 1만 권, 2005년 1만 5,000권, 2006년 2만 권, 2008년 2만 5,000권으로 계속 증가했다.
뿐만 아니라, 수십 개의 미러 사이트(사이트의 내용은 같으나 인터넷 주소는 다른 사이트)가 전세계에 만들어졌다. 이 미러 사이트들에서도 전자책이 저장되고 다운로드가 가능했다. HTML이나 어도비시스템스사의 이동문서형식(portable document format/PDF)의 작품들이 존재하기도 한다. 그러나 대부분의 작품들은 제한적인 활자판과 그림이 없는 아스키(ASCII, 미국정보교환표준부호) 문자를 사용한 단순한 문서로 이루어진다.
2000년에 찰스 프랭크스가 구텐베르크 프로젝트를 위해 검색된 문서의 교정 작업을 분석하는 웹 기반 프로그램인 디스트리뷰티드 프루프리더스(배급 교정자)를 구축했다. 2002년 디스트리뷰티드 프루프리더스는 구텐베르크 프로젝트에 포함되었다. 자원봉사자 팀들 간에 교정 내용을 전달하는 기술은 2002년 유명한 기술 웹 사이트인 슬래시도트가 개발했다. 2009년까지 구텐베르크 프로젝트 책들의 절반가량은 디스트리뷰티드 프루프리더스를 사용하여 조정되었다.
1997년부터 다른 언어로 된 작품들을 추가하기 시작했으나, 구텐베르크 프로젝트의 작품들은 대부분 영어로 되어 있다. 비영어권 작품의 작업을 위해 2004년 유럽 구텐베르크 프로젝트와 유럽 디스트리뷰티드 프루프리더스가 결성되었다. 구텐베르크 프로젝트는 현재 50개 이상의 언어로 된 작품들을 보유하고 있다.
위키백과, 우리 모두의 백과사전.
프로젝트 구텐베르크(Project Gutenberg)는 인류의 자료를 모아서 전자정보로 저장하고 배포하는 프로젝트로, 1971년 미국인 마이클 하트(Michael Hart)가 시작했다.
인쇄술을 발명하여 지식의 전달을 급속도로 확장시킨 요하네스 구텐베르크의 이름에서 따온 것으로, 인터넷에 전자화된 문서(e-text)를 저장해 놓고 누구나 무료로 책을 받아 읽을 수 있는 가상 도서관을 만드는 것을 목표로 한다. 수많은 자원봉사자들이 인터넷을 이용해 기여하여 만들어지는 프로젝트로 수많은 고전의 원문이 모여 있다.
2006년 3월 프로젝트 구텐베르크 발표에 따르면, 프로젝트는 18,000개 항목 이상의 전자문서를 보유하고 있으며, 매주 50여개의 새로운 전자책이 새롭게 등록되고 있다고 한다.
프로젝트에 등록된 전자책은 대부분이 서구의 문학작품으로 이루어져 있다. 소설, 시, 단편소설, 드라마 등의 문학작품 외에 요리책, 사전류, 정기간행물이 포함되어 있다. 또한 일부 오디오 파일과 음악 악보 파일도 갖고 있다.
대부분은 영문 서적이지만, 독일어, 프랑스어, 이탈리아어, 에스파냐어, 네덜란드어, 핀란드어, 중국어, 포르투갈어, 라틴어, 스웨덴어, 라틴어, 에스페란토로 된 책도 있으며, 여타 언어 문서도 꾸준히 증가하고 있다.
문서는 주로 아스키 문자 집합, 때때로 ISO-8859-1 문자 집합으로 인코딩된 텍스트문서를 언제나 내려받을 수 있으며, HTML등의 다른 형식의 문서도 받을 수 있다. 편집이 어려운 PDF등의 문서형식은 프로젝트가 지향하는 바와 맞지 않는 것으로 여겨지지만, PDF형식을 이용할 수 있는 문서도 있다. 최근 수년동안 XML형식을 도입할지에 대한 토론이 있었지만, 토론은 지지부진하다.