|
Ebook(1) Ebook 파일 내부 분석 |
문서번호 : 2013-EBP0001 |
작성자 : 안정록 | |
작성일 : 2013-11-07 | |
예상시간 : 1H |
실제 수행 시간 1H 30M |
EPUB이란? |
EPUB은 Electronic publication의 줄임말로, 국제디지털출판포럼(IDPF,International Digital Publishing Forum)에서 제정한 전자책의 기술 표준이다. 2007년 9월에 전 세계 공식 표준이 된 이후 많은 전차책 업체가 이 EPUB 포맷을 채택해 e북 콘텐츠를 생산하고 있다. 북미의 경우 아마존의 킨을 제외한 대부분의 전자채 단말기가 이 EPUB을 지원하며, 국내 전자책 업체들도 대부분 EPUB을 지원한다.
전자책 포맷에 EPUB, PDF, AZW 등이 있는데, 이 중 가장 대중화된 포맷이 바로 EPUB이다. 만일 전자책 표준이 없었다면 전자책 업체들은 각각의 포맷을 지원하는 소프트웨어를 설치해야 하는 불편함을 겪을 것이다. |
EPUB의 특징 |
1. EPUB은 다양한 화면 사이즈에서 볼수 있도록 설계되었으나 XHTML1.1을 수용 2. 글자크기를 확대시 리플로우(Reflow)가 되면서 전체페이지가 재계산된다. 3. 레이아웃을 유지하는 형태와 기본적으로 구조가 틀려 리플로우를 고려한 편집이 필요 |
EPUB의 장단점 |
Mp3가 아날로그 음악 시장의 판도를 바꾼 것과는 달리 EPUB는 전자책 시장을 완전히 장악하지 못했다. 장점과 단점이 뚜렷하기 때문이다. 따라서 현재 전자책 시장은 EPUB와 pdf(어도비 사의 문서 표준)가 각각 독자적인 영역을 구축하고 있다.
EPUB의 가장 큰 장점은 자동공간조정(Reflowable)이 가능하다는 것이다. 이는 사용하는 단말기의 크기에 맞춰 자동으로 최적화되는 기능이다. 위의 특징과 같다. 그러나 이 자동공간조정 기능은 이미지가 많은 전자책에서는 독이 될 수 있다. 잡지나 여행, 요리등의 전문서적은 문자와 이미지의 배열에 편집자의 집필 의도가 담겨 있는 경우가 많다. 이를 EPUB로 보게 되면 문자와 이미지의 배치가 망가지면서 종이책 원본이 전달하고자 하는 의미를 망쳐버릴 수 있기 때문이다. 이를 보완할 수 있는 포맷이 바로 pdf다. pdf는 일반적으로 종이책 원본과 똑 같은 크기로 제작된다. 따라서 화면이 작은 스마트폰으로 보게 되면 종이책의 일부밖에 볼 수 없다. 다른 부분을 보려면 화면을 드래그해야 하지만 원본의 편집 구도를 그대로 살릴 수 있다는 것이 장점으로 꼽힌다. 또한 만화책과 같은 이미지 중심의 종이책을 읽기에 편하다. 스마트폰으로 EPUB 포맷의 만화책을 본다면 이미지가 지나치게 줄어들어 글자를 제대로 읽을 수 없다.
따라서 EPUB은 소설과 같은 문자 위주의 종이책과 화면이 작은 단말기(스마트폰 등)에 적합하고, pdf는 만화책과 같은 이미지 중심의 종이책과 화면이 큰 단말기(태블릿 PC 등)에 적합하다. 현재 EPUB를 서비스하고 있는 종이책 업체들은 pdf를 함께 지원하거나, 현재는 지원하지 않더라도 향후 지원할 계획을 세우고 있다.
|
참조 http://navercast.naver.com/contents.nhn?rid=122&contents_id=4994
EPUB의 구조 | |
EPUB의 확장자를 zip으로 변경한 후 압축을 풀면 여러 폴더와 파일들이 나타난다. ([epub-samples] http:// https://code.google.com/p/epub-samples/ 에 있는 파일 사용 | |
|
Epub의 내부
두 개의 epub 파일의 압축을 풀었다. |
|
/META-INF 내부
Contatiner – epub 파일의 내용 요소들의 위치를 알려주는 선언문 이라고 볼 수 있다. |
|
두 개의 EPUB 파일들의 각각 OEBPS 와EPUB 폴더의 내용물이다. Images –사진과 그림 등의 이미지 파일 Styles – 선이나 글꼴, 색등의 정보 Text – 책의 내용 Opf – epub의 내용물 파일의 목록과 서지 정보들을 담고 있따 즉, 이 epub에 들어 있는 이미지 파일 텍스트파일 기타 파일들의 목록과 책의 저자, 출판사 등의 정보를 포함 Toc.xthml –책의 목차 정보를 담고 있다. 전자책 디바이스나 뷰어 프로그램에는 목차를 불러오는 기능들이 있는데 이때 참조하는 파일이다. 2번째 폴더에는 navigation 폴더 안에 들어있다. |
Mimetype 파일의 내부 | |
|
Mimetype 은 zip 파일 형태로 된 ePub이라는 선언문이다. 이 파일이 없다면 해당 파일은 ePub으로 구동될 수 없다. |
Container 파일 |
|
Epub 파일의 내용 요소들이 어디 있는지에 대한 선언문이라고 볼 수 있다. Mimetype 파일과 마찬가지로 이 파일이 없으면 epub으로 동작하지 않는다. |
Toc.xthml 파일 |
|
네비게이션의 정보를 담고 있다. |
Mymedia-lite.opf 파일 |
|
Metadata –epub과 관련된 다양한 정보를 수록할 수 있다. 제목, 저자, 언어 등을 가지고 있다, Mainfest – 컨텐츠와 관련된 내용, 스타일, 폰트, 이미지 등을 반영해야 한다. 통산 반복적으로 사용하므로 복사하여 쓰인다. Spine – 컨텐츠의 읽는 순서와 관련된 내용이다. 스타일 폰트, 이미지 정보등을 포함한다. 아울러 별도의 ncx 파일과 연계되어야 한다. |
Book_001.xhtml파일 |
|
책의 컨텐츠 부분으로 보인다. |
주의사항 |
EPUB의 내부 구조는 EPUB을 만드는 사람에 따라 다를 수도 있다. 위의 경우와 같이 폴더의 구조가 다를 수 있다. 예를들면 위에는 없지만 EPUB 전자책에 동영상, 자막 소리와 같은 것도 넣어 두었따면 위의 사진에서 보았던 폴더 말고도 동영상 파일들이 들어있는 video 폴더 자만 파일들이 들어 있는 captions 폴더, 오디오 파일들이 들어있는 audio 폴더 등이 생길 수 있다. |
예상시간에 대한 고찰 |
선문비트프로젝트 카페에 EPUB 내부 분석을 한 파일과 참조한 사이트들이 있어서 그걸 보고 했는데도 생각보다 시간이 많이 걸렸다. 내부 파일들이 무엇을 의미하는지 보고, 찾고 또한 예제 파일이 일본어,아랍어(?)라서 정확히 무엇을 의미하는지 파악이 잘 안되서 30분 더 소비되었다. 분석할 파일을 고를 때에도 신중하게 선택하는게 중요하다. |