|
새로운 형태의 디지털 아카이브에 대한 기사입니다.
New types of digital archives on the rise to help broaden public access 공공의 접근을 위한 새로운 형태의 디지털 아카이브 증가
More sophisticated solutions needed to improve user interface and enhance accuracy in building digital archive platforms
사용자의 연결증진과 디지털 아카이브 플랫폼구축의 정확성을 증진시키기 위하여 보다 정교한 해법이 필요하다.
By Yang Sung-jin 양성진 기자
Published: Sept 13, 2021 - 18:44 Updated: Sept 13, 2021 - 18:44
Korea Herald
Cho Myung-dae, CEO of Linked Data Center, demonstrated how a digital archive works by taking the Korean War records as an example. By clicking on the keyword, a number of search results instantly pop up in a well-arranged list of related subcategories such as specific battles, locations and people. This way, users don’t have to dig through piles of data without having a clue what they will get in the end.
링크드 데이터센터의 CEO 조명대씨는 한국전쟁의 기록을 예로 들어 디지털 아카이브가 어떻게 작동하는지 예시했다. 중요단어에 클릭하면 검색 결과가 특정 전투, 장소, 사람 등 관련된 세부분야별로 잘 정리된 리스트로 즉각 나타난다. 이 방법으로 사용자는 최종적으로 얻을 단서 없이 데이터뭉치를 찾을 필요가 없다.
“Searching through string matches is essentially limited,” Cho said. “We have to put together as much data as possible and filter out unnecessary information that is not needed by users.”
“스트링 매칭기법으로 검색하는 것이 근본적으로 제한적이다.“라고 조씨는 말했다.” “우리는 가능한한 많은 데이터를 모아야 만 하고 사용자에게 필요하지 않은 정보를 걸러내야 한다.”
Cho, a digital archive specialist who is also an adjunct professor of information and archival science at Hankuk University of Foreign Studies’ graduate school, outlined what should be done to build up an efficient and viable digital archive at an online forum titled “Digital Silk Road,” held on Sunday evening.
조씨는 디지털 아카이브 스페셜리스트이며 한국외국어대학교 대학원 정보기록 학과의 겸임교수이다. 일요일 저녁 열린 “디지털 실크로드”라는 온라인 포럼에서 효과적이고 실현가능한 디지털 아카이브를 구축하기위해 해야할 일의 윤곽을 정했다.
With digital technology specialists and professors in attendance via Zoom, Cho stressed that digital archive developers should bear in mind that the process of filtering, or what is known as “disambiguation,” is key to increasing the chance that users can discover more closely related pieces of data.
줌을 통해서 디지털기술 전문가와 교수들이 참석한 가운데 조씨는 디지털 아카이브 개발자들은 “중의성 제거”로 알려진 여과과정 이 사용자들이 관련된 데이터에 근접해서 발견할 수 있는 기회를 증가시키는 요체라는 것을 명심해야 한다고 강조했다.
“Amazon is famous for doing such simplified search, reducing the number of multiple search results to a couple of final clicks,” Cho said. “We have to use semantic priming based on human psychology in offering a guided online navigation for digital archives.”
“아마존이 많은 검색결과를 줄이고 마지막 몇 개의 결과를 얻는 단순한 검색으로 유명하다.” 고 조씨는 말했다. “우리는 디지털 아카이브를 온라인 검색을 할 때 인간심리학에 근거한 의미론에 의한 프라이밍을 사용해야만 한다.”
Both state agencies and private institutions have been establishing a wide range of digital archives, a treasure trove of social, cultural and historical assets in a digital format.
정부와 민간 연구소 모두 사회적, 문화적, 역사적 자산의 디지털형태의 광범위한 디지털 아카이브를 만들고있다.
Provincial governments are spearheading various digital archive programs to preserve local cultural assets, artworks and documents so that they could be better shared and studied online.
지방정부는 지방의 문화적 자산, 예술품, 서류를 보존해서 온라인으로 공부하고 공유할 수 있는 다양한 디지털 아카이브 프로그램을 만드는데 선두에 서고있다.
Museums and universities are also actively setting up digital archives in hopes that they will not fall behind in the shift toward web-based information search and academic endeavors.
박물관과 대학들도 웹기반의 정보와 학구적인 노력에 뒤지지 않기 위해 활발하게 디지털 아카이브를 구축하고있다.
The push for such digital archives has gained a strong momentum after COVID-19 forced people to stay at home and browse the internet for entertainment and information. The question is what data should be stored and which technology is more efficient in organizing public and private databases 이러한 디지털 아카이브 확산은 코비드19이후 사람들이 집에 머물러야 하기 때문에 엔터테인먼트나 정보검색을 할 강한 추진력을 얻었다. 문제는 공공과 민간 데이터베이스에 더 효과적인 기술은 무엇이고 어 떤 데이터를 저장해야 하는 지이다.
Treasure trove of hidden discoveries
숨겨져 있다가 발견된 보물
An archive refers to “a place where people can go to gather firsthand facts, data, and evidence from letters, reports, notes, memos, photographs, and other primary sources,” according to the US National Archives and Records Administration, which manages a vast amount of official government data with some 3,000 employees.
아카이브란 “사람들이 편지, 보고서, 노트, 메모, 사진 과 다른 1차 정보원으로 부터 직접 얻은 증거, 사실, 데이터 등을 가서 수집할 수 있는 곳”이라고 3,000명의 직원과 함께 공식적이고 방대한 정부 데이터를 관리하고 있는 미국 국립기록보관소는 정의하고있다.
The US archive agency says all people also have personal archives, or a collection of material that records important events from their family’s history.
미국기록보관소는 모든 사람은 자신의 개인 아카이브나 가족들의 역사를 말해주는 중요한 행사를 기록한 자료들을 가지고 있다고 말한다.
Thanks to digital technologies, the of personal and official data in cyberspace is accelerating at a breakneck pace. The use of digital archives is also on the rise. But what digital archives really are is often misunderstood.
디지털기술 덕분에 사이버공간의 개인적이거나 공식적인 데이터는 빠른 속도로 확산하고 있다. 디지털 아카이브의 이용도 상승하고 있다. 그러나 디지털 아카이브의 개념은 실제로는 흔히 잘못 인식되어 있다.
Researchers in the field of digital humanities say that a simple digitalization of data -- a digital extension of the existing offline archives -- is far from enough. The primary task behind the build-up of digital archives is to provide a venue where basic data and resources are readily available online so that both the public and professional researchers can use them with ease and understand their social, cultural and historical contexts.
디지털인문학 연구자들은 단순한 데이터의 디지털화-오프라인 아카이브의 디지털화-와는 거리가 있다고 말한다. 디지털 아카이브 구축 뒤에 있는 중요한 작업은 기본 데이터와 자원이 온라인에서 구현할 수 있어서 공공과 전문적인 연구자들이 쉽게 사용하고 사회적, 문화적, 역사적 맥락을 이해할 수 있는 장소를 제공하는 것이다.
While traditional education takes place in separate offline spaces such as universities, museums and historical sites, today’s students and researchers are moving to digital platforms that offer a rapidly increasing storage of all sorts of archives, a mixture that appears to provide more chances to identify hidden relations among facts.
전통적인 교육은 대학교, 박물관, 역사적인 장소 같은 개별적으로 오프라인의 공간에서 일어나지만 오늘날 학생들과 연구자들은 모든 종류의 아카이브가 급속하게 증가하고 사실들 간에 숨겨진 관계를 규명할 더 많은 기회를 주는 디지털 플랫폼으로 옮겨가고 있다.
The Korean government, recognizing the implications of such digital archives, is helping establish a variety of online archives. For instance, the National Museum of Korean Contemporary History runs a digital archive that includes historically important photographs, documents and related information. It has 44 categories of data ranging from politics and culture to Japanese colonial rule and pro-democracy movements. The museum’s digital archive also provides what is called an “open application programming interface” that allows users and third-party companies to develop application programs and services based on its database.
한국정부는 이러한 디지털 아카이브의 의미를 이해하고 다양한 온라인 아카이브 구축을 돕고있다. 예를 들어 국립역사박물관은 역사적으로 중요한 사진, 서류와 관련된 정보를 보유한 디지털 아카이브를 운영하고 있다. 정치, 문화, 일제시대, 민주화운동 등 44개 분야의 데이터를 보유하고 있다. 이 박물관의 “개방 애플리케이션 프로그램 인터페이스”라는 프로그램을 통해서 사용자와 제3자회사가 이 아카이브를 바탕으로 응용프로그램과 서비스를 개발할 수 있도록 하고 있다.
The need for digitalization is not limited to tangible documents and assets. Intangible data such as traditional songs are likely to get lost over time without special care. The Intangible Heritage Digital Archive is an example of a digital archive specializing in the preservation of intangible cultural assets such as traditional performing arts, music albums and festivals. 디지털화에 대한 필요는 유형의 문서나 자산에 국한하지 않는다. 전통가요 같은 무형자산은 특별한 관리가 없으면 잊혀질 수 있다. 무형유산 디지털 아카이브는 전통공연예술, 음악앨범 그리고 페스티벌 같은 무형문화자산을 보존하기위해 특화된 디지털 아카이브의 한 예이다.
Semantic web and its challenges
시맨틱 웹(차세대 지능형 웹)과 그 도전
In constructing digital archives, the term “semantic web,” coined by Tim Berners-Lee, who is also the inventor of the World Wide Web, is often mentioned. The term refers to an envisioned system that enables machines to readily “understand” data and respond to complex human requests based on their meanings. To achieve this, the relevant information resources should be semantically structured. An intricate and logical design of ontology -- a core structure to link information systematically for the sematic web -- is also needed to ensure database operability and better knowledge management.
디지털 아카이브를 구축하는데 “시맨틱 웹” 이라는 용어는 World Wide Web의 발명자를 만든 팀 버너스 리가 만들었다. 이 용어는 데이터를 이해할 수 있게 하고 그 의미에 근거한 복잡한 인간의 요구에 대응하기위해 고안된 시스템을 말한다. 이를 달성하기위해서 관련된 정보자원을 의미론적으로 구성하여야 한다. 하나의 복잡하고 논리적인 온톨로지적 논리 디자인 – 정보를 시맨틱 웹과 체계적으로 연결하는 핵심구조 - 데이터베이스 운영과 더 나은 지식관리를 확신할 필요가 있다.
At the online forum, Kim Hyeon, a professor of cultural informatics at the Academy of Korean Studies, said during the discussion session that there are a host of challenges in building open and flexible archives. “If we use semantic-based search, we can get meaningful information in various ways,” said Kim. “However, the user interface is not friendly enough.” 한국학중앙연구원의 문화정보학 교수 김현씨는 온라인포럼에서 공개적이고 유연한 아카이브를 구축하는데 상당한 도전이 있다. “만약 우리가 의미론에 근거한 검색을 한다면 우리는 여러가지 방법으로 의미있는 정보를 얻을 수 있다.”라고 김씨는 말했다. ”그러나 사용자 인터페이스가 충분히 편리하지 않다 .”
Another problem, Kim said, is that even though the same word is used in a digital archive, people have different ideas about the term, whose actual meaning can diverge and then create conflictions in the database.
김씨에 의하면 다른 문제는 동일한 단어가 아카이브에 디지털 아카이브에 사용되었지만 사람들은 실제의미가 다를 수 있고 데이터베이스에서 충돌이 일어날 수 있는 용어에 대해서 다른 아이디어를 가지고있다.
Kim, who leads a project to help recreate the ancient capital of Korea in cyberspace, said that 32 researchers on the project team map out their own ontology schemes and databases.
한국의 옛 수도를 재현하는 프로젝트를 주도하고 있는 김씨는 프로젝트팀의 32명의 연구자들이 자신들의 온톨로지와 데이터베이스를 계획하고 있다고 말했다.
“The aim is eventually to interconnect all of the different databases, but a problem can rise when a single concept refers to two different definitions,” Kim said. “This type of problem cannot be resolved by the use of artificial intelligence.”
“목적은 결과적으로 다른 데이터 베이스를 상호 연결하는 것이다. 그러나 문제는 한개의 개념이 두개의 다른 정의를 가지는 경우가 발생할 수 있다. 고 김씨는 말했다. “이런 유형의 문제는 인공지능을 활용해도 해결할 수 없다.”
ation resources should be semantically structured. An intricate and logical design of ontology -- a core structure to link information systematically for the sematic web -- is also needed to ensure database operability and better knowledge management. 디지털 아카이브를 구축하는데 “시맨틱 웹” 이라는 용어는 World Wide Web의 발명자를 만든 팀 버너스 리가 만들었다. 이 용어는 데이터를 이해할 수 있게 하고 그 의미에 근거한 복잡한 인간의 요구에 대응하기위해 고안된 시스템을 말한다. 이를 달성하기위해서 관련된 정보자원을 의미론적으로 구성하여야 한다. 하나의 복잡하고 논리적인 온톨로지적 논리 디자인 – 정보를 시맨틱 웹과 체계적으로 연결하는 핵심구조 - 데이터베이스 운영과 더 나은 지식관리를 확신할 필요가 있다.
At the online forum, Kim Hyeon, a professor of cultural informatics at the Academy of Korean Studies, said during the discussion session that there are a host of challenges in building open and flexible archives. “If we use semantic-based search, we can get meaningful information in various ways,” said Kim. “However, the user interface is not friendly enough.” 한국학중앙연구원의 문화정보학 교수 김현씨는 온라인포럼에서 공개적이고 유연한 아카이브를 구축하는데 상당한 도전이 있다. “만약 우리가 의미론에 근거한 검색을 한다면 우리는 여러가지 방법으로 의미있는 정보를 얻을 수 있다.”라고 김씨는 말했다. ”그러나 사용자 인터페이스가 충분히 편리하지 않다 .”
Another problem, Kim said, is that even though the same word is used in a digital archive, people have different ideas about the term, whose actual meaning can diverge and then create conflictions in the database. 김씨에 의하면 다른 문제는 동일한 단어가 아카이브에 디지털 아카이브에 사용되었지만 사람들은 실제의미가 다를 수 있고 데이터베이스에서 충돌이 일어날 수 있는 용어에 대해서 다른 아이디어를 가지고있다.
Kim, who leads a project to help recreate the ancient capital of Korea in cyberspace, said that 32 researchers on the project team map out their own ontology schemes and databases. 한국의 옛 수도를 재현하는 프로젝트를 주도하고 있는 김씨는 프로젝트팀의 32명의 연구자들이 자신들의 온톨로지와 데이터베이스를 계획하고 있다고 말했다.
“The aim is eventually to interconnect all of the different databases, but a problem can rise when a single concept refers to two different definitions,” Kim said. “This type of problem cannot be resolved by the use of artificial intelligence.”
“목적은 결과적으로 다른 데이터 베이스를 상호 연결하는 것이다. 그러나 문제는 한개의 개념이 두개의 다른 정의를 가지는 경우가 발생할 수 있다. 고 김씨는 말했다. “이런 유형의 문제는 인공지능을 활용해도 해결할 수 없다.”
#digital archive, #semantic web