관리 메뉴

PC Geek's

국립중앙도서관 디지털자원 보존전략 수립 연구(2018) 본문

아날로그/전자책,이북(ebook),도서정보

국립중앙도서관 디지털자원 보존전략 수립 연구(2018)

국립중앙도서관 공개문서.


아카이빙과 큐레이션. 아카이빙은 모으는 것, 큐레이션은 활용하는 것. (자세한 이야기가 한참 나오는데 대충 줄였습니다)


디지털 콘텐츠(그리고 인쇄출판물의 파일) 납본, 선택적/비선택적으로 인터넷 콘텐츠를 크롤링해 구성하는 데이터베이스, 인쇄물이나 필름 형태인 아날로그 자료를 읽어 전자문서화하는 것, 플로피디스켓, CD 등 구식 저장매체에 들어 있는 전자정보를 장기보관하고 관리하기 편한 새 매체에 옮기는 것 등.



국립중앙도서관 디지털자원 보존전략 수립 연구

2018.12. 국립중앙도서관 [ 2018 연구보고 ] 한성대학교 산학협력단 (304쪽)


차례:


제 1 장 서 론 / 17


제 2 장 디지털자원의 특성 및 보존 현황 분석 / 27

2.1 디지털 보존의 개념 2 9

2.1.1 디지털 보존의 정의 ······························································· 29

2.1.2 디지털 보존의 필요성 ··························································· 35

2.1.3 디지털 보존의 범위 ······························································· 39

2.2 디지털자원의 유형 및 특성 44

2.2.1 자원 유형별 분석 ·································································· 44

2.2.2 제공 유형별 분석 ·································································· 46

2.2.3 미디어 형태별 분석 ······························································ 48

2.2.4 구성요소별 분석 ···································································· 52

2.3 디지털자원의 보존 동향 54

2.3.1 전자납본 사례 ········································································ 54

2.3.2 웹 아카이빙 사례 ·································································· 69

6 ● 국립중앙도서관 디지털자원 보존전략 수립 연구

2.3.3 디지털화 사례 ······································································· 82

2.4 종합 요약 및 시사점 97


제 3 장 국립중앙도서관 디지털자원 보존 실무 개선

제 4 장 국립중앙도서관 디지털자원 보존 정책

제 5 장 결론 및 후속과제 



몇 가지 발췌:


디지털 자원: 콘텐츠 유형

- 텍스트(text)

 - 지도(cartographic)

 - 악보(notated music)

 - 녹음자료(sound recording)

 - 이미지(still image)

 - 영상이미지(moving image)

 - 입체자료(three dimensional object)

 - 소프트웨어/멀티미디어(software/multimedia)

 - 혼합자료(mixed material)


콘텐츠 유형별 특성

∙디지털 보존 콘텐츠의 주요 파일유형(인코딩 포맷)에 대한 특성을 정리하면 다음과 같다.


∙텍스트 및 다른 문서 파일:

 - 도서관 디지털자원의 가장 보편적 형태로, 전자책, 전자저널 등의 자료 유형의 가장 기본적 형태임

 - PDF, XML, EPUB, HWP, DOC, PPT 등 텍스트 편집기를 통해 생성된 파일 유형을 따름

 - 각 파일 별 다양한 DRM 유형을 하나로 통일하여 통합적으로 관리

 - PDF로 변경하여 보존하도록 하되, 포맷 변경으로 데이터 유실이 우려되는 것은 원본으로 보존 수집된 문서의 전문(Full-text)을 대상으로 검색할 수 있는 시스템을 구축하고 장시간이 지난 이후에도 텍스트 문서를 확인할 수 있도록 리더(Reader)등을 함께 보존해야 함


∙스틸이미지:

 - 디지털 사진, 컴퓨터 그래픽, 애니메이션, 서체 등의 디지털 콘텐츠로 이미지 해상도와 압축 방식에 따라 JPEG, TIFF, GIF 등 다양한 포맷이 존재

 - 일반 이미지에 가장 많이 사용되는 포맷은 래스터 방식의 BMP, JPEG, GIF, PNG, TIFF이며, 벡터 방식의 이미지는 그래프, 네트워크, 도형 등을 표현하는 경우가 대부분임

 - Raw 포맷은 이미지 센서(sensor)에 포착된 그대로의 상태를 의미함


∙오디오 파일:

 - 오디오 북, 음악 자료, 음원 등의 디지털 콘텐츠에 해당되며 인코딩 방식에 따라 WAV, MP3 등 다양한 포맷이 존재

 - 가장 다양하게 사용되는 포맷은 MP3로 고음질 이외의 대부분의 환경에서 사용됨

 - 음성 데이터는 파일 크기를 줄이기 위해서 일반적으로 압축 알고리즘을 적용하는데, 손실 압축과 비교했을 때 무손실 압축은 상대적으로 음질이 뛰어나고 파일크기가 크다는 특징을 가짐

 - 음악 CD 원본은 무손실, 무압축에 해당하고 음악 MP3는 손실, 압축에 해당됨. 범용성, 호환성, 재가공성을 고려하여 적합한 보존 파일 포맷을 선택하는 것이 중요함


∙동영상(무빙이미지):

 - 영화, 애니메이션, 비디오 및 공연물 등의 디지털 콘텐츠에 해당됨

 - 일반적으로 재생 플레이어(미디어플레이어 등)에서 지원하는 포맷에 따라 AVI, MPEG 등 다양한 포맷이 존재

 - 동영상 파일은 기본적으로 컨테이너 파일 포맷으로, 영상, 음성, 자막 등을 정해진 알고리즘으로 묶어 파일 생성하며 영상, 음성 등은 각기 다른 코덱으로 압축되는 형태임

 - 영상 파일은 파일교환, 웹 브라우저 내 플레이, 재생플레이어를 통한 스트리밍 서비스로 구분됨

 - 각 상황에 따라 사용되는 파일 포맷은 서로 상이하며 파일 전송을 통한 배포 방식에는 AVI, MKV, MOV, MPEG 등이 주로 사용됨

 - 웹 페이지에 포함되어 재생되는 경우는 플래시(Flash; .flv)형식이 주로 사용됨


∙대화용 멀티미디어 응용프로그램

 - 주로 온라인 게임, 모바일 게임, 이러닝 자료 등 디지털 콘텐츠로 제작사가 CDROM 또는 DVD-ROM으로 제공하는 경우가 대부분임

 - 데이터가 응용 프로그램과 통합된 것으로, 특정 응용프로그램이 있어야만 가독이 가능함


∙데이터베이스

 - 데이터베이스 시스템 스토리지(DBS)는 주로 세 가지 구성요소로 구성됨

 - 첫째, Database: 실제 콘텐츠 데이터베이스 테이블의 튜플 또는 테이블

 - 둘째, DBMS: 데이터베이스 관리 시스템은 데이터베이스를 관리하고 사용자가 요청 한 데이터에 대한 작업을 수행하도록 설계된 컴퓨터 프로그램

 - 셋째, Database 응용프로그램: 특정 응용 프로그램과 문제 세트(Problem set)의 데이터를 관리하기 위해 작성된 컴퓨터 소프트웨어

 - 이러한 구성요소의 배치는 다양한 데이터베이스 시스템에서 다를 수 있으나 크게 데스크톱(단일사용자)의 데이터베이스 시스템과 복합(다중 사용자)의 데이터베이스 시스템으로 구분됨

 - 데이터베이스를 직접 수집해 운영하는 경우, 데이터 백업 및 업데이트 등 데이터베이스 운영과 관련된 전반적 사항에 대한 대비가 필요함

 - 데이터베이스 간 상호운영성이 확보될 수 있도록 데이터베이스의 튜닝과 검색 시스템 구성에 유의하여야 하며, 각 데이터베이스 별로 네임스페이스를 지정해 데이터베이스 간 충돌 및 오류를 방지해야 함


∙장기보존 관점에서 디지털자원은 기술의 발달과 함께 저장 포맷 및 유형이 지속적으로 변화되고 있다. 디지털자원을 생성하는 애플리케이션 중에서 더 이상 사용하지 않는 애플리케이션이 다수 존재한다. 예를 들면, 보석글, 훈민정음, 하나워드부터 CAD, MC, MD, Lotus123 등 스프레드시트 유형의 프로그램들 그리고, 웹에디터 등 다양한 애플리케이션 프로그램들이 사용되다가 지금은 사용이 중단된 상태이다. 현재 가장 많이 사용하는 한글, 엑셀, 파워포인트 등의 애플리케이션도 다양한 버전이 존재하며, 버전 간 파일 포맷 및 속성의 호환에 문제가 발생되고 있다(국가기록원 2013).


컴퓨팅 환경의 변화로 O/S 및 애플리케이션 또한 변화하고 있다. 디지털자원 원본형식을 지원하는 애플리케이션을 보관하고 있지만, 운영환경이 변화하거나 컴퓨팅환경이 변화할 경우 보관된 애플리케이션을 더 이상 수행할 수 없는 상황이 발생한다. 현재까지 개발된 거의 대부분의 애플리케이션은 MS의 윈도우 운영환경에서 동작하도록 개발되어 있으나, 운영 환경이 클라우드 서비스 환경으로 바뀔 경우 서버환경에서 애플리케이션의 구동이 이루어져야 하지만 이미 사양화된 애플리케이션을 클라우드 환경에서 동작하도록 변환하는 기술적, 경제적 측면에서 어려운 경우에는 보관한 애플리케이션의 동작이 불가능하게 되어 원문을 인식 하지 못하는 상태가 발생할 것으로 예측되고 있다(국가기록원 2013).



디지털화


미국의 경우:

https://labs.loc.gov/


(당연한 말이지만 기술이 발전할수록 원본에 가까운 방식으로 대용량 저장공간을 사용할 테니 언제든지 개정될 수 있을 것이다)



일본의 경우


오스트레일리아


(과거에 이렇게 정한 나라가 있다 정도.)


이 글과 같은 분류글목록으로 / 최신글목록 이동
Comments
Viewed Posts
Recent Comments
Recent Posts