[정보표준화론] 4. Markup Language / RDF

Posted by 적분 ∫2tdt=t²+c
2016.06.08 22:43 수업노트

Markup Language

텍스트를 명확하게 설명해주는 모든 방법을 의미

정형화된 방식으로 텍스트 전체 혹은 일부를 기술해주거나 특징지어주는 과정

정보자원을 실제로 기술할 수 있는 메타데이터 스키마로 사용되는 인코딩 방식 MARC, METS

인코딩 구문을 구축하는 목적으로만 사용되는 마크업 언어: SGML, HTML, XML, XHTML

고안특징한계
SGML미국 출판협회에서 문서를 디지털 방식으로 표현하기 위해 개발 문서 구조뿐만 아니라 문장 내의 요소를 식별하고 정형화된 방식으로 문서를 생성할 수 있도록 설계문법자체가 복잡하고 구현하기 어려워서 활성화되지 못함
HTMLTim Berners-Lee가 웹 페이지를 기술하기 위해 개발

<meta>태그를 이용하여 문서의 메타데이터 요소를 인코딩할 수 있음

웹 페이지 기술 목적이라 태그의 확장성이 없음

XMLSGML의 복잡성 문제를 해결하기 위해 W3C에서 제한

1998년 새 웹 표준언어로 채택되었으며, 구조적 정보가 포함되어 있는 문서를 표현 가능


W3C

1994년 Tim Berners-Lee가 설립한 World Wide Web을 관리하는 기구. ISO와 같은 표준화기구가 아니기 때문에 표준이란 용어를 사용하지 못하고, 권고안의 형태로 웹에 대한 표준을 제시함.

발표 스펙은 다음과 같은 순서로 개발됨.

  1. Working Draft
  2. Last Call Working Draft
  3. Candidate Recommendation
  4. Proposed Recommendation
  5. Recommendatation


XML 문서

잘 짜인 XML 문서(Well Formed XML Document)

  • 시작 태그와 끝 태그가 일치하고
  • 모든 태그는 알맞게 종료되어야 하고
  • 모든 태그는 알맞게 중첩되어야 하고
  • 최상의 요소는 유일해야함

위 4가지 문법 조건을 지키는 문서가 잘 짜인 XML 문서

유효한 문서(Valid Document)

  • 잘 짜인 XML 문서이면서
  • 특정 DTD에 제시된 구조를 따라야 함

DTD에 대해 유효하다는 조건까지 추가되면 유효한 XML 문서가 된다.



RDF(Resource Description Framework)

웹의 자원을 기술하기위한 프레임워크로, 기계에 의해 해독되는 것을 목표로 고안되었음.

XML 문법으로 작성되며, W3C's Semantic Web Activity의 일부로 W3C 권고안.

구성요소

  • Resource: URI를 가질수 있는 모든 개체
  • Property: 이름을 가지고 있는 Resource로, 자신만의 Property Value를 갖는다
  • Property Value: Property에 할당되는 값
  • Statement: Resource - Property - Property Value로 구성되는 Triple쌍으로, 여기서 Resource는 주어, Property는 술어, Property Value는 목적어의 역할을 한다.


위의 예에서 Resource는 http://bab2min.tistory.com 으로 식별되는 개체이며, 그 안의 author, email 요소는 Property, Integralus, bab2min@gmail.com 이 Property Value가 된다.

그리고 위 RDF의 의미는 

  1. Statement1. http://bab2min.tistory.com 개체의 author는 Integralus이다.
  2. Statement2. http://bab2min.tistory.com 개체의 email은 bab2min@gmail.com이다.

가 되는것.


컨테이너 모델

여러 개의 개체를 하나로 묶어 연결하기 위해서 사용됨. 순서 여부에 따라 3가지로 구분됨.

  • rdf:Bag:멤버 간의 순서가 없는 경우
  • rdf:Seq:멤버 간의 순서가 의미 있는 경우
  • rdf:Alt: 대체 가능한 선택지를 그룹으로 묶는 경우. (그 중 첫번째 멤버는 기본값으로 취급함)

각각의 멤버는 rdf:li 요소를 통해 자녀요소를 기술한다.


RDF/XML 요소

rdf:RDF

RDF/XML 문저 전체의 Root 요소

rdf:Description

노드(개체)를 표현하는 요소. ID, about, nodeID 등의 속성을 가짐

rdf:li컨테이너 멤버를 나타내는 _1, _2 등을 간략하게 나타내는 요소

RDF/XML 속성

rdf:ID

Resource 개체의 문서 내 고유 ID를 설정. ID는 현재 RDF 문서의 URI와 상대 경로와 결합하여 전역 식별자를 형성함.

예) http://example.org/music(문서의 URI) /Beethoven(해당 개체의 상대 경로) #opus125(개체 ID)

문서 URI, 상대경로는 xml:base 속성을 오버라이드하여 변경할 수 있다. 이를 통해 서로 다른 문서에서도 동일한 전역 URI를 독립적으로 지정할 수 있다.

rdf:about

Resource 개체의 전역 식별자(URI)를 설정한다.

rdf:resource

Property 개체의 목적어가 될 Resource의 URI를 지정한다.

rdf:parseType

 Property 개체를 다른 형태로 해석하도록 지시함. 다음과 같은 값을 사용 가능

  1. Resource: 공백노드를 생략함
  2. Literal: 하위 내용을 XML 리터럴로 해석한다
  3. Collection: 하위 내용을 RDF Collection List로 해석한다

rdf:nodeID

 Resource 개체 중 공백 노드의 지역 ID를 지정한다.

rdf:dataType

 Literal 값이 해석되는 데이터형을 URI로 지정한다.



예시 RDF


Purl(Persistent Uniform Resource Locator)

인터넷 정보 자원을 영구적인 위치로 식별하여 접근하기 위한 체계로, 주소 변동의 위험이 있는 기존 url을 대체하여 영구적인 주소 고정을 목표로 한다.


저작자 표시 비영리 동일 조건 변경 허락
신고
크리에이티브 커먼즈 라이선스
Creative Commons License
이 댓글을 비밀 댓글로

티스토리 툴바