텍스트를 명확하게 설명해주는 모든 방법을 의미
정형화된 방식으로 텍스트 전체 혹은 일부를 기술해주거나 특징지어주는 과정
정보자원을 실제로 기술할 수 있는 메타데이터 스키마로 사용되는 인코딩 방식 MARC, METS
인코딩 구문을 구축하는 목적으로만 사용되는 마크업 언어: SGML, HTML, XML, XHTML
고안 | 특징 | 한계 | |
---|---|---|---|
SGML | 미국 출판협회에서 문서를 디지털 방식으로 표현하기 위해 개발 | 문서 구조뿐만 아니라 문장 내의 요소를 식별하고 정형화된 방식으로 문서를 생성할 수 있도록 설계 | 문법자체가 복잡하고 구현하기 어려워서 활성화되지 못함 |
HTML | Tim Berners-Lee가 웹 페이지를 기술하기 위해 개발 | <meta>태그를 이용하여 문서의 메타데이터 요소를 인코딩할 수 있음 | 웹 페이지 기술 목적이라 태그의 확장성이 없음 |
XML | SGML의 복잡성 문제를 해결하기 위해 W3C에서 제한 | 1998년 새 웹 표준언어로 채택되었으며, 구조적 정보가 포함되어 있는 문서를 표현 가능 |
1994년 Tim Berners-Lee가 설립한 World Wide Web을 관리하는 기구. ISO와 같은 표준화기구가 아니기 때문에 표준이란 용어를 사용하지 못하고, 권고안의 형태로 웹에 대한 표준을 제시함.
발표 스펙은 다음과 같은 순서로 개발됨.
위 4가지 문법 조건을 지키는 문서가 잘 짜인 XML 문서
DTD에 대해 유효하다는 조건까지 추가되면 유효한 XML 문서가 된다.
웹의 자원을 기술하기위한 프레임워크로, 기계에 의해 해독되는 것을 목표로 고안되었음.
XML 문법으로 작성되며, W3C's Semantic Web Activity의 일부로 W3C 권고안.
위의 예에서 Resource는 http://bab2min.tistory.com 으로 식별되는 개체이며, 그 안의 author, email 요소는 Property, Integralus, bab2min@gmail.com 이 Property Value가 된다.
그리고 위 RDF의 의미는
가 되는것.
여러 개의 개체를 하나로 묶어 연결하기 위해서 사용됨. 순서 여부에 따라 3가지로 구분됨.
각각의 멤버는 rdf:li 요소를 통해 자녀요소를 기술한다.
rdf:RDF | RDF/XML 문저 전체의 Root 요소 |
---|---|
rdf:Description | 노드(개체)를 표현하는 요소. ID, about, nodeID 등의 속성을 가짐 |
rdf:li | 컨테이너 멤버를 나타내는 _1, _2 등을 간략하게 나타내는 요소 |
rdf:ID | Resource 개체의 문서 내 고유 ID를 설정. ID는 현재 RDF 문서의 URI와 상대 경로와 결합하여 전역 식별자를 형성함. 예) http://example.org/music(문서의 URI) /Beethoven(해당 개체의 상대 경로) #opus125(개체 ID) 문서 URI, 상대경로는 xml:base 속성을 오버라이드하여 변경할 수 있다. 이를 통해 서로 다른 문서에서도 동일한 전역 URI를 독립적으로 지정할 수 있다. |
---|---|
rdf:about | Resource 개체의 전역 식별자(URI)를 설정한다. |
rdf:resource | Property 개체의 목적어가 될 Resource의 URI를 지정한다. |
rdf:parseType | Property 개체를 다른 형태로 해석하도록 지시함. 다음과 같은 값을 사용 가능
|
rdf:nodeID | Resource 개체 중 공백 노드의 지역 ID를 지정한다. |
rdf:dataType | Literal 값이 해석되는 데이터형을 URI로 지정한다. |
예시 RDF
인터넷 정보 자원을 영구적인 위치로 식별하여 접근하기 위한 체계로, 주소 변동의 위험이 있는 기존 url을 대체하여 영구적인 주소 고정을 목표로 한다.
[문헌정보통계] 6. Z검정 (0) | 2016.06.09 |
---|---|
[문헌정보통계] 5. 가설과 통계적 유의성 검증 (0) | 2016.06.09 |
[정보표준화론] 5. DTD (0) | 2016.06.09 |
[문헌정보통계] 4. 표집과 표집분포 (0) | 2016.04.19 |
[텍스트정보처리론] 3. XML (0) | 2016.04.17 |
[텍스트정보처리론] 2. Tika (0) | 2016.04.17 |
댓글 영역