XML Extensible Markup Language: 사람과 기계가 모두 읽을 수 있는 확장가능한 텍스트 기반 데이터 구조 표현 방식
SGML에서 유래하여 1998 W3C 표준으로 채택됨.
시스템 간 정보를 교환하는데 굉장히 유용하게 사용됨
HTML 역시 SGML에서 유래했기에 둘이 유사한 점이 많음
목적 | 특징 | |
---|---|---|
HTML | 웹 페이지 기술 | 문법 오류에 어느 정도 관대함 |
XML | 데이터 기술 | 엄격한 문법 |
Element: <el attr='v'>value</el>
Tag: <el attr='v'>value</el>
Attribute: <el attr='v'>value</el>
Entity: <el attr='v'> & " ' > < </el>
Data(value): <el attr='v'>value</el>
DTD: XML에서 사용될 요소들을 정의하는 파일
방법 | 장점 | 단점 | 사용대상 | |
---|---|---|---|---|
Simple API for XML | 순차적으로 문서를 읽어나가며 처리 | 빠르고 적은 메모리 소모. 큰 문서도 처리 가능 | 순차접근만 가능하고, 전체적인 관점에서 문서 접근 불가 | 큰 XML Data |
Document Object Model | 문서 전체를 메모리에 읽어들인 후 처리 | 임의접근 가능, 트리 순회가 가능하고, 전체적인 관점에서 문서를 살펴볼 수 있음 | 상대적으로 느리고 많은 메모리 소모. | 대게 웹 페이지 |
[정보표준화론] 5. DTD (0) | 2016.06.09 |
---|---|
[정보표준화론] 4. Markup Language / RDF (0) | 2016.06.08 |
[문헌정보통계] 4. 표집과 표집분포 (0) | 2016.04.19 |
[텍스트정보처리론] 2. Tika (0) | 2016.04.17 |
[텍스트정보처리론] 1. 지프의 법칙 (0) | 2016.04.17 |
[텍스트정보처리론] 0. 텍스트 마이닝 (0) | 2016.04.17 |
댓글 영역