상세 컨텐츠

본문 제목

영어전산언어학 기말고사

수업노트

by ∫2tdt=t²+c 2012. 10. 22. 02:06

본문

Meaning Representations Requirements

1. Verifiability: 참 거짓을 결정할 수 있어야 한다.

2. Unambiguous Representations: 모호성이 없어야 한다. (Ambiguity, Vagueness 모두 없어야함)

3. Canonical Form: 같은 의미에 대해 같은 Meaning Representation을 가져야 한다.

4. Inference and Variables: 추론이 가능하고 변수가 있어야 한다.

5. Expressiveness: 가능한한 많은 의미를 표현할 수 있어야 한다.


Lexical Semantics

● Lexeme: 의미와 형태(소리든 철자든)의 쌍

● Lexicon: Lexeme의 유한한 집합

● Lemma/citation form


Word Senses

● Homonymy: 형태는 같지만 의미는 다른 관계

* Homonym: 소리와 철자가 같은 두 단어

* Homophones: 소리만 같음

* Homographs: 철자만 같음

● Polysemy: 의미론적으로 연관이 있는 관계

* Metonymy: 한 성격이나 개념으로 전체의 의미를 표현. (기본적인 의미를 확장해서 사용하는 방법) 작가 - 작가의 작품, 동물 – 고기, 나무 – 과일

● Synonyms: 의미가 일치하거나 비슷한 두 단어, 특정 문장에서 한 단어가 다른 단어를 대체가능함

● Antonyms: 다른 모든 특성에서는 일치하지만, 한 특성에서 반대인 두 단어

* Binary opposition

* Reversives

● Hyponym: 하위어, Hypernym: 상위어 :: A is a hyponym of B == A⊂B

● Meronym: 부분어, Holonym: 전체어 :: 새의 부분어는 부리와 날개, 새의 하위어는 카나리아, 카나리아의 부분어는 부리와 날개 (하위어는 상위어의 부분어를 상속받음)

WordNet Noun-Relation

● Hypernym – Hyponym: meal - lunch

● Instance Hypernym – Instance Hyponym: composer - Bach

● Member Meronym – Member Holonym: copilot - crew

● Part Meronym – Part Holonym: course - meal

● Substance Meronym – Substance Holonym: oxygen – water

● Antonym: leader – follower

● Derivational Related Form: destruction – destroy

● Entail(a kind of hyponym)

Temporal Inclusion

Troponymy: limp-walk, lisp-talk

-Troponymy: snore-sleep, buy-pay

-Temporal Inclusion

Backward Presupposition: succeed-try, untie-tie

Cause: raise-rise, give-have

WSD

● Naive Bayes Classifier: P(s) Pi{P(f|s)}

● Decision list Classifier

● Dictionary-based Disambiguation: idf


Semantic Roles

● AGENT: (활동하는) 사건의 유발자, FORCE: (활동하지 않는) 사건의 유발자

● EXPERIENCE: 사건의 경험자

● THEME(PATIENT): 사건에 직접적으로 영향을 받는 대상

● RESULT: 사건의 결과

● CONTENT: 대화문과 같은 내용

● INSTRUMENT: 사건에 사용된 도구 (Intermediary Inst: 주어로 사용가능한 도구, Enabling Inst: 주어로 사용불가능한 도구)

● BENEFICIARY: 사건의 수혜자

● SOURCE: 이동의 근원

● GOAL: 이동의 목표

The intense heat/FORCE buckled the highway/THEME about three feet/RESULT.


He/AGENT melted her reserve/THEME with a husky-voiced paean/INSTRUMENT to her eyes.


But Mingo, a major Union Pacific shipping center in the 1890s,/EXPERIENCER has melted away to little more than the grain elevator/RESULT now.


Thematic Hierarchy Constraints: AGENT > INSTRUMENT > THEME


Interpretations of Complex Nominals: CN은 상황에 따라서 다양한 Semantic Relation을 가질 수 있다. 모든 CN이 이를 가지는 것은 아니고, compositional CN만 이를 가진다. 이는 Verbal compound와 Non-verbal compound로 나뉠 수 있다.


Propbank

FrameNet

다양한 외국어도 포함

영어만

Predicate-argument relations for Verbs

all POS as well as Verbs

ARG0, ARG1, ARG2 ...

FUs


Named Entity Recognition

● People (PER)

● Organization (ORG)

● Location (LOC)

● Geo-Political Entity (GPE)

● Facility (FAC)

● Vehicles (VEH)


Evaluation of Recognition

● Precision = N(correctly labeled responses) / N(total labeled)

● Recall = N(correctly labeled reponses) / N(should be labeled)

● F-measure = 2*P*R / (P R)


Question Answering Type

● Class1: single datum or list of items (who, when, where, how...)

● Class2: multi-sentence

● Class3: across several texts

● Class4: an analysis of retrieved information

● Class5: result of reasoning


MT Approach

● Direct Translation

● Transfer Approaches

● Interlingua Approaches

● Statistical MT


K-E MT Techniques

● Adding POS information

● Re-ordering word sequences: Parse training

● Deleting useless words

● Language modeling by part: Smaller language model has less ambiguity

● Compound sentence splitting

● Class word substitution: get richer statistics





관련글 더보기

댓글 영역