나의 큰 O는 log x야

고정 헤더 영역

글 제목

메뉴 레이어

나의 큰 O는 log x야

메뉴 리스트

  • 홈
  • Tag
  • Guestbook
  • Admin
  • 분류 전체보기
    • 적분史
    • 프로그래밍
      • PG어
      • 테크닉
      • 3D
      • Multi precision
      • 포니게임개발
      • 스페샬
      • NLP
    • 소리
    • 언어
      • 어원 이야기
      • 라틴어
    • 수업노트
      • 한국고대경제와사회
      • 영어구조론
      • 정보검색론
      • 인간의삶과역사속의미생물
      • 기타
    • 잉여
      • 미래
      • 수학
      • 종교개혁
    • 그냥 공부
    • 가짜 정보 정정합니다.

검색 레이어

나의 큰 O는 log x야

검색 영역

컨텐츠 검색

자바

  • 영어 동사 원형 복원기(English Verb Lemmatizer)

    2017.09.26 by ∫2tdt=t²+c

  • 예전에 정리해둔 자바 vs C

    2013.09.10 by ∫2tdt=t²+c

영어 동사 원형 복원기(English Verb Lemmatizer)

최근 전산 영어학 관련 업무를 하다보니 어간 추출(Stemming)이나 원형 복원(Lemmatization)을 할 일이 많습니다. 이미 이쪽 분야는 많이 연구되어서 쉽게 사용할 수 있는 자바 라이브러리(LingPipe, Stanford Core NLP, OpenNLP 등등)가 널려 있습니다. 문제는 제가 필요한 건 오직 영어 동사의 원형을 복원하는 작업인데, 대부분의 라이브러리에서는 Lemmatizer를 단독으로 제공하지 않고, Stemmer, POS Tagger 등과 함께 제공한다는 것이었지요. 용량이 작은 서버에 올려야 했기에 이런 추석종합선물세트 같은 라이브러리 패키지를 사용하기에는 어려웠습니다. 그래서 동사만 원형복원하는 코드를 간단하게 작성해봤습니다. (다행히도 영어 동사의 굴절 법칙은 아주아주..

프로그래밍 2017. 9. 26. 02:26

예전에 정리해둔 자바 vs C

예전에 안드로이드 개발한다는 스터디에 반강제로 끌려들어가서 자바 공부하게되었을때 정리해두고 보지도 않았던건데 이번에 진짜로 공부하게 생겨서 정리해서 올려봄 자바와 c 의 차이점 0. 기본전처리기(#define, #include) 없음.따로 include하지 않아도 알아서 클래스를 찾아준다. 1. 타입기본형 vs 참조형 차이!기본-정수형: byte(8 bit), short(16 bit), int(32 bit), long(64 bit). unsigned 없음기본-실수형, float, double기본-불린형: boolean기본-문자형: char(16 bit, 유니코드) 참조-배열형: type[] a = new type[size]; 배열 범위 벗어나면 예외 발생참조-클래스: 구조체, 공용체 따위는 없다!! 2...

프로그래밍 2013. 9. 10. 13:02

추가 정보

인기글

최신글

글쓴이 ∫2tdt=t²+c

블로그 이미지

제가 안 것의 대부분은 인터넷으로부터 왔으니, 다시 인터넷에게 돌려주어야 합니다. bab2min@gmail.com

댓글

태그

kiwi 한국고대경제와사회 정보조직론 python 악보 영어구조론 텍스트 마이닝 php 리듬게임 토픽 모델링 BigFloat c++ pg어 Direct3D 문헌정보통계 우리역사바로알기대회 라틴어 NLP 포니게임 자연언어처리

방문자

오늘
어제
전체

페이징

이전
1
다음
나의 큰 O는 log x야
메일 bab2min@gmail.com
Skin Images are from Stinkehund.

티스토리툴바