나의 큰 O는 log x야

고정 헤더 영역

글 제목

메뉴 레이어

나의 큰 O는 log x야

메뉴 리스트

  • 홈
  • Tag
  • Guestbook
  • Admin
  • 분류 전체보기
    • 적분史
    • 프로그래밍
      • PG어
      • 테크닉
      • 3D
      • Multi precision
      • 포니게임개발
      • 스페샬
      • NLP
    • 소리
    • 언어
      • 어원 이야기
      • 라틴어
    • 수업노트
      • 한국고대경제와사회
      • 영어구조론
      • 정보검색론
      • 인간의삶과역사속의미생물
      • 기타
    • 잉여
      • 미래
      • 수학
      • 종교개혁
    • 그냥 공부
    • 가짜 정보 정정합니다.

검색 레이어

나의 큰 O는 log x야

검색 영역

컨텐츠 검색

형태소 분석기

  • [Kiwi] 지능형 한국어 형태소 분석기 GUI 버전

    2017.10.31 by ∫2tdt=t²+c

  • [Kiwi] 지능형 한국어 형태소 분석기 ver 0.3 - 알고리즘 최적화 & 메모리 풀

    2017.05.05 by ∫2tdt=t²+c

  • [Kiwi] 지능형 한국어 형태소 분석기 ver 0.2

    2017.04.29 by ∫2tdt=t²+c

[Kiwi] 지능형 한국어 형태소 분석기 GUI 버전

웹 버전 말고 윈도우즈용 GUI 버전의 Kiwi 형태소 분석기를 구하시는 분들이 의외로 많으셔서, 간단하게나마 GUI를 입힌 버전을 만들어보았습니다. (2022-03-20일자 업데이트) https://github.com/bab2min/kiwi-gui/releases/tag/v0.11.0 에서 kiwigui_win_v0.11.0.zip 파일을 다운 받으시면 되겠습니다. 입력된 한국어 문장을 형태소 분석하여 출력해주는 것이 모든 기능입니다. KiwiGui가 받아들이는 인코딩은 CP949(ANSI), UTF-8, UTF-16 BE, UTF-16 LE 입니다. 출력 파일은 항상 UTF-8로 나옵니다. 기본 분석기 창. 분석할 텍스트를 입력하거나 텍스트 파일을 열어서 분석을 진행할 수 있습니다. 일괄 처리 대화상..

프로그래밍/NLP 2017. 10. 31. 23:00

[Kiwi] 지능형 한국어 형태소 분석기 ver 0.3 - 알고리즘 최적화 & 메모리 풀

그새를 못 참고 업데이트했습니다. 이번 업데이트에서는 정확도 개선은 없었지만, 알고리즘 최적화와 메모리 관리 향상을 통한 성능 향상이 주요 내용입니다. 0.3 버전 업데이트 내역속도가 0.2 버전 대비 약 86%향상되었습니다. 1.알고리즘 최적화실행 속도를 높이기 위해서는 실행 시간의 대부분을 차지하는 함수를 튜닝하는게 좋습니다. 다행히도 마솔루야, 거룩하신 MS께서 내리신 Visual Studio에서 성능 분석에 아주아주 좋은 기능을 제공하더라구요. 이 기능을 활용하여 실행시간의 대부분을 소모하는 함수를 찾아 들어가보니 코드 순서를 바꾸고 불필요한 할당을 제거할 수 있는 부분이 있어서 라인 몇줄을 옮기고 지웠습니다. 별거 아닌 것 같은 작업이었지만 이를 통해 10%이상의 성능 향상을 얻을 수 있었죠. ..

프로그래밍/NLP 2017. 5. 5. 21:02

[Kiwi] 지능형 한국어 형태소 분석기 ver 0.2

최초 릴리즈 이후 약간의 성능 개선을 실시했어요. 조금 설명하자면 * Trie 할당 방법을 바꿔서 연속된 공간에 배치하도록 수정했습니다. 그 결과 자식 노드를 포인터로 지정하는게 아니라 상대 인덱스로 지정할 수 있게 바꿨습니다.struct KTrie { KTrie* next[51] = {nullptr,}; KTrie* fail = nullptr; ... 처음에는 0.1에서는 위와 같이 선언된 구조체를struct KTrie { int next[51] = {0,}; KTrie* fail = nullptr; KTrie* getNext(int i) const { return next[i] ? (KTrie*)this + next[i] : nullptr; } ... 이것처럼 고쳤습니다. x64환경에서는 포인터가 8..

프로그래밍/NLP 2017. 4. 29. 14:03

추가 정보

인기글

  1. -
    자동 요약 기법의 연구 동향 정리

    2018.12.28 03:22

  2. -
    [Python] tomotopy로 쉽게 토픽 모델링 실시하기

    2019.05.22 17:06

  3. -
    -
    [Python] 임의의 웹 페이지에서 텍스트를 추출하기

    2018.11.04 15:34

  4. -
    [Tensorflow] 문자 인식용 신경망 Python3 코드

    2018.11.14 18:28

  5. -
    -
    [기계 학습] Mean Shift 클러스터링

    2019.09.04 23:57

  6. -
    -
    [기계 번역] 이중 언어 데이터에서의 단어 임베딩 (Bilingual Word Embeddings from Non-Parallel Docum⋯

    2018.11.30 18:19

  7. -
    -
    심심해서 해보는 딥러닝을 이용한 악기 소리 분류

    2019.12.02 21:52

  8. -
    -
    Python용 토픽 모델링 패키지 - tomotopy 개발

    2019.05.19 20:32

최신글

  1. -
    -
    형태소 분석기의 모호성 해소 성능을 평가해보자

    NLP

  2. -
    [Kiwi] 문장 같은 고유명사 잘 추출해내기

    NLP

  3. -
    -
    이진 탐색은 어디까지 빨라질 수 있을까?

    테크닉

  4. -
    -
    Kiwi로 한국어 문장 분리하기

    NLP

  5. -
    [C++11] 멤버 함수 포인터를 일반 함수 포인터로 바꾸기

    테크닉

  6. -
    -
    어떤 언어 모델이 좋을까 - 언어 모델을 평가해보자

    그냥 공부

  7. -
    -
    어떤 언어 모델이 좋을까 - 언어 모델의 간략한 역사

    그냥 공부

  8. -
    -
    Lamon : 라틴어 품사 태거 개발기

    NLP

글쓴이 ∫2tdt=t²+c

블로그 이미지

제가 안 것의 대부분은 인터넷으로부터 왔으니, 다시 인터넷에게 돌려주어야 합니다. bab2min@gmail.com

댓글

  1. 대박 덕분에 업무에 활용 잘했습니다 고맙습니다. 05.23 ㅇㅇㅇ
  2. 교수님께서 강의에서 유독 좋아하시는 단어들이 있⋯ 05.13 ㅇㅇ
  3. 안녕하세요. 메일로 사용/수정하신 코드 공유 가능⋯ 05.04 gmltjswldnd@gmail.com
  4. 라틴어 공부하다가 들어오게 된 블로그인데 가끔⋯ 05.01 히오닝
  5. 네 tex는 uv좌표이고, tex2D함수는 텍스쳐 상 특정⋯ 04.28 ∫2tdt=t²+c

태그

c++ 한국고대경제와사회 리듬게임 python BigFloat NLP 포니게임 텍스트 마이닝 Direct3D 영어구조론 토픽 모델링 문헌정보통계 정보검색론 php pg어 정보조직론 자연언어처리 우리역사바로알기대회 악보 라틴어

방문자

오늘
200
어제
584
전체
1,442,867

페이징

이전
1
다음
나의 큰 O는 log x야
메일 bab2min@gmail.com
Skin Images are from Stinkehund.

티스토리툴바