나의 큰 O는 log x야

고정 헤더 영역

글 제목

메뉴 레이어

나의 큰 O는 log x야

메뉴 리스트

  • 홈
  • Tag
  • Guestbook
  • Admin
  • 분류 전체보기
    • 적분史
    • 프로그래밍
      • PG어
      • 테크닉
      • 3D
      • Multi precision
      • 포니게임개발
      • 스페샬
      • NLP
    • 소리
    • 언어
      • 어원 이야기
      • 라틴어
    • 수업노트
      • 한국고대경제와사회
      • 영어구조론
      • 정보검색론
      • 인간의삶과역사속의미생물
      • 기타
    • 잉여
      • 미래
      • 수학
      • 종교개혁
    • 그냥 공부
    • 가짜 정보 정정합니다.

검색 레이어

나의 큰 O는 log x야

검색 영역

컨텐츠 검색

클러스터링

  • [기계 학습] Mean Shift 클러스터링

    2019.09.04 by ∫2tdt=t²+c

  • 문헌 클러스터링 기술을 이용한 유의어 분류(PHP, MySQL)

    2015.05.03 by ∫2tdt=t²+c

  • 한자를 유사도로 클러스터링

    2012.11.01 by ∫2tdt=t²+c

[기계 학습] Mean Shift 클러스터링

클러스터링(clustering)은 사람의 간섭 없이 컴퓨터가 스스로 유사한 값들을 묶어서 덩어리를 찾아내는 작업을 뜻합니다. 사람이 분류 체계를 미리 만들어주어야 하는 분류(classification)과는 유사하지만 지도(supervise) 여부에서 차이가 나지요. D차원의 유클리드 공간 상의 점들 N개를 클러스러팅하는 데에 가장 사용되는 대표적인 알고리즘에는 K-means Clustering이 있습니다. 이 알고리즘은 전체 N개의 데이터를 K개의 클러스터로 빠르게 묶어낸다는 장점이 있습니다만, 클러스터의 개수 K가 사전에 결정되어야 하고, 초기 중심점(Centroid) 설정에 따라 수렴 여부가 크게 좌우된다는 한계가 있습니다. 반면, 시간이 좀 더 걸리더라도 데이터에 따라 적절한 클러스터 개수를 발견하..

그냥 공부 2019. 9. 4. 23:57

문헌 클러스터링 기술을 이용한 유의어 분류(PHP, MySQL)

정보검색론을 공부하면서 예전에 문헌 클러스터링 기법에 대해서 공부한 적이 있습니다. 그 당시에는 이걸 어디 쓸데가 있으려나 반신반의하면서 공부했는데, 드디어 실제로 이 기법을 활용하게 되었네요. 라틴어 사전 작업을 하던 도중 단어 검색이나 번역 작업 등을 할때 사용할 수 있게 유의어(synonym; 비슷한 의미의 단어) 정보를 제공할 수 있으면 좋겠다고 생각했습니다. 문제는 비슷한 의미의 단어를 일일히 수작업으로 추려내기엔 너무 비효율적이고 (심지어 제 군생활 안에 끝나지도 않을 정도로) 오래걸린다는거였습니다. 그러던 중 클러스터링 기술이 문뜩 떠올라 한번 적용해보았는데 생각보다 결과가 깔끔하게 나와서 작업 내용도 정리하고 정보도 공유할겸 오랜만에 포스팅해봅니다. 이 글에 앞서 아래 내용들을 미리 숙지하..

프로그래밍 2015. 5. 3. 16:54

한자를 유사도로 클러스터링

수업시간에 배운 문헌 클러스터링을 한자에다가 이용해봤다.유사도가 높은 한자를 한 클러스터로 묶는다.심심해서 해본건데, 생각해보니 이걸 이용해서 헷갈리는 한자 교육하는데 쓸수 있을거같다. 한자 간 유사계수는 코사인 계수를 이용했고,클러스터링 기법은 완전 연결 기법을 사용했음. 다음은 유사도 상위 300 클러스터. 0.916846: 己已 0.893101: 挑桃 0.889383: 抽柚 0.876962: 丸九 0.876680: 優擾 0.875346: 憐燐 0.872279: 愧槐 0.869886: 逋通 0.867655: 博搏 0.867544: 江汪 0.856904: 玉王 0.852568: 卯卵 0.850456: 擅檀 0.849282: 圓圖 0.842914: 責貴 0.842849: 瞻膽 0.840892: 速連 0...

적분史 2012. 11. 1. 00:00

추가 정보

인기글

최신글

글쓴이 ∫2tdt=t²+c

블로그 이미지

제가 안 것의 대부분은 인터넷으로부터 왔으니, 다시 인터넷에게 돌려주어야 합니다. bab2min@gmail.com

댓글

태그

python c++ 텍스트 마이닝 한국고대경제와사회 pg어 악보 토픽 모델링 라틴어 문헌정보통계 BigFloat 자연언어처리 php 영어구조론 kiwi Direct3D 우리역사바로알기대회 정보조직론 NLP 포니게임 리듬게임

방문자

오늘
어제
전체

페이징

이전
1
다음
나의 큰 O는 log x야
메일 bab2min@gmail.com
Skin Images are from Stinkehund.

티스토리툴바