나의 큰 O는 log x야

고정 헤더 영역

글 제목

메뉴 레이어

나의 큰 O는 log x야

메뉴 리스트

  • 홈
  • Tag
  • Guestbook
  • Admin
  • 분류 전체보기
    • 적분史
    • 프로그래밍
      • PG어
      • 테크닉
      • 3D
      • Multi precision
      • 포니게임개발
      • 스페샬
      • NLP
    • 소리
    • 언어
      • 어원 이야기
      • 라틴어
    • 수업노트
      • 한국고대경제와사회
      • 영어구조론
      • 정보검색론
      • 인간의삶과역사속의미생물
      • 기타
    • 잉여
      • 미래
      • 수학
      • 종교개혁
    • 그냥 공부
    • 가짜 정보 정정합니다.

검색 레이어

나의 큰 O는 log x야

검색 영역

컨텐츠 검색

가버 변환

  • 가버변환 소스코드

    2016.07.26 by ∫2tdt=t²+c

  • 가버 변환 + 특징이 되는 주파수 뽑아내기

    2013.11.12 by ∫2tdt=t²+c

가버변환 소스코드

어떤 분께서 가버 변환 관련 소스 코드를 요청하셔서 예전에 짜다가 내팽겨쳤던 코드를 공개합니다. 변환까지는 재미나게 개발하다가, 주파수 대역에서 특징추출하고 인식하는 부분이 엄청나게 어렵다는 것을 깨닫고 관두었던게 떠오르네요. 아무튼 흥미로운 분야입니다. 아래 소스코드는 음성 파일을 하나 읽어서 차례대로 가버 변환을 실시합니다. 이에는 다음과 같은 라이브러리들이 사용됩니다. libfft3w : 푸리에 변환을 수행해주는 라이브러리. c/c++ 계열에서는 푸리에 변환 관련해서 이 라이브러리를 능가하는게 없죠. 외부 라이브러리를 사용할수 있는 환경이라면 강추하는 녀석입니다.libsndfile : 다양한 음성 파일을 읽어오는 라이브러리. 음성 파일을 읽을 필요가 없다면 이 라이브러리를 안 쓰셔도 됩니다. 가버 ..

프로그래밍 2016. 7. 26. 00:15

가버 변환 + 특징이 되는 주파수 뽑아내기

갑자기 심심해져서 한건데 생각보다 괜춘하네요. 소리에서 특징이 되는 주파수를 뽑아내는걸 해봤습니다. 여기서 특징 주파수만 봐도 몇가지를 알수 있는데, * 대게 일직선으로 나타나는 소리는 악기 소리입니다. 배음이 몇개 잡힌 것도 있지만 그걸 제외해도 적어도 2~3 화음이 나타나는 걸 알수 있죠. * 위아래로 굴곡이 심한 소리는 사람 목소리입니다. 강한 주파수만 뽑아내서 포만트를 볼 수는 없지만, 주파수를 바탕으로 포만트도 얻어올수 있다면 어떤 모음인지도 알아낼 수 있을겁니다. 구현 원리는 간단합니다. 1. 가버 변환을 수행한다. 2. 해당 구간의 평균적인 진폭의 크기를 구한다. 3. 진폭의 크기에 비례해서 그보다 강한 주파수 영역을 선택해낸다. 가버 변환은 예전에 간단하게 설명한 글이 있었으니 패스하고 (..

적분史 2013. 11. 12. 01:45

추가 정보

인기글

최신글

글쓴이 ∫2tdt=t²+c

블로그 이미지

제가 안 것의 대부분은 인터넷으로부터 왔으니, 다시 인터넷에게 돌려주어야 합니다. bab2min@gmail.com

댓글

태그

텍스트 마이닝 Direct3D 자연언어처리 라틴어 영어구조론 python 리듬게임 c++ php 악보 우리역사바로알기대회 정보조직론 포니게임 문헌정보통계 한국고대경제와사회 BigFloat kiwi pg어 토픽 모델링 NLP

방문자

오늘
어제
전체

페이징

이전
1
다음
나의 큰 O는 log x야
메일 bab2min@gmail.com
Skin Images are from Stinkehund.

티스토리툴바