나의 큰 O는 log x야

고정 헤더 영역

글 제목

메뉴 레이어

나의 큰 O는 log x야

메뉴 리스트

  • 홈
  • Tag
  • Guestbook
  • Admin
  • 분류 전체보기
    • 적분史
    • 프로그래밍
      • PG어
      • 테크닉
      • 3D
      • Multi precision
      • 포니게임개발
      • 스페샬
      • NLP
    • 소리
    • 언어
      • 어원 이야기
      • 라틴어
    • 수업노트
      • 한국고대경제와사회
      • 영어구조론
      • 정보검색론
      • 인간의삶과역사속의미생물
      • 기타
    • 잉여
      • 미래
      • 수학
      • 종교개혁
    • 그냥 공부
    • 가짜 정보 정정합니다.

검색 레이어

나의 큰 O는 log x야

검색 영역

컨텐츠 검색

문헌정보통계

  • [문헌정보통계] 10. 카이제곱 검정

    2016.06.11 by ∫2tdt=t²+c

  • [문헌정보통계] 9. 회귀분석

    2016.06.11 by ∫2tdt=t²+c

  • [문헌정보통계] 8. t검정과 ANOVA, 사후검정

    2016.06.10 by ∫2tdt=t²+c

  • [문헌정보통계] 7. 상관

    2016.06.09 by ∫2tdt=t²+c

  • [문헌정보통계] 6. Z검정

    2016.06.09 by ∫2tdt=t²+c

  • [문헌정보통계] 5. 가설과 통계적 유의성 검증

    2016.06.09 by ∫2tdt=t²+c

  • [문헌정보통계] 4. 표집과 표집분포

    2016.04.19 by ∫2tdt=t²+c

  • [문헌정보통계] 3. 산포도의 의미와 성질

    2016.04.07 by ∫2tdt=t²+c

[문헌정보통계] 10. 카이제곱 검정

카이제곱(χ2) 검정실제 발생한 빈도가 예상했던 빈도와 일치하는지 여부를 확인할 때 사용.1. 전체 범주 중 80%이상의 빈도값이 5 이상이고, 2. 측정치들이 독립적이어야 한다는 두 가지 전제가 요구됨.쓰임여러 집단의 분산이 서로 같은지 아닌지해당 분류의 빈도가 이론적으로 예상한것에 적합한지(적합도 검정)두 변수가 독립적인지 아닌지(독립성 검정)계산법카이제곱값은 다음과 같이 계산할 수 있다. (여기서 F_o는 실제 관측치, F_e는 기대치)사례들이 고루 분포한다고 가정할때 기대치는 다음과 같이 계산된다. 해당 빈도가 속한 행의 총합과 열의 총합을 곱한뒤 전체 총합으로 나누면 됨.적합도 검정하나의 범주형 변수의 분포가 예상한 것에 일치하는지 검정.이때 df = K-1 (K는 전체 범주의 수)독립성 검정(..

수업노트 2016. 6. 11. 01:36

[문헌정보통계] 9. 회귀분석

회귀분석(Regression)상관관계가 두 변수간의 선형관계를 조사한다면, 회귀분석은 인과관계를 분석한다.수식을 도출하여 예측을 가능하게 함.독립변수: 예측변수. 현재의 데이터나 얻기 쉬운 데이터종속변수: 기준변수. 미래의 데이터나 얻기 어려운 데이터얻기 쉬운 데이터를 독립변수로 설정하여, 얻기 어려운 데이터를 추정할 수 있음. 단순회귀분석: 독립변수가 하나인 경우다중회귀분석: 독립변수가 여러 개인 경우 독립변수 X와 종속변수 Y가 주어졌을때 다음과 같이 기울기와 y절편을 구할 수 있다.b는 기울기, a는 y절편이다. 이럴때 X와 Y의 관계는 다음과 같은 선형식으로 예측이 가능하다.위 그래프에서 파란점들이 X,Y로 측정된 값들이라고 할때, X의 평균과 Y의 평균은 빨간 선처럼 구해진다. 이를 바탕으로 X..

수업노트 2016. 6. 11. 01:03

[문헌정보통계] 8. t검정과 ANOVA, 사후검정

t검정df = n-1 이 30보다 작을 경우를 소표본, 클 경우를 대표본이라고 함.소표본의 경우 표본표준편차와 모표준편차의 차이가 커짐. 따라서 일반적인 z검정을 사용하기에 어렵기에 이에 대한 보정이 들어간 t검정을 사용해야함범주형 자료가 연속형 자료에 어떤 차이를 주는지 검정하는데 사용됨. (범주->연속)차이가 의미 있는 것(두 표본이 다른 모집단에서 나온것)인지 아닌지(두 표본이 같은 모집단에서 나온것)를 알아내는것표본평균차이 검증두 표본 X1, X2에 대해 다음과 같이 t값을 계산한다. (여기서 σ_diff는 두 평균차이에 대한 표준편차)t = 0에 가까울수록 두 집단은 같은 모집단에서 나왔을 확률이 높다. => 영가설σ_diff를 계산하는 방법은 두 표본이 독립적이냐 종속적이냐에 따라 달라진다.표..

수업노트 2016. 6. 10. 23:40

[문헌정보통계] 7. 상관

상관(Correlation)두 개 이상 변수들 간의 관계쌍의 측정치를 다루는 것. 두 자료가 서로 연관이 있는것으로 묶여있을때 상관개념을 논할 수 있음.예) 성인 남성의 키와 몸무게: 상관계수 산출 가능. / 성인 남성의 키와 성인 여성의 몸무게: 두 자료가 연결이 안되므로 불가능. 상관계수(Coefficient of correlation): 두 변수들이 서로 관계되는 정도를 나타내는 지수. -1~1의 값을 가짐. 정적 상관관계: 한 변수가 클수록 다른 변수도 크고, 한 변수가 작을수록 다른 변수도 작은 경우부적 상관관계: 한 변수가 클때 다른 변수는 작고, 한 변수가 작을때 다른 변수는 큰 경우상관이 없는 경우: 두 변수가 아무 관계가 없을때, 마구 흩어져 있을때상관계수는 강도(상관계수의 절대값. 1에..

수업노트 2016. 6. 9. 04:28

[문헌정보통계] 6. Z검정

z검정(z-Test)큰 표본을 대상으로하는 검정법으로, 대게 자유도가 30이상인 경우. 이정도 규모의 표본일 경우 정규분포를 전제할수 있고, 이 원리를 이용해 검정을 실시한다.k개의 표본을 표집하여 각기 평균치를 계산하면 각각의 평균을 구할 수 있음중심극한정리에 의해 표집분포는 모집단의 평균치를 중심으로하는 정규분포를 이루게 됨따라서 정규분포의 원리를 따라 모평균이나 모수치를 추정할 수 있음이를 이용해 z점수를 구하고, 임의의 표본이 이 점수에 해당할 확률을 계산하여 영가설을 기각여부를 판단함.모표준편차를 알고 있는 경우 작은 표본이라도 z검정을 사용할수 있고, 모표준편차를 모르는 작은 표본일 경우는 표준편차를 수정해주는 t검정을 실시해야함. 비교하려는 두 집단은 독립적일수도, 상관자료(종속적)일수도 있..

수업노트 2016. 6. 9. 04:28

[문헌정보통계] 5. 가설과 통계적 유의성 검증

가설 검증영가설(귀무가설, H0): 입증하고자하는 것과 반대되는 가설로, 대게 어떤것이 다른것과 차이가 없거나 유의미한 결과가 없다고 주장하는 가설. 통계학에서는 가설을 검증하기에 앞서 가장 먼저 영가설이 성립하다는 전제에서 출발하여, 이를 기각함으로써 대립가설이 옳다는 것을 검증하는 단계를 거친다.대립가설(Hn): 입증하고자하는 가설. 대게 어떤 것이 다른 것과 차이가 존재한다거나 유의미한 결과가 존재한다는 주장. 영가설을 기각하기 위하여 유의수준(유의미한 수준)이라는 개념을 도입. 대게 연구에서는 전통적으로 p = 0.01(1%) 또는 0.05(5%)를 많이 사용한다. 즉 분포상에서 p보다 더 작은 확률로 일어날 상황이 발생했을 경우 그것이 정상적이지 않다고 보고 영가설을 기각하고 대립가설을 수용하는..

수업노트 2016. 6. 9. 03:04

[문헌정보통계] 4. 표집과 표집분포

표집(sampling) 표본을 뽑아내는 것. 확률에 근거해 모집단을 추리하기 위해 실시. 표집이 고르게 실시되어야 모집단을 합당하게 추론할 수 있음.언제나 오류가 있을 가능성을 고려해야하며, 표본의 크기를 크게하고 그 신뢰수준을 제시하여 추정의 정확도를 알려줄 수 있어야함.표본:sample, 표집:sampling 표본의 크기 전수조사가 불가능하거나, 시간과 비용을 줄이기 위해서 표본을 추출하는데, 표본의 크기(sample size)는 어느 정도이어야 할것인가?Cochran, 1963이 표본의 크기를 구하는 공식을 제시하였음. t: 신뢰인자(신뢰수준이 95%일때는 1.96, 99%일때는 2.58)d: 정확도(신뢰수준이 95%일때는 0.05, 99%일때는 0.01)p: 모집단의 특정 특성 비율. 모를 경우 ..

수업노트 2016. 4. 19. 17:27

[문헌정보통계] 3. 산포도의 의미와 성질

산포도(=변산도, variability)* 집중경향치만으로는 자료의 분포를 제대로 설명할 수가 없으므로, 각 요소가 어디를 중심으로 모여있는지와 더불어, 얼마나 흩어져 있는지도 기술할 필요가 있음. 이 이질성의 정도를 나타내는 값을 산포도라고 하며, 범위, 사분위편차, 표준편차, 평균편차, 분산 등이 사용됨.* 산포도가 클수록 요소들이 중심경향치로부터 멀리 떨어져 있고, 산포도가 작을수록 요소들이 중심경향치에 가깝게 모여 있음. 모든 요소가 같은 지점에 있을 경우 산포도는 0이 됨 범위(Total Range): 자료의 최대치와 최소치 사이의 간격(묶음자료가 아닌 경우) 최고요소 - 최저요소 + 1(묶음자료일 경우) 최상 급간의 정확상한계 - 최하 급간의 정확하한계* 한계: 자료의 범위 외의 다른 정보를 ..

수업노트 2016. 4. 7. 01:38

추가 정보

인기글

최신글

글쓴이 ∫2tdt=t²+c

블로그 이미지

제가 안 것의 대부분은 인터넷으로부터 왔으니, 다시 인터넷에게 돌려주어야 합니다. bab2min@gmail.com

댓글

태그

Direct3D 라틴어 포니게임 영어구조론 NLP php 문헌정보통계 자연언어처리 리듬게임 pg어 c++ 우리역사바로알기대회 python kiwi BigFloat 한국고대경제와사회 토픽 모델링 악보 텍스트 마이닝 정보조직론

방문자

오늘
어제
전체

페이징

이전
1 2
다음
나의 큰 O는 log x야
메일 bab2min@gmail.com
Skin Images are from Stinkehund.

티스토리툴바