제삼취미/통계 21

유의수준이란[통계]

연구 상황을 통해 유의 수준을 이해해 보자. 수학 영재를 판별하는 검사지를 개발하는 연구를 한다 치자. 귀무가설: 검사지가 영재판별에 효과가 없다. 대립가설: 검사지가 영재판별에 효과가 있다. 이렇게 가설을 세우게 되고, 귀무가설이 기각되면, 반증을 통한 증명전략에 의해, 대립 가설을 선택할 수 있다. 여기서는 이해를 위해 증명이란 용어를 사용했지만, 추론 통계에서는 확률을 이용하게되고 엄밀히 증명은 아니기 때문에, 증명이라는 느낌의 통계적 용어, '유의성 검정'이라는 용어를 대신하여 사용한다. 그렇다보니 두가지 오류의 발생 가능성이 생긴다. 1종오류는 귀무가설이 참인데, 기각하는 오류. 2종 오류는 귀무가설이 거짓인데, 채택하는 오류. 1종오류를 범하면 잘못된 검사지가 영재판별에 사용된다. 이 확률를 ..

제삼취미/통계 2022.11.23

추론 통계에 대한 기본 이해(증명 아닌 유의성 검정)

모집단에 대해 가설을 세우지만 표본의 자료를 수집하는게 현실이고, 이 표본을 분석하여 (가설을 세우는 방식으로) 모집단에 대한 이론을 추론 하게 된다.. 우리는 불완전한 측정과 표본을 사용하기 때문에 완벽한 증명을 보일 수는 없다. 확률을 사용할 수 있을 뿐이다. 그래서 추론통계라고 부른다. 가설을 세우고 가설의 타당성을 보이는게 목적이고, 두가지 가설을 세우는데, 귀무가설과 대립가설이 그것이다. 대립가설은 나의 연구 목적이자 내가 세우고자 하는 가설이고, 귀무가설은 기각 당하는 것을 목적으로 하는 가설이다. 이때, 사용되는 증명(추론)전략은 반증을 통한 전략이고, 이것이 귀무가설의 존재 이유이다. 귀무가설은... 반증, 즉 기각 당하는 것을 목적으로 하는 가설이다. 반증? 이라고 언급은 했지만 완벽한 ..

제삼취미/통계 2022.11.23

귀무가설, 대립가설 역할[교육연구]

연구 질문이 있었겠지? 그래서 연구를 하겠지... 자료를 측정하고 분석하는 이유는 나의 연구 가설을 입증하기 위한거지. 이때 연구 가설은 통계처리 가능한 방향으로 세우게 되지... 통계처리를 위해서 두가지 가설을 세우게 된다. 하나는 귀무가설이고 기각하는게 목적이다. 다른 하나는 대립가설이고 이것이 나의 연구 목적을 드러내는 가설이다. 이들 두 가설들은 측정가능한 방향으로 기술되어야 한다. 예를 들어보자. 도시와 지방 학교의 학생들의 수학적 능력을 비교하고, 이를 통해서 각 학교의 교육환경에 대해서 분석하고자 한다. 차이가 있다는 전제하에 여러가지 변수들의 효과나 차이를 분석하고 싶다. 그런데 함부로 차이가 있다고 가정할 수 없기 때문에, 일단 차이가 없다는 가설을 기각한다음 다음 분석으로 넘어가야 한다..

제삼취미/통계 2022.11.23

연구가설 통계처리 전에 확인할 것

내가 수집한 자료를 통계처리 해야 하는데, 그전에 확인할 것들이 있다. 연속자료에 대해 사용해야 할 계산을 범주형 자료에 사용하면 안되겠지? 나의 연구가설을 통계적으로 검정하기전에 두가지를 정리해 보자. 1. 측정시 : - 자료가 연속형인지 범주형인지 (연산가능한지 빈도만 기술할지) - 정규분포인지 비대칭분포인지 (정규분포인게 좋지) - 독립인지 복원추출인지 (t-tests 또는 Anova test때 구분해야 함) 2. 연구 목표 점검: - 기술이 목적이냐 - 변수간 관계 보이는게 목적이냐 - 집단이나 조건간의 차이를 검정하는게 목적이냐. 기술이 목적이면 평균, 표준편차, 중앙값, 빈도 등을 구하는게 목적인거고 변수간 관계를 보이는 게 목적이면 Pearson's r , Spearman;s Rho, Chi..

제삼취미/통계 2022.11.21

정규성 검사의미, 정규분포

연구문제가 있었고, 모집단을 대표할 것 같은 표본을 정하고, 자료를 수집했다. 자료를 수집하고 평균을 측정했다고 해서 그 값을 대표값으로 반드시 사용할 수 있는 것은 아니다. 평균이 대푯값으로써 가치가 있는지 판단하기 위해서 표준편차도 살펴보지만, 표준편차 말고도 정규성(Normality)도 검사한다. 통계 분석은 정규성 가정을 하고 진행된다. 즉, 평균값을 대표값으로 사용하겠다는 말의 다른 표현이라고 보면 된다. 표준편차 1, 2, 3에 따라 68%, 95%, 99% 확률로 정규분포를 따를 것으로 가정한다음 분석을 진행한다. 이에따라, 내 표본의 평균이 모집단의 평균을 땡땡 평균에따라 반영한다고 주장 할수 있다. 자 그럼 정규분포란 무엇인가? 아래 그림을 보자. 정규분포는 평균값과 중앙값과 최빈값이 일..

제삼취미/통계 2022.11.20

연속 자료 Continuous Data[교육연구]

땡땡 학교 학생을 대상으로 설문 조사를 실시했고, 그 중에 어떤 것은 범주형 자료이고, 어떤 것은 연속형 자료일 것이다. 학년, 성별, 지역등은 범주형 자료가 될 것이고, 성적이나 키 등은 연속형 자료가 될 것이다. 그런데, 수학에 대한 호감도나 오락 중독은 범주형 자료일까? 연속형 자료일까? 판단 기준은 그 자료에 대한 값의 수가 많냐 적냐? 그리고 그 자료로 내가 뭘하고 싶으냐에 따라 달라진다. 일단, 내가 수집한 자료 중에서 가능한 값의 수가 많으면 연속 자료라고 생각하면 된다. 얼마 이상 많아야 하느냐? 딱 정해지진 않았으 나~~ 5개이상이면 괜찮다. 범주형 자료처럼 보이는게 연속자료 취급받는다? 기준은 나의 연구 목적이 자료의 기술에만 있지 않고, 관계, 차이를 분석하는 것에 있냐에 있다. 이때..

제삼취미/통계 2022.11.20

범주형 자료[교육연구]

자료를 수치의 성격에 따라 연속형 자료랑 범주형 자료로 구분하는데, 범주형 자료를 굳이 이산형 자료라고 하지 않는 이유는 자료의 성격을 이산적이나 연속적이다라는 기준으로 명확하게 구분할 수 없기 때문이다. 자료의 속성은 자료에만 종속되어 있는게 아니라 연구자가 자료를 보는 관점도 반영이 된다. 같은 자료라도 연구자가 선정한 기준에 따라 가능한 값의 범위가 작으면 범주형 자료, 값의 개수가 많아지면 연속형 자료가 된다. 예를들어서. 오락 중독이 수학 문제해결력에 미치는 영향 이라는 연구를 한다 치자. 중독은 범주형 자료일까? 연속형 자료일까? 연주자가 오락 중독을 '중독이다.' '아니다.'로 구분하면 범주형 자료가 되고, 오락 중독을 그 정도에 따라 10등분해서 수치화해서 분석하면 연속형 자료가 된다. (..

제삼취미/통계 2022.11.20

다변량 통계란 [교육연구]

통상 세개 이상의 변수를 수학적으로 분석하는 것을 다변량 통계라고 함. 이변량 통계와 마찬가지로 관계, 차이, 예측 분석을 하고 추가적으로 상호 작용을 평가할 때 사용함. 자율 학습 시간, 교육 받는 시간, 운동 시간, 수면 시간, 개방형 수학 문항에 대한 반응, 문항 난이도에 따른 수학 문제해결력 등의 변수가 주어졌을 때, 여러개의 변수가 동시에 어떤 한 변수와 이루는 관계를 선형조합으로 확인할 수 있다. 한개의 종속변수에 대해서 여러개의 독립변수들과의 관계를 분석할 수 있고, (anova) 두개의 종속변수에 대해서 분석할 수도 있다. (manova)

제삼취미/통계 2022.11.20

이변량 통계의 변수조건

- 이변량 통계 : 는 변수가 두개인 통계. 주로 관계를 보거나, 차이를 보거나, 예측을 하는 등의 간단한 가설 검정에 사용된다. ''땡땡 오락을 할 수록 짜증을 많이 내는가? '' 라는 연구 문제에서 변수 1: 땡땡 오락을 한다. 변수 2: 짜증을 낸다. 이 두 변수간에 강한 상관이 있다. 이 관계가 음의 상관이다. 양의 상관이다. 와 같은 방법으로 가설을 검증한다. 이때, 오락을 한다.라는 변수가 "한다, 안한다." 와 같이 처리되면 상관관계 분석을 할 수 없다. 짜증을 낸다고 마찬가지로 "낸다, 안낸다."와 같이 처리되면 상관분석을 할 수 없다. 예를들어 자료의 수집단계에서 오락을 하는 정도를 1부터 10까지 수치화 하고, 짜증을 내는 정도도 구간척도로 만들었을 때, 두 변수의 상관관계를 볼 수 있..

제삼취미/통계 2022.11.20

일변수 기술 [통계]

변수가 하나인 자료를 다룰때는 기술 통계를 함. 비교할 것도 없고 차이를 볼 것도 없으니까... 하나의 변수에 대해서 평균, 분산, 표준편차들을 계산한다. 가설검정 보다는 자료에 대해서 설명하기 위해서 사용한다. 예시. '3학년의 반별 중간고사 성적 비교' 의 문제에서 각 반 학생의 과목 평균을 다시 평균내고 분포를 보여줌으로써 각 반의 성적을 설명할(기술할) 수 있다.

제삼취미/통계 2022.11.20