제삼취미 55

정규성 검사의미, 정규분포

연구문제가 있었고, 모집단을 대표할 것 같은 표본을 정하고, 자료를 수집했다. 자료를 수집하고 평균을 측정했다고 해서 그 값을 대표값으로 반드시 사용할 수 있는 것은 아니다. 평균이 대푯값으로써 가치가 있는지 판단하기 위해서 표준편차도 살펴보지만, 표준편차 말고도 정규성(Normality)도 검사한다. 통계 분석은 정규성 가정을 하고 진행된다. 즉, 평균값을 대표값으로 사용하겠다는 말의 다른 표현이라고 보면 된다. 표준편차 1, 2, 3에 따라 68%, 95%, 99% 확률로 정규분포를 따를 것으로 가정한다음 분석을 진행한다. 이에따라, 내 표본의 평균이 모집단의 평균을 땡땡 평균에따라 반영한다고 주장 할수 있다. 자 그럼 정규분포란 무엇인가? 아래 그림을 보자. 정규분포는 평균값과 중앙값과 최빈값이 일..

제삼취미/통계 2022.11.20

연속 자료 Continuous Data[교육연구]

땡땡 학교 학생을 대상으로 설문 조사를 실시했고, 그 중에 어떤 것은 범주형 자료이고, 어떤 것은 연속형 자료일 것이다. 학년, 성별, 지역등은 범주형 자료가 될 것이고, 성적이나 키 등은 연속형 자료가 될 것이다. 그런데, 수학에 대한 호감도나 오락 중독은 범주형 자료일까? 연속형 자료일까? 판단 기준은 그 자료에 대한 값의 수가 많냐 적냐? 그리고 그 자료로 내가 뭘하고 싶으냐에 따라 달라진다. 일단, 내가 수집한 자료 중에서 가능한 값의 수가 많으면 연속 자료라고 생각하면 된다. 얼마 이상 많아야 하느냐? 딱 정해지진 않았으 나~~ 5개이상이면 괜찮다. 범주형 자료처럼 보이는게 연속자료 취급받는다? 기준은 나의 연구 목적이 자료의 기술에만 있지 않고, 관계, 차이를 분석하는 것에 있냐에 있다. 이때..

제삼취미/통계 2022.11.20

범주형 자료[교육연구]

자료를 수치의 성격에 따라 연속형 자료랑 범주형 자료로 구분하는데, 범주형 자료를 굳이 이산형 자료라고 하지 않는 이유는 자료의 성격을 이산적이나 연속적이다라는 기준으로 명확하게 구분할 수 없기 때문이다. 자료의 속성은 자료에만 종속되어 있는게 아니라 연구자가 자료를 보는 관점도 반영이 된다. 같은 자료라도 연구자가 선정한 기준에 따라 가능한 값의 범위가 작으면 범주형 자료, 값의 개수가 많아지면 연속형 자료가 된다. 예를들어서. 오락 중독이 수학 문제해결력에 미치는 영향 이라는 연구를 한다 치자. 중독은 범주형 자료일까? 연속형 자료일까? 연주자가 오락 중독을 '중독이다.' '아니다.'로 구분하면 범주형 자료가 되고, 오락 중독을 그 정도에 따라 10등분해서 수치화해서 분석하면 연속형 자료가 된다. (..

제삼취미/통계 2022.11.20

다변량 통계란 [교육연구]

통상 세개 이상의 변수를 수학적으로 분석하는 것을 다변량 통계라고 함. 이변량 통계와 마찬가지로 관계, 차이, 예측 분석을 하고 추가적으로 상호 작용을 평가할 때 사용함. 자율 학습 시간, 교육 받는 시간, 운동 시간, 수면 시간, 개방형 수학 문항에 대한 반응, 문항 난이도에 따른 수학 문제해결력 등의 변수가 주어졌을 때, 여러개의 변수가 동시에 어떤 한 변수와 이루는 관계를 선형조합으로 확인할 수 있다. 한개의 종속변수에 대해서 여러개의 독립변수들과의 관계를 분석할 수 있고, (anova) 두개의 종속변수에 대해서 분석할 수도 있다. (manova)

제삼취미/통계 2022.11.20

이변량 통계의 변수조건

- 이변량 통계 : 는 변수가 두개인 통계. 주로 관계를 보거나, 차이를 보거나, 예측을 하는 등의 간단한 가설 검정에 사용된다. ''땡땡 오락을 할 수록 짜증을 많이 내는가? '' 라는 연구 문제에서 변수 1: 땡땡 오락을 한다. 변수 2: 짜증을 낸다. 이 두 변수간에 강한 상관이 있다. 이 관계가 음의 상관이다. 양의 상관이다. 와 같은 방법으로 가설을 검증한다. 이때, 오락을 한다.라는 변수가 "한다, 안한다." 와 같이 처리되면 상관관계 분석을 할 수 없다. 짜증을 낸다고 마찬가지로 "낸다, 안낸다."와 같이 처리되면 상관분석을 할 수 없다. 예를들어 자료의 수집단계에서 오락을 하는 정도를 1부터 10까지 수치화 하고, 짜증을 내는 정도도 구간척도로 만들었을 때, 두 변수의 상관관계를 볼 수 있..

제삼취미/통계 2022.11.20

일변수 기술 [통계]

변수가 하나인 자료를 다룰때는 기술 통계를 함. 비교할 것도 없고 차이를 볼 것도 없으니까... 하나의 변수에 대해서 평균, 분산, 표준편차들을 계산한다. 가설검정 보다는 자료에 대해서 설명하기 위해서 사용한다. 예시. '3학년의 반별 중간고사 성적 비교' 의 문제에서 각 반 학생의 과목 평균을 다시 평균내고 분포를 보여줌으로써 각 반의 성적을 설명할(기술할) 수 있다.

제삼취미/통계 2022.11.20

통계놀이용 자료는 Gapminder tools에서

통계 공부 하다보면 통계 자료가 필요하지. 1. 우리나라 통계청에서 2. SPSS 사이트에서 3. Gapminder tools에서 다운 받을 수 있다. https://www.gapminder.org/answers/how-did-the-world-population-change/ 우리나라 통계청 사이트 들어가서 이것저것 훑어 보는 것도 재미있겠지만, Gapminder tools사이트에서 버블차트 살펴보는 것도 꽤 재미있다. https://www.gapminder.org/tools/#$chart-type=bubbles&url=v1 Gapminder Tools Animated global statistics that everyone can understand www.gapminder.org 화면에 보이는 버블..

제삼취미/통계 2022.11.19

표본의 평균 사용법-[표본의 분산은 n-1 로 나눠 ]

평균은 나의 자료를 요약하는 간단한 통계 모델이다. 변수값들의 총합을 변수의 개수로 나눈것. (상황1) 온라인 개별학습이 학생들의 수학 성적에 미치는 영향을 알아보기 위하여 학생들의 수학성적의 변화를 1년동안 관찰하고 싶다. 00학급학생들의 성적을 대표하는 값으로 평균을 선택하게 된다. 이때 이 자료를 대표하는 대표값은 평균을 선택함. (학생들의 점수의 총합) 나누기 (학생수) 는 (평균). 그렇다면 이 평균값은 이 집단의 성적을 잘 대표하는 도구로 사용할 수 있을까? 평균은 이 집단을 대표할까? 항상? 아니.. 꼭 길티는 않아. 극단적으로 세 과목으로 이루어진 두 학생(점수의 집단이라고 봐도 됨)의 성적 평균을 비교해 보자. 은경이의 세과목 점수는 (1,5,9), 수찬이의 세과목 점수는 (4,5,6)이..

제삼취미/통계 2022.11.18

기술통계(descriptive statistics)

기술통계는 자료를 수집하여 정리하고 요약하고 단순화 하는 것. 자료의 단순 분포 패턴을 관찰하거나 평균이나 최빈값등의 대표값을 살펴보거나 빈도를 표시하거나 표나 그래프를 사용하거나 함. -- 빈도표 : 각 계급별 빈도를 나타내는 표임 성적 학생수 10~30 40 800 30~50 20 800 50~70 23 1380 70~90 12 960 총값 95 3940 성적(x)에 대한 빈도가 a라고 하면 전체 학생수는 95, x의 총값은 [f(x) = ax] 가 된다. -- 빈도 그래프 : (1) 막대 그래프 - 명목자료(대부분 이산자료)들의 빈도를 막대로 나타낸 그래프임. 자료들의 배열 순서를 바꿔도 됨. (2) 히스토그램 - 구간/비율 자료의 빈도를 나타내는 그래프임. Histogram의 어원은 history..

제삼취미/통계 2022.11.18

통계적 모델이란? [교육연구]

교육 연구를 하기로 마음 먹었다면, 우리는 현상에 대해서 무언가를 발견하고 싶거나 탐구하고 싶은게 있다는 뜻. (예. 수학적 능력에 성별 차이가 나타나는가? ) 그리고 연구자는 문헌을 읽는다던가, 경험을 통해서라던가 뭔가 믿고싶은 것이 생긴다. 예를들어 "수학적 능력에 성별 차이가 있는거 같아. 적어도 내가 가르치고 있는 중1한테는 있는거 같아. 이걸 좀 객관적 지식이나 이론으로 발전 시켜봐야겠어...." 요렇게 생각하게 되겠지... 그럼 사람들한테 말해 볼까? "여러분, 제가 뭔가를 발견했습니다. " "제가 한 이십년 중1만 가르친 사람인데 말입니다." "중학교 남학생들의 수학적 능력이 여학생보다 뛰어나답니다." "믿습니까? 믿으십시오. " "중학교 남학생들의 수학적 능력이 더 뛰어나다아아아아아~~~"..

제삼취미/통계 2022.11.18