제삼취미/통계

변수란? 변수의 종류(교육연구에서)

카리스χάρης 2022. 11. 16. 21:54

교육 연구를 위해 자료를 수집하고 통계처리하게 되는데, 이때 수많은 변수와 마주하게 된다.

변수는
다양한 형태로 존재한다.

분류된 관찰내용이나 정보이기도 하고 (성적 상위권, 경계 수준, 도시학교, 시골학교 등)
대상의 특성이기도 하고 (여자 남자, 중학생, 초등학생, 영재냐 아니냐)
대상의 특성을 수치화한 값이기도 하고(여자 0, 남자 1)
측정된 관측치나 잠재된 값이기도 하다. (성적 15점, 수학에 대한 호감도)


-----------
인과관계에 따라서는 독립변수와 종속변수로 분류하는데
연구자가 조절 할수 있는 변수는 독립변수, 독립변수의 적용으로 인해 얻게 되는 결론에 해당하는 값은 종속변수가 된다.

-독립변수 : 연구자가 조절 할수 있음. 원인변수, 설명변수, 예측변수라고 불리기도 함.
-종속변수 : 독립변수로 인해 얻은 결과. 결과변수라고 불리기고 하고, 피설명 변수, 피예측 변수, 반응 변수라고 불리기도 함.

초콜릿을 먹으면 수학시험을 잘보는가?를 조사하기 위한 실험에서 초콜릿을 먹인 학생은 독립변수, 학생의 시험 결과는 종속변수이다.



-----------
관측변수
측정된 값을 말한다. (성적, 몸무게, 수학에 대한 호감도(설문지 입력값)).
Measured variable(측정변수) or Manifest Variable (명시변수)이라고도 부름

그런데 호감도는 학생들이 설문지에 호감의 정도를 표시한 것으로써 학생들의 실제 호감도를 반영한다고 볼 수 있는가?의 문제이다.
예를들어서 '중1수학에 대한 중학교 학생들의 호감도는 어떻게 되는가?'라는 연구 문제에서
학생들의 호감도라는 상당히 개인적인 영역의 질문을 객관화해서 다룬다는 것은 쉬운 일이 아니다.

그래서 연구자 집단은 하나의 전제를 가정하고 시작한다.
그리고 이렇게 가정된 전제는 논리적이진 않을지라도 해당 집단내에서 통용되는 규칙이어야 한다.
호감도에 대한 측정은 소비자 마케팅이나 정책이슈, 디자인 미학 분야에서 종종 활용되며, 교육분야에도 종종 적용되고 있다.

필요한 전제는
해당 글을 읽는 독자들이 이러한 제한적인 상황에도 불구하고, 연구자의 정의 방식이나 조작의 타당도 여부에 따라 호감도의 측정값을 받아들일 것이다.
라는 점이다.

이러한 전제하에 연구자는
호감도를 측정 가능한 형태로 조작적으로 정의하게 된다.
(설문지... 매우좋음, 좋음, 보통, 싫음, 매우싫음.///또 구매할(수강할) 의사가 있나요? /// 친구에게 소개할 건가요? /// )


자료로써 측정된 호감도는 관측변수라 하고, 측정값을 통해 얻어진 내용은 잠재변수라고 한다.

잠재변수
이렇게 정의된 기준에 따라 측정하여 얻게 되는 변수를 말한다.
잠재변수는 직접 측정이 불가능하기 때문에, 관측변수에 의해 간접적으로 측정한다.
(개념적 정의와 조작적 정의가 함께 제시됨)



-----------
매개변수(intervening variable)
독립변수와 종속변수 사이에 중간자(매개) 역할을 하는 변수이다. 둘이 서로 관계를 맺게 도와준다.

'초콜릿을 먹은 학생은 수학시험을 잘보는가?' 라는 연구에서

'기분좋음'이 매개 변수가 될 수 있다.

초콜릿이 기분좋음을 유발할 수 있고, 기분좋음으로부터 수학시험에 더 집중할수 있다면,
이렇게 중간에서 매개 역할을 하는 변수를 매개변수라고 한다.

추후 연구로 다양한 논의를 해 볼 수 있다.
초콜릿의 어떤 성분('페닐에틸아민')이 기분좋음을 유발하는지 밝혀내고,
초콜릿이 아닌 다른 음료로 해당 성분을 공급하거나,
음악이나 그림으로 기분좋음을 유도하는 등의 다른 변화를 시도할 수 있게 된다.

'부모의 국적이 학생의 수학성적에 영향을 미치는가?'
라는 연구에서
'아이와 함께 하는 시간'이라는 매개 변수가 있다고 해보자.
부모와 아이와의 의사소통의 문제 혹은 함께 공부하는 시간의 문제가 매개 변수가 되어 수학성적에의 영향을 진단해 볼 수 있게 된다.



-----------
외생변수(extraneous variable)

독립변수와 종속변수가 실제로는 관계가 없는데 둘다에 영향을 미쳐서 관계가 있는것처럼 보이게 만드는 변수이다.
내 연구에 관심 대상은 아닌데 실제로 나의 독립변수와 종속변수에 동시에 영향을 미치는 것.

'내 수업을 들은 학생이 수학 성적이 오르는가? '
라는 연구문제에서
독립변수는 내 수업을 들은 학생, 종속변수는 수학 성적 향상이다.

만약 나의 교실에 특별한 마법꽃이 있어서 그 꽃향기를 맡은 사람은 똑똑해 지게 되고, 그래서 내가 똑똑해졌고 그 학생도 똑똑한 진거라면,
그 마법 꽃은 나의 수업 능력과 학생의 학습능력에 동시에 영향을 미쳤을수 있다.
나의 연구는 교수법에 관한 연구인데 이 경우 꽃향기가 학습에 영향을 미치는 요인이고, 향기는 나의 연구분야가 아니고...

이렇게 외부에서 내 연구의 변수에 영향을 미치는 변수를 외생변수라 한다.


외생변수에는 선행변수, 구성변수, 허위변수, 억제변수, 왜곡변수, 조절변수 등이 있다.


-----------
조절변수(moderating variable)
조절변수는 독립변수가 종속변수에 미치는 영향력을 조절하는 변수이다.

우리가 회귀분석을 할때, 독립변수외의 다른 변수가 종속변수에 영향을 미치는 것을 발견하기도 한다.
이것을 조절변수라고 하는데, 제 2의 독립변수라고 보면 된다.

예를들어,
'온라인 강의와 오프라인 강의 중 수학 학습에 효과적인 것은 무엇인가?'라는 연구문제를 생각해보자.

같은 선생님이 같은 내용의 강의를 하고,
동시에 오프라인 강의실에서 수업을 듣는 학생그룹과 온라인으로 수업을 듣는 학생그룹으로 구분하여 수업을 진행하였다고 하자.

그냥 수업의 효과만 비교하면 두 결과는 거의 같았다고 가정해보자.

그런데 토론 수업을 진행 했을 대, 오프라인 강의에서 그 효과가 크게 높아졌다고 해보자.

이때, 수업 진행 방식 중 토론 수업은 오프라인 강의의 학습 효과에 영향을 미치는 변수가 된다.

수업에 지각한 학생의 수학성적이 떨어진다고 할때, 특히 체육활동을 한 학생의 지각이 더 많은 영향을 미친다면 체육활동도 지각 외의 변수가 될 수 있다.


'초콜릿을 먹으면 수학성적이 좋아진다'는 연구문제를 테스트 하고 싶다.
그런데
초콜릿을 먹을때마다 물을 많이 마신다는 것을 발견했고, 이때, 물을 마시는 행위도 수학성적에 영향을 미친다는 가정이 가능해 진다.

우리가 보려는 정보는 회귀식으로 보면 독립변수(X) 종속변수(Y)에 대하여, Y = a + bX 로 나타낼 수 있다.
그런데, Z 라는 다른 변수가 Y에 영향을 미치는 것 같다. 이제 우리가 분석해야 할 식은 Y = a+ bX + cZ + dXZ 가 된다.




-----------
억제변수(suppressor variable)

변수 관계를 악화시키거나 억제시키는 변수를 억제변수라고 한다.

예를들어
'부모의 교육 수준이 아이의 수학적 흥미에 영향을 미치는가?'
라는 연구문제가 있다고 해보자.

실제로는 부모의 교육 수준이 아이의 수학적 흥미에 영향을 미친다고 해보자.
그러나 연구 결과에는 이 관계가 드러나지 않았다.
왜냐하면 부모의 연령이나 경제 수준이 국적이 모두 반영된 자료였기 때문이다.
이 경우 부모와 아이의 언어가 달라서 학습 지도가 안됐을 경우, 부모의 교육 수준이나 지적 흥미도가 아이와 공유되지 않았을 수도 있다.


-----------
통제변수(control variable)

독립변수와 종속변수 간에 영향을 미칠 수 있는 제3의 변수이다.
실험과정에서 독립변수와 종속변수의 영향 파악을 위해 통제해야 하는 변수이다.

예를들어보자.
지구 온난화로인해 미래 기후는 계속 변하고 있다.
이러한 변화는 우리나라의 농작물에도 영향을 미치고 있다.
그래서 한 연구자는
미래의 다양한 예상 대기 조건에서 지금의 콩이 생존할 수 있는지, 어떤 생존 특성을 보이는지 연구하고 싶었다.

'콩이 생존 할 수 있는 대기 중 이산화탄소 농도 함량의 최소치와 최대치는 무엇인가? '가 연구 문제라고 해보자.

이때 이산화탄소 농도가 독립변수가 되었으므로 다른 모든 조건은 동일하게 통제해야 한다.
물조건, 흙조건, 온도조건 등....

이렇게 독립변수의 효과를 검증하기 위해서 다른 조건에 해당하는 통제되는 변수들을 통제변수라고 한다.



-----------
내생변수(endogenous variable)

우리는 독립변수가 종속변수에 영향을 미치는지 혹은 상관관계가 있는지 알아보고 싶다.
그런데 내가 관심을 갖지 않은 변수가 내 종속변수에 영향을 미치고 있었다. 그리고 그것은 내가 선정한 변수에 나도 모르게 포함된  변수이다.

예를들어서 학생 집단을 둘로 나누어서 실험을 하였다. (좀 길다.)
연구문제는 '수학사를 활용한 수업이 학생들의 수학성적 향상에 영향을 미치는가?' 였다.
실험집단에는 수학사를 활용한 수업이, 통제집단에는 일반적 수업이 적용되었다.
그러나 교수실험에서는 수학사를 활용한 수업의 효과가 현저히 떨어졌다.

알고보니
수학사를 활용한 수업에서 소개되는 다양한 매체와 활동으로 인해 학생들이 수업의 주제에 오히려 집중하지 못하였던 것이다. [어디까지나 가정임]

이때, 수학사를 활용한 수업에서 필연적으로 매체를 다루거나 학생들의 팀별 토론 시간을 갖도록 설계되었는데,
교사의 준비 부족 혹은 학교의 교육 환경 부족등의 이유로 수업에 방해를 주는 요소가 파생되었던 것이다.

또는 반대 결과로
수업이 효과적이었는데,
그 이유는 기존의 방식과 다른 매체의 활용으로 인해 학생들의 흥미를 증진시켰기 때문이다.

이와같이 수학사 활용수업이 포함하고 있는 다른 요인이 변수가 되어서 연구결과에 영향을 미치는 경우가 있다.

내생변수는 이미 연구자가 가정한 독립변수에 포함된 변수이거나, 종속변수에 영향을 미치는 다른 독립변수이다.
즉, 내생변수는 다른 변수로부터 영향을 받는 변수이고, 내 가설 안에서 그 값이 결정되는 변수이다.




-----------
-----------
음~~~
또~~~





변수의 속성에 따라
이산변수, 연속변수, 더미변수로 구분할수도 있다.
더미 변수 (남자 0, 여자 1)