이 글은 오픈소스 R 스튜디오를 사용해 데이터 신뢰도를 간단히 검증할 수 있는 방법인 크론바흐 알파(Cronbach Alpha) 계산 방법을 나눔한다. R은 통계 분석언어이다. RStudio는 무료이며 GUI방식으로 편리하게 R 언어를 사용할 수 있도록 한다.
RStudio
머리말
크론바흐 알파는 신뢰도 계수 중 하나이다. 알파값은 다양한 항목들 간에 내적 일관성(internal consistency)가 높은지를 측정한다. 이를 위해 조사 항목의 데이터들 간 상관계수를 계산한다.
크론바흐 알파는 신뢰도 계수 중 하나이다. 알파값은 다양한 항목들 간에 내적 일관성(internal consistency)가 높은지를 측정한다. 이를 위해 조사 항목의 데이터들 간 상관계수를 계산한다.
예를 들어, 어떤 질문 항목에 비해, 응답자들이 특정 방향으로 일관된 경향의 답을 하는 지를 알아볼 수 있다. 홍길동이 여러 관계된 질문들 Q1...n에 대해 일관성있게 점수들을 준다면 알파값이 높게 나오지만, 임의적으로 답을 주면 알파값이 낮게 나온다. 특정 질문 Qi가 일관성이 없어보이면, 해당 데이터를 삭제함으로써 일관성을 높일 수 있다.
보통, 알파값이 0.8이 높으면 일관성과 신뢰성이 좋다고 판단한다. 알파값이 0.9이상이면 신뢰성이 높은 데이터이다. 0.7이상이면 항목들간에 어느정도는 일관성이 있다고 판단한다.
크론바흐 알파값은 피어슨(Pearson) 상관 계수와 함께 데이터 신뢰성 계산에 많이 사용된다.
프로그램 설치
통계 패키지 R과 RStdudio를 다음 링크에서 설치한다.
통계 패키지 R과 RStdudio를 다음 링크에서 설치한다.
RStduio를 실행한다. 그리고 파일에서 새 프로젝트 메뉴를 선택한다.
폴더 기반으로 프로젝트를 생성한다. 그리고, 생성된 폴더 안에 분석할 데이터를 엑셀로 저장한다. 테스트를 위해 아래 엑셀 데이터를 다운로드한다.
엑셀에 저장된 데이터는 리커트 5점 척도로 조사된 항목들로 구성되어 있다.
크론바흐 알파 계산하기
새 프로젝트 후 콘솔창에 다음 명령을 입력해 패키지를 설치한다.
install.packages("psy")
library("psy")
install.packages("psych")
library("psych")
엑셀파일이 준비되어 있다면, 다음 명령으로 엑셀파일을 읽을 수 있다.
library(readxl)
B <- read_excel("benefit.xlsx")
View(B)
결과는 다음과 같다.
만약, 준비된 데이터가 없다면, 다음 명령을 입력한다.
B <- data.frame(
B1=c(3,4,3,4,5,2,3,5,3,1),
B2=c(4,4,1,2,4,1,2,4,2,2),
B3=c(3,4,1,3,3,2,2,4,3,3))
B1=c(3,4,3,4,5,2,3,5,3,1),
B2=c(4,4,1,2,4,1,2,4,2,2),
B3=c(3,4,1,3,3,2,2,4,3,3))
데이터를 확인한다.
View(B)
추세선 그래프를 확인한다.
pairs(B, panel=panel.smooth)
크론바흐 알파를 계산한다.
cronbach(B)
결과는 다음과 같다. 알파값이 0.812이므로 0.8보다 크다. 보통, 알파값이 0.8이 높으면 일관성과 신뢰성이 좋다고 판단한다.
$sample.size
[1] 15
$number.of.items
[1] 7
$alpha
[1] 0.8127667
좀 더 상세한 알파 값을 얻는다.
alpha(B)
소숫점까지 포함된 알파 값을 확인해 본다.
q <- alpha(B)
q$total
결과는 다음과 같다.
raw_alpha std.alpha G6(smc) average_r S/N
0.8127667 0.8066837 0.8761885 0.3734824 4.172871
ase mean sd median_r
0.07143076 3.847619 0.7392902 0.4240922
마무리
이 글에서는 R 스튜디오 기반 데이터 통계 신뢰도 크론바흐 알파를 계산하는 방법을 간략히 설명하였다. 크론바흐 알파는 통계학자 크론바흐가 제안한 데이터 신뢰성 평가 방법이다. 주로 설문지 답변 데이터 신뢰성 등을 평가할 때 많이 사용된다. 크론바흐 알파 값 등급은 정해지지 않았지만, 일반적으로 0.6 이상이면 신뢰성이 있다고 한다. 만약, 0.6 미만으로 나오면 해당 데이터는 수정 및 삭제하는 것이 좋다.
댓글 없음:
댓글 쓰기