728x90 Future Strategy/샐러던트18 신뢰도/타당도, 신뢰구간 ▶신뢰구간(confidence interval, CI) - 오차를 정량화하기 위한 개념 - 표본에서 구한 모집단 평균의 추정값을 어느 정도 신뢰할 수 있는지를 나타냄 *정규 분포의 성질에서, 평균값±2×표준편차 범위에 약 95%의 값을 포함하고 있다. =>정규 분포에서 하나의 값을 무작위로 꺼내면 약 95%확률로 그 범위에 포함된다는 의미 - ○○% 신뢰구간을 해석하면 "○○%의 확률로 이 구간에 모집단 평균이 있다" - 추론 통계 방법인 신뢰구간은 매우 중요하며, 연구 논문 등 현장에서 빈번하게 쓰임 *얻어진 데이터(표본)를 통해 예측한 모집단에 대한 성질(모집단 평균)을 잘 설명할 수 있을지에 대하여 데이터(조사값)의 신뢰정도를 나타내는 개념, 즉, 내가 진행한 연구에서 조사한 또는 측정한 값에 신뢰.. 2023. 9. 2. 데이터 코딩 ▶일반적 개념 -raw 데이터를 엑셀, 스프레드시트 또는 통계프로그렘에 로딩하는 과정 *엑셀 또는 스프레드시트 등으로 정리된 데이터는 통계프로그램에서 로딩할 수 없을 수 있음(표준화된 저장형식으로 변환하여 활용 가능) -데이터 코딩을 위한 데이터 표준화된 저장형식: txt, csv -txt ->장비 또는 기계로부터 받아들여지는 신호, 데이터값을 저장하는 가장 일반적인 형태 ->가장 일반적인 raw 데이터 -csv(; comma seperted value, 쉼표로 구분된 값) *팁, 엑셀 파일과 같은 위치에 csv파일을 저장해야 읿어버리고 다시 만드는 수고를 줄일 수 있다 ▶ 통계적 개념 -수집된 데이터 즉, 모집단의 성질을 파악한다는 의미를 포함한다. -표본을 이용하여 모집단의 성질을 조사하는 것을 표본.. 2023. 9. 1. 스프레드시트spreadsheet - 숫자나 문자를 작업표에 입력하고 원하는 계산이나 관리, 도표 작성, 검색 등의 다양한 기능을 할 수 있는 프로그램 - 대표적 프로그램: MS Excel, 한셀, Origin, Sigmaplot 등 - 데이터를 모으고 클리닝하는 프로그램 - 데이터 시각화의 가장 기본적인 프로그램 ⓛ 현재 작업하고 있는 프로그램의 이름과 파일명 ② 메뉴 표시줄. Excel에서 사용 가능한 주 메뉴 ③ 도구 모음, 메뉴표시줄의 메뉴 중 많이 사용되는 기능을 유형별로 분류하여 아이콘화 ④ 현재 포인터가 위치하고 있는 곳의 주소 (그림에서 'B5'라고 표시되어 있는 것의 의미는 현재 포인터가 위치하고 있는 곳의 주소가 B열과 다섯 번째 행이 교차하는 지점) ⑤ B5. Excel의 워크시트에서 '셀' ⑥ 셀 포인터. 셀의 자동.. 2023. 8. 31. 데이터 클리닝 -본격적인 분석에 앞서 테이터 정리하기 -raw 데이터를 통계 분석용 데이터로 정리하는 과정 -데이터마다 상황별로 적용해야할 클리닝 방법이 상이하므로 경우/상황에 맞게 데이터를 분류/정리해야 함 -같은 프로그램, 데이터를 사용해도 연구자마다 데이터를 담는 방식은 천차만별, 다양함 -실제 데이터 분석 과정에서 가장 귀찮고 하기 싫으면서도 시간도 가장 많이 잡아먹는 과정 ->엉터리로 작업된(정리안된) 엑셀 내 데이터를 통계 프로그램에서 사용하기 쉽도록 다듬는 일 * 데이터 분석의 목적 1. 데이터를 요약하는 것 => 데이터에 포함된 수치의 경향을 대략적으로 알 수 있음 => 예) 평균값 계산 등 2. 대상을 설명하는 것 => 대상이 가진 성질과 관계성을 명확히 밝히고 이를 이해 할 수 있음 => 예) 관계성.. 2023. 8. 30. 이전 1 2 3 4 5 다음 728x90