본문 바로가기
Future Strategy/샐러던트

데이터 코딩

by 홍인브로 2023. 9. 1.
728x90

<개념>

▶일반적 개념

-raw 데이터를 엑셀, 스프레드시트 또는 통계프로그렘에 로딩하는 과정

 

*엑셀 또는 스프레드시트 등으로 정리된 데이터는 통계프로그램에서 로딩할 수 없을 수 있음(표준화된 저장형식으로 변환하여 활용 가능)

 

-데이터 코딩을 위한 데이터 표준화된 저장형식: txt, csv

-txt

 ->장비 또는 기계로부터 받아들여지는 신호, 데이터값을 저장하는 가장 일반적인 형태

 ->가장 일반적인 raw 데이터

 

-csv(; comma seperted value, 쉼표로 구분된 값)

 

*팁, 엑셀 파일과 같은 위치에 csv파일을 저장해야 읿어버리고 다시 만드는 수고를 줄일 수 있다

 

▶ 통계적 개념

-수집된 데이터 즉, 모집단의 성질을 파악한다는 의미를 포함한다.

-표본을 이용하여 모집단의 성질을 조사하는 것을 표본 조사라고 한다.

-표본에 포함된 요소의 개수를 말하는 표본크기(sample size)는 모집단의 성질을 추정할 때의 확실성이나 가설검정의 결과에도 영향을 끼치기 때문에 통계 분석에 있어 중요한 요소 중 하나임

 

▶ 데이터 유형

-변수는 차원으로 표현할 수 있다

-측정된 변수의 갯수에 따라, 1변수 데이터, 2변수 데이터 .....

 

* 수집/코딩된 데이터의 정리 및 요약의 방법

 1. 기술 통계(descriptive ststistics)

     => 확보한 데이터에만 집중하면서 데이터 자체의 성질을 이해하는 방법

     => (석사 논문) 작성 시, 연구 방법 부분에 활용

 2. 추론 통계(inferential statistics)

     => 수집한 데이터로부터 데이터의 발생원을 추정하는 방법

     => (석사 논문) 작성 시, 연구 결과, 결론 등에 활용

 

 

 

<실행 예시>

▶ 신호 처리, 계측

     - 장비 또는 기계로부터 받아들여지는 신호, 데이터값을 저장하는 가장 일반적인 형태 

     - 아날로그 신호 디지털 변환ADC

ADC

 

▶ 설문 데이터

    - 첫번째 줄에 설문 제목과 내용이 모두 정리 되어 있다.

    - 입력단계에서는 각 항목 라벨이 의미있으나 열이름에 라벨이 포함될 필요는 없다.

       (raw 데이터에 표시하고, 다른 시트에서 통계 처리)

    - 데이터 클리닝(W01-01-데이터 클리닝) 참조

 

▶ 통계 데이터

     - 정부/공공기관, 기업 등 접근 공공 데이터는 기본적으로 *.xls, *.csv의 형태로 제공된 경우가 많음

       (예: 국가통계포털(KOSIS, 통계청), 보건복지데이터포털(한국보건사회연구원), ICT통계포털(ITSTAT, 과학기술정보통신부) 등)

KOSIS

 

 

<석사논문 작성을 위한 기초 통계 6주 완성>

 

 

석사논문 작성을 위한 기초 통계 6주 완성 - 크몽

용고opt2mot 전문가의 전자책 서비스를 만나보세요. 이런 분들이라면 놓치지 마세요 !!샐러던트: 대학원에서 연구를 시작하는 샐러던트대학원생: ...

kmong.com

 

 

728x90

'Future Strategy > 샐러던트' 카테고리의 다른 글

빈도분석  (0) 2023.09.03
신뢰도/타당도, 신뢰구간  (1) 2023.09.02
스프레드시트spreadsheet  (0) 2023.08.31
데이터 클리닝  (0) 2023.08.30
석사 논문 경계 정하기  (0) 2023.08.08

댓글