본문 바로가기

공부중20

SAS 빈도분석 [PROC TABULATE] 데이터를 처음 확인할때 각 변수별로 빈도를 점검한다. [PROC FREQ]는 가장 많이 쓰는 함수인데, N개의 변수를 쓰면 N개의 빈도표가 출력된다. 한개의 테이블에서 여러개 변수의 빈도표를 출력하고 싶을때 (dummy table등을 만들때) [PROC TABULATE] 를 사용하면 좀 더 편리하겠다. (결과창을 엑셀에 여러번 복/붙 하는 시간도 줄일 수 있다.) *데이터 출처: 공공데이터 포털, (건강보험심사평가원의 요양기관 개설 현황) [Institution]이라는 데이터셋을 사용해서 연습해보자. (오픈 데이터이지만 주소는 그냥 가렸습니다. '_' ) 1) 시도명(SIDO), 요양기관종별(medical_type), 표시과목(subject) 의 빈도 출력 PROC FREQ data=institution.. 2020. 2. 23.
SAS 평균값 정리 [PROC TABULATE] [PROC TABULATE]를 이용해서 변수들의 평균값을 구해보자! PROC MEANS를 이용할 수도 있지만, TABULATE로도 구할 수 있어서 차이점을 같이 비교해보겠다. # 사용 데이터셋: 공공데이터포털(주택도시보증공사_전국 평균 분양가격) #설명 - 데이터셋 변수 구성 : 시도(SIDO), 면적(SIZE), 가격(PRICE), 연도(YEAR), 월(MON) - 기간: 2015년 10월 ~2019년 12월 이제 TABULATE를 사용해서 평균값을 구해보자. #1. 시도별 평균 분양가격 (1변수) proc tabulate data=T.h_price ; var price ; class SIDO; tables SIDO, price*(N MEAN); run; ( **MEAN을 쓰지 않으면 시도별 가격의 합.. 2020. 2. 2.
SAS [PROC CONTENTS] - 데이터셋 변수확인하기 PROC CONTENTS 작업에 대해 알아보자 !! [PROC CONTENTS]는 생성한 데이터셋의 정보를 확인하는데 편리하게 사용할 수 있다. 작업한 데이터셋의 관측값 수(N), 파일크기, 변수리스트(주로 이부분!) 를 확인한다. 가장 기본적으로 데이터셋의 변수속성을 확인하는 방법은 데이터셋을 열어서 해당 변수를 더블클릭하면 된다. 하지만 이 방법은 데이터의 용량이 크거나, 확인할 변수가 많을 경우에는 다음과 불편함이 있다. 1 확인중에 에러발생 (화면멈춤) 2 변수가 많을때는 페이지가 넘어가서 찾기 어려움 (시간소요) 3 변수명을 사용한 명령문 작성할 때 (이것도 시간소요) 이런 경우에 이 함수를 사용해서 시간을 줄여보자. PROC CONTENTS DATA=데이터셋; RUN; *예시 데이터셋 = CA.. 2020. 1. 12.
SAS 빈도분석 [PROC FREQ] -2 이어서 PROC FREQ의 또다른 자주쓰는 옵션들을 알아보자. 1. 조건에 해당하는 빈도 확인 [where문] ex1. 사고유형(TYPE)이 무단횡단인 경우의 연도별 빈도 PROC FREQ DATA=CAR_ACCIDENT; WHERE TYPE='무단횡단'; TABLE YEAR; RUN; ex2. 사고유형(TYPE)이 무단횡단인 경우의 2015~2017년 빈도 PROC FREQ DATA=CAR_ACCIDENT; WHERE TYPE='무단횡단' and 2014 2020. 1. 9.