본문 바로가기

공부중/1 SAS11

SAS 평균값 정리 [PROC TABULATE] [PROC TABULATE]를 이용해서 변수들의 평균값을 구해보자! PROC MEANS를 이용할 수도 있지만, TABULATE로도 구할 수 있어서 차이점을 같이 비교해보겠다. # 사용 데이터셋: 공공데이터포털(주택도시보증공사_전국 평균 분양가격) #설명 - 데이터셋 변수 구성 : 시도(SIDO), 면적(SIZE), 가격(PRICE), 연도(YEAR), 월(MON) - 기간: 2015년 10월 ~2019년 12월 이제 TABULATE를 사용해서 평균값을 구해보자. #1. 시도별 평균 분양가격 (1변수) proc tabulate data=T.h_price ; var price ; class SIDO; tables SIDO, price*(N MEAN); run; ( **MEAN을 쓰지 않으면 시도별 가격의 합.. 2020. 2. 2.
SAS [PROC CONTENTS] - 데이터셋 변수확인하기 PROC CONTENTS 작업에 대해 알아보자 !! [PROC CONTENTS]는 생성한 데이터셋의 정보를 확인하는데 편리하게 사용할 수 있다. 작업한 데이터셋의 관측값 수(N), 파일크기, 변수리스트(주로 이부분!) 를 확인한다. 가장 기본적으로 데이터셋의 변수속성을 확인하는 방법은 데이터셋을 열어서 해당 변수를 더블클릭하면 된다. 하지만 이 방법은 데이터의 용량이 크거나, 확인할 변수가 많을 경우에는 다음과 불편함이 있다. 1 확인중에 에러발생 (화면멈춤) 2 변수가 많을때는 페이지가 넘어가서 찾기 어려움 (시간소요) 3 변수명을 사용한 명령문 작성할 때 (이것도 시간소요) 이런 경우에 이 함수를 사용해서 시간을 줄여보자. PROC CONTENTS DATA=데이터셋; RUN; *예시 데이터셋 = CA.. 2020. 1. 12.
SAS 빈도분석 [PROC FREQ] -2 이어서 PROC FREQ의 또다른 자주쓰는 옵션들을 알아보자. 1. 조건에 해당하는 빈도 확인 [where문] ex1. 사고유형(TYPE)이 무단횡단인 경우의 연도별 빈도 PROC FREQ DATA=CAR_ACCIDENT; WHERE TYPE='무단횡단'; TABLE YEAR; RUN; ex2. 사고유형(TYPE)이 무단횡단인 경우의 2015~2017년 빈도 PROC FREQ DATA=CAR_ACCIDENT; WHERE TYPE='무단횡단' and 2014 2020. 1. 9.
SAS 빈도분석 [PROC FREQ] -1 통계분석 자료확인시 제일 먼저 시행하는 변수별 빈도 및 누적빈도의 확인. 자료점검 및 변수확인을 위해서 가장 단순하지만, 많이 이용하는 함수이다. 1차원, 2차원(교차테이블)까지 출력 가능. (그 이상은 각 경우에 따라 테이블이 나눠져서 출력됨) PROC FREQ DATA = 데이터셋; TABLES 변수/옵션(선택사항) ; RUN; 1. 옵션을 작성하지 않을 경우 > 빈도, 백분율, 누적빈도, 누적백분율 4가지가 기본으로 출력된다. PROC FREQ DATA=CAR_ACCIDENT; TABLES TYPE ; RUN; 2. 옵션 추가 (원하는 옵션만 선택하여 작성) ○ NOPERCENT : (CELL빈도/전체빈도) 프린트하지 않음. ○ NOROW: (CELL빈도/행빈도) 프린트 하지 않음. (2차원분석에서.. 2019. 12. 31.