본문 바로가기

공부중/1 SAS11

SAS 데이터셋 삭제하기 [PROC DELETE] SAS에서 작업을 하다보면, 최종 데이터셋을 정리하기 전까지 여러개의 데이터셋을 생성하게 된다. WORK 또는 라이브러리 폴더에서 데이터셋을 삭제할때 가장 많이 하는 방법은 데이터셋 클릭 -> 마우스 오른쪽Click -> 삭제 또는 DELETE키를 이용해 직접 삭제하는 것이다. 하지만 삭제할 데이터셋이 여러개의 라이브러리에 위치한 경우에는 탐색기에서 여러번 왔다갔다?! 거려야 하고 데이터셋이름이 비슷할 경우 잘못 삭제하는 실수를 할 수도 있다. 또, 여러개의 데이터셋을 한꺼번에 삭제하고자 할때나 삭제한 기록을 표시해놓아야 할때에는 명령문을 사용해서 삭제하는 방법이 매우 유용하다. 이제 방법을 알아보자. 명령문은 매우 간단하다. PROC DELETE DATA=삭제하려는 데이터셋; RUN; (예시) ① pr.. 2020. 3. 19.
SAS 날짜변수, (1-4)분기로 구분하기 [QTR] 기간별 매출액 등을 계산할 때에는 보통 분기별로 나눠서 분석하고는 한다. SAS에서 날짜변수를 이용해서 일수 등 기간 계산 뿐 아니라 분기로 구간을 나누는 것도 가능하다. 분기는 아래의 기준으로 나눌수 있다. 1분기=01,02,03월 / 2분기=04,05,06월/ 3분기=07,08,09월 / 4분기=10,11,12월 SAS에서는 IF조건문을 사용해서 직접 날짜를 구분하는 것도 가능하지만, [QTR]이라는 함수를 써서 좀 더 간편하게 계산을 할 수 있다. 다음의 예시를 이용해서 연습해보자. 데이터셋은 시도명(SIDO), 개설일(Open_date), 개설연도(Open_year) 세가지 변수로 구성되어 있으며, 기간은 2016년~2018년 3개연도이다. 이제 각 연도별이 아니라 연도&분기별 빈도를 파악해 보자.. 2020. 3. 15.
SAS 날짜변수 변환 (문자 < > 숫자) 데이터 처리과정에서 시계열자료나, 기간 계산 등 날짜변수를 이용하는 경우가 꽤 많다. 데이터를 불러온 후, 변수를 원하는 날짜형식으로 정리해보자. *데이터 출처: 공공데이터 포털, (건강보험심사평가원의 요양기관 개설 현황) 불러온 데이터셋(open)에서 '개설일자(open_dt)' 변수는 현재 문자로 되어있다. 연습1. 2019년 12월 31일의 값을 가지는 END_DT라는 날짜변수 만들기. mdy는 날짜지정변수로 변수명=mdy(월,일,연도) 를 쓰면 되는데, 이때 format 문을 함께 써 줘야 우리가 원하는 날짜 형태로 출력이 된다. (SAS에서는 날짜를 정수로 된 숫자로 인식하고 계산을 한다. 1960년 1월 1일을 기준으로 0부터 시작하는 양수로, 기준보다 이전의 날짜는 음수로 표현한다. 2019.. 2020. 3. 4.
SAS 빈도분석 [PROC TABULATE] 데이터를 처음 확인할때 각 변수별로 빈도를 점검한다. [PROC FREQ]는 가장 많이 쓰는 함수인데, N개의 변수를 쓰면 N개의 빈도표가 출력된다. 한개의 테이블에서 여러개 변수의 빈도표를 출력하고 싶을때 (dummy table등을 만들때) [PROC TABULATE] 를 사용하면 좀 더 편리하겠다. (결과창을 엑셀에 여러번 복/붙 하는 시간도 줄일 수 있다.) *데이터 출처: 공공데이터 포털, (건강보험심사평가원의 요양기관 개설 현황) [Institution]이라는 데이터셋을 사용해서 연습해보자. (오픈 데이터이지만 주소는 그냥 가렸습니다. '_' ) 1) 시도명(SIDO), 요양기관종별(medical_type), 표시과목(subject) 의 빈도 출력 PROC FREQ data=institution.. 2020. 2. 23.