PROC CONTENTS 작업에 대해 알아보자 !!
[PROC CONTENTS]는 생성한 데이터셋의 정보를 확인하는데 편리하게 사용할 수 있다.
작업한 데이터셋의 관측값 수(N), 파일크기, 변수리스트(주로 이부분!) 를 확인한다.
가장 기본적으로 데이터셋의 변수속성을 확인하는 방법은 데이터셋을 열어서 해당 변수를 더블클릭하면 된다.
하지만 이 방법은 데이터의 용량이 크거나, 확인할 변수가 많을 경우에는 다음과 불편함이 있다.
1 확인중에 에러발생 (화면멈춤)
2 변수가 많을때는 페이지가 넘어가서 찾기 어려움 (시간소요)
3 변수명을 사용한 명령문 작성할 때 (이것도 시간소요)
이런 경우에 이 함수를 사용해서 시간을 줄여보자.
PROC CONTENTS DATA=데이터셋; RUN; |
*예시 데이터셋 = CAR
ex. PROC CONTENTS DATA=CAR; RUN;
결과: 'CAR'이라는 데이터셋의 CONTETNS프로시저, 엔진/호스트 관련 정보/ 변수와 속성 리스트(오름차순) 세가지 결과가 출력된다.
이때에 변수와 속성 리스트(오름차순) 결과를 보면 데이터셋에서 보이는 변수의 순서와 동일하게 출력되지 않는다.
*데이터셋과 동일한 변수리스트를 확인하고 싶을 때에는 다음의 옵션을 써준다.
PROC CONTENTS DATA=CAR POSITION; RUN;
PROC CONTENTS DATA=CAR VARNUM; RUN;
POSITION 옵션은 변수리스트(오름차순), 데이터셋의 (생성순서) 변수리스트 두가지가 모두 출력된다.
(오른쪽, 왼쪽 둘다 출력)
생성순서 리스트만 보고 싶을 때에는 VARNUM을 써준다. (위의 오른쪽 한개만 출력)
위의 결과는 각 변수명과 함께 유형,길이,라벨 등이 모두 출력되는데, 간단하게 *변수명들만 확인하고 싶을때는 SHORT를 써준다. KEEP, DROP 등 변수명을 나열하거나, 기존 변수들을 사용해 새로운 명령문을 작성할때 등 복사해서 사용하면 굉장히 편리하다.
PROC CONTENTS DATA=CAR SHORT ; RUN; 오름차순으로 출력 (↓왼쪽)
PROC CONTENTS DATA=CAR VARNUM SHORT ; RUN; 생성순서로 출력 (↓오른쪽)
*출력결과를 데이터셋으로 저장하고 싶으면 OUT=데이터셋 을 써준다.
PROC CONTENTS DATA=CAR OUT=K ; RUN; (K라는 데이터셋에 저장)
** 라이브러리 속성 확인
라이브러리의 데이터셋속성도 한번에 확인할 수 있다.
PROC CONTENTS DATA=_ALL_ NODS; RUN; WORK에 있는 데이터셋 리스트 출력
PROC CONTENTS DATA=A._ALL_ NODS; RUN; 라이브러리 A의 데이터셋 리스트 출력
이때 NODS를 작성하지 않으면 해당 라이브러리에 있는 모든 데이터셋의 PROC CONTENTS 결과(맨 위의 내용)가 출력된다.
(이 결과는 위와 동일하므로 추가하지 않음)
WORK 라이브러리에 CAR, CAR1, CAR_ACCIDENT 이라는 데이터셋 3개가 있음을 확인 할 수 있다.
- 끝 -
'공부중 > 1 SAS' 카테고리의 다른 글
SAS 빈도분석 [PROC TABULATE] (0) | 2020.02.23 |
---|---|
SAS 평균값 정리 [PROC TABULATE] (0) | 2020.02.02 |
SAS 빈도분석 [PROC FREQ] -2 (0) | 2020.01.09 |
SAS 빈도분석 [PROC FREQ] -1 (0) | 2019.12.31 |
SAS 탐색기 옵션 (0) | 2019.10.01 |