사이트 로그인
통계과에서 많이 쓰이는 프로그램은 SPSS와 SAS 그리고 최근들어 R 로 좁힐 수 있습니다 ! 그리고 SPSS는 상대적으로 사회과학 계열의 통계비전공자들이 사용하는 가벼운 분석 프로그램으로 알려져 있지요.
그렇다면 남은 SAS랑 R 중에서 무엇을 배워야 할까요?
"R이 대세다" V.S. "그래도 기업에 가면 SAS 쓰더라"
R의 장점은 공짜라는점, 오픈소스 이기때문에 각종 패키지를 통해 최근의 학문적 연구를 곧바로 반영한다는 점. 단점은 대용량의 데이터 처리가 SAS에 비해 다소 복잡하다는 점, SAS 회사에서 library를 유지보수 관리해주는 SAS와 달리 R은 그러한 주체가 없어서 불안정한 측면이 있다는 점, 반복문이 느리다는 점을 들 수 있습니다.
SAS의 장점은 SAS 회사에 의해 검증된 프로그램이라는 것 따라서 안정성이 뛰어나다는 것. 각종 회사의 임직원 분들이 그나마 익숙한 프로그램이라는 점 이 두가지로 인해 보통 회사에서 SAS를 선호합니다. 또한 대용량 처리에 상대적으로 수월하다는 점을 들 수 있습니다. 단점은 라이센스 비용이 매우 비싸다는 점, 새로운 학문적 연구를 반영하는데 몇년간의 시간이 걸린다는 점을 들 수 있습니다. 이로인해 대학 교수님들의 연구등은 최근 R이 많이 이용되는 모습입니다.
이렇듯 SAS는 회사에서 많이 사용하며 현재의 시장 장악력과 기업수준에서 프로그램언어를 유지관리하고 홍보하는 측면을 살펴볼 때 R과 함께 시장을 양분하며 공존할 가능성이 매우 높아보입니다. 이번 초급강의는 SAS Foundation 8.1 버전을 기준으로 하겠습니다. 신버전 소프트웨어가 확보되는 대로 9.3버전으로 바꾸어 진행하겠습니다 ! SAS Foundation의 경우 강의에 다룰 내용에 있어 이전버전과 비교하여 바뀐내용은 거의 전무합니다.
SAS의 구성은 매우매우 복잡하나 SAS/CORE, SAS/BASE 와 SAS/STAT 이 사용용도의 대부분을 차지하고 최근 빅데이터와 관련된 소프트웨어로 각종 데이터마이닝을 지원하는 SAS/Enterprise Miner를 눈여겨 볼 필요가 있습니다.
• 시스템
- SAS/CORE : SAS 시스템을 지배하는 핵심 부분
SAS 언어로 작성된 SAS 프로그램을 해석하고, SAS 시스템 제어 및 관리
• 데이터 처리
- SAS/BASE : SAS의 가장 기본적인 S/W
자료 입력, 입력자료 저장, 수정, 검색, SAS 파일 편집
단순통계 분석, 보고서 작성
-SAS/FSP : 대화형 처리 S/W
SAS자료의 수정, 검색 등을 모니터 전체 화면을 사용하여 처리하는 S/W
※ Base SAS Software(기본 SAS 소프트웨어) : SAS/CORE+SAS/BASE
간단한 자료처리 및 통계량 계산을 수행 간단한 자료처리 및 통계량 계산을 수행
• 그래픽
- SAS/GRAPH : 고단위 그래픽 S/W
각종 2차원 및 3차원 그래프 지원 각종 2차원 및 3차원 그래프 지원
• DBMS(DataBase Management System) 데이터 엑세스
- SAS/ACCESS : 각종 데이터베이스 엑세스 S/W
다른 데이터베이스와의 접속이 가능하도록 하는 S/W
SAS 소프트웨어 구성(계속)
• 통계분석
- SAS/STAT : 통계분석 S/W
통계 모델을 이용한 광범위한 자료 분석법, 모수추정 기법 등 고급 응용통계 방법 지원
- SAS/IML : SAS/Interactive Matrix Language
행렬연산 S/W
- SAS/QC : 통계적 품질관리 S/W
-SAS/ETS : 경제통계와 시계열분석 S/W
- SAS/OR : SAS/Operation Research
의사결정기법 지원 S/W
-SAS/LAB : 대화형 실험실 통계해석 S/W
- SAS/INSIGHT : 대화형 통계해석 및 그래픽 구현 S/W
- SAS/CALC : 스프레드쉬트 S/W
• 어플리케이션 구축
- SAS/AF : SAS/Application Facility
어플리케이션 개발 S/W 어플리케이션 개발 S/W
메뉴판식 응용프로그램 작성지원 S/W
- SAS/EIS : 메뉴형식의 Enterprise Information System(EIS)개발지원 S/W
- SAS/SCL : Screen Control Language SAS/SCL : Screen Control Language
• 사용자 지향 응용 어플리케이션
-SAS/ASSIST : 메뉴형식의 사용자 인터페이스 S/W
- SAS/CPE : 컴퓨터 성능평가 S/W
- SAS/PH-CLINICAL : 의학/약학 연구해석용 S/W
•분산처리
- SAS/CONFLICT : 분산 처리 관련 S/W
•기타
- SAS/TOOLKIT : SAS 모듈작성 S/W
- SAS/GIS : 지리정보시스템 S/W
- SAS/C : C 컴파일러 SAS/C : C 컴파일러
- SAS/MACRO : 동일한 작업의 반복을 단순화하기 위한 S/W
- SAS/Enterprise Miner : 각종 Data Mining을 지원하는 S/W
SAS Foundation의 초기화면입니다.
1. Explorer 창
- 테이블(data set), 카탈로그, 파일 등을 관리하는 곳
- SAS 파일을 보거나 관리
- 새로운 라이브러리 및 파일 단축 경로 생성
- 라이브러리의 새로운 멤버 생성 라이브러리의 새로운 멤버 생성
- SAS 파일을 열거나 편집
2. 결과 창
- 편집기 창에서 실행된 프로그램의 각 절차에 의해 출력 결과 목록이 나타남
- 해당목록을 더블클릭하면 ‘출력’창에서 해당되는 내용으로 이동
3. 편집기 창
- 종류 : 확장편집기, 프로그램편집기
- 기존의 프로그램 열기, 편집
- 새로운 프로그램 생성 및 실행
- 프로그램 실행시 F8버튼 또는 실행버튼( )으로 실행
4. 로그 창
- SAS 프로그램 실행시 프로그램 내용을 검토하며 오류의 파악
- 검토 결과와 각 절차들의 실행에 소요된 시간 등을 출력
5. 출력화면
- SAS 프로그램에 의해 실행된 결과들이 나타남
- 단, 그래픽 모드로 출력된 결과들은 그래픽 창에 나타남
SAS 프로그램은 DATA 단계와 PROC 단계로 이루어져 있습니다.
• DATA 단계
DATA 문으로 시작하여 하나 이상의 새로운 SAS data set을 생성하거나 이미 존재하는 SAS data set을 가공, 처리하여 새로운 SAS data set을 만듭니다. 그리고 REPORT문을 이용한 보고서 작성, 파일의 처리, 정보의 저장, 회수 등이 이루어집니다.
• PROC(procedure) 단계
PROC 문으로 시작하여 지정된 이름을 가진 절차를 수행합니다. DATA문에 의해 생성된 SAS data set을 그 자료로 분석하고. 그 결과를 출력합니다. 대표적 처리 절차로는 PRINT, MEANS, UNIVARIATE, CORR, TTEST, ANOVA, REG, GLM, FREQ, LOGISTIC, PRINCOM, FACTOR, CLUSTER, DISCRIM, CANDISC 등이 있습니다 !
아래의 도식도를 참고하시기 바랍니다.
이번 강의 <[BigData - SAS강의 초급] SAS 시스템과 SAS 언어 구조>는 전 중앙대학교 통계학과 (현 서울대학교 보건대학) 원성호 교수님의 강의록을 참고하였음을 밝힙니다.
번호 | 제목 | 글쓴이 | 날짜 | 조회 수 |
---|---|---|---|---|
4 | [BigData - SAS강의 초급] SAS 연산자 - 산술, 비교, 논리연산자 | DataMarket2 | 2014.05.23 | 60903 |
3 | [BigData - SAS강의 초급] SAS 문장의 특징 1 | DataMarket2 | 2014.05.23 | 42304 |
2 | [BigData - SAS강의 초급] SAS DATA step, PROC step 예제 1 | DataMarket2 | 2014.05.23 | 45059 |
» | [BigData - SAS강의 초급] SAS 시스템과 SAS 언어 구조 1 | DataMarket2 | 2014.05.23 | 51385 |
Designed by sketchbooks.co.kr / sketchbook5 board skin
Sketchbook5, 스케치북5
Sketchbook5, 스케치북5
Sketchbook5, 스케치북5
Sketchbook5, 스케치북5