댓글 쓰기 권한이 없습니다. 로그인 하시겠습니까?
사이트 로그인
오늘은 table plot에 대해 다뤄 볼까 합니다
table plot은 개체 수가 큰 데이터에 대한 시각화 하기에 알맞은 플롯으로서
R에서 tableplot이라는 함수를 사용합니다.
일단 패키지 설치와 라이브러리 호출, 사용할 데이터프레임을 호출하도록 하겠습니다.
install.packages("tabplot") library("tabplot") require(ggplot2) data(diamonds) |
tabplot이라는 패키지를 설치하셔야 합니다. 그리고 diamonds 라는 데이터프레임이 ggplot2패키지 안에 있기 때문에,
require(ggplot2) 를 통해 호출해줍니다.
diamonds 데이터프레임이 어떤 형태인지 head(diamonds) 를 통해 확인해 봅시다.
carat 은 다이아몬드의 크기
cut 은 단면의 질
color 는 다이아몬드 색상등급
clarity 는 투명도 등급
price 는 가격을 나타내는 데이터 프레임 같습니다.
x, y, z는 다이아몬드의 길이를 나타내는 것 같군요.
tableplot(diamonds) |
를 통해 그래프가 어떤식으로 그려지는 확인해 봅시다.
모든 변수들에 대하여 plot을 그려준것을 확인 할수 있고, carat 기준으로 정렬되어 있는것도 확인 하실 수 있습니다. :)
정렬은 내림차순 기준입니다.!
이제 변수를 carat, cut, color, clarity, price 만 선택해서 그려보도록 하죠.
tableplot(diamonds, select=c(carat, cut, color, clarity, price), sortCol=price) |
select 옵션을 통해 사용할 변수를 선택하고, sortCol을 통해 정렬할 기준 변수를 선택합니다.
이 그래프를 통해 확연하게 눈에 들어오는 점은 carat과 가격간의 상관관계입니다.
당연한 얘기이지만, carat이 커질수록 가격도 비싸지는 모습을 볼수 있습니다.
tableplot(diamonds, subset=price < 5000 & cut=='Ideal',select=c(carat, cut, color, clarity, price), sortCol=color) |
이번엔 색상도 지정해 봅시다!
tableplot(diamonds,select=c(carat, cut, color, clarity, price), pals=list(cut="Set1", color="Paired", clarity=grey(seq(0, 1,length.out=7))), numPals=c(carat="Greens", price="Purples"),sortCol=color) |
현재 diamonds 데이터프레임 안에 price와 carat만 연속형 변수이고, 나머지 변수는 범주형 변수 입니다.
tableplot내에서 연속형이냐 범주형이냐에 따라 색상을 따로 지정해 줄 수 있습니다.
범주형인 경우에는 pals 옵션, 연속형인경우에는 numPals 를 통해 색상을 지정해줄수 있습니다.
Designed by sketchbooks.co.kr / sketchbook5 board skin
Sketchbook5, 스케치북5
Sketchbook5, 스케치북5
Sketchbook5, 스케치북5
Sketchbook5, 스케치북5