close_btn
조회 수 60545 추천 수 0 댓글 1
?

단축키

Prev이전 문서

Next다음 문서

+ - Up Down Comment Print
?

단축키

Prev이전 문서

Next다음 문서

+ - Up Down Comment Print

R을 통해 데이터를 시각화 시키는 방법에 대해서 20여개의 포스트가 올라 갈 것입니다.

데이터 시각화 툴에는 여러가지가 있지만, 이중에서도 R을 사용하여 시각화하는 방법에 대해서 포스팅 하도록 하겠습니다.

R에 대한 기초 적인 사용방법에 대해서는 넘어가도록 하겠습니다.

이 부분에 대해서는 R강의 초급 포스팅을 모두 소화하신 다면 무리 없이 따라 오실 수 있을 겁니다.

오늘은 가장 기본적인 plot함수에 대해서 포스팅 하도록 하겠습니다.

 

이변량 그래프에 관한 R 함수

plot(x,y) #x에 대한y의 산점도
plot(factor, y) #각 인자 수준에서 y의 상자 수염 그래프
barplot(y) # y값 벡터의 높이(인자 수준별 1개의 막대)
points() #점을 찍을때
lines() #선을 그을때

 

R에 기본적으로 내장되어있는 데이터를 가지고 예제를 보여드리도록 하겠습니다.

carsstr(cars)

위 코드를 입력하시면

'data.frame': 50 obs. of 2 variables:
$ speed: num 4 4 7 7 8 9 10 10 10 11 ...
$ dist : num 2 10 4 22 16 10 18 26 34 17 ...

스피드와 빈도 에대한 cars라는  dataframe이 호출 되는것을 보실 수 있습니다.

기본 plot() 함수 사용방법은 plot(x, y) 입니다.

plot(cars$speed,cars$dist)
plot(cars)

위 두 줄의 결과는 아래 그림 처럼 같은 결과가 나옵니다, x축에 cars$speed, y축에 cars$dist 를 출력합니다.

데이터프레임 명 자체를 입력을 해도 같은 결과가 나옵니다(이변량에 한해서는).

 

2

 

 

위 그림을 보시면 x축 y축 이름이 cars$speed, cars$dist로 기본 설정 되있는 것을 보실 수 있습니다.

각 축 이름과 x춧 y축값의 범위를 설정해보고 색깔을 넣어보도록 하겠습니다.

 

plot(cars, col="red",xlab="speed",yalb="dist",xlim=c(0,30),ylim=c(0,100))
lines(cars)

2번째 줄은 cars데이터를 모두 선으로 연결하라 라는 뜻입니다.

두 줄 모두 실행하면 아래와 같은 결과를 보여줍니다.

4

 

각축의 제목과 범위, 그리고 point의 색깔이 바뀐것을 보실 수  있습니다.

 

이번에는 두개의 데이터프레임이 있다는 가정하에 그래프를 만들어 보도록 하겠습니다.

car1<-cars[1:30,]
plot(car1, col="red",xlab="speed",yalb="dist",xlim=c(0,30),ylim=c(0,100))
lines(car1)
abline(lm(car1$dist ~ car1$speed))

1. cars의 1행부터 30행 까지 car1에 입력

2. car1 plot생성

3. car1 line 생성

4. lm(y~x)는 y = ax + b에 대해 회귀분석을 하라는 함수 입니다. abline(lm(y ~ x)) 는 회귀식의 직선을 그래프상에서 그려줍니다

 

모두 실행하시면 아래와 같은 결과가 나옵니다.

 

8

 

 

여기에 cars의 나머지 데이터를 그래프에 함께 표시해보도록 하겠습니다.

car2<-cars[-(1:30),]
points(car2,col="blue",pch=17)
abline(lm(car2$dist ~ car2$speed))
legend(locator(1),c("car1","car2"),pch=c(1,17), col=c("red","blue"))

1. cars의 1행부터 30행까지 제외한 나머지 데이터를 car2에 넣어라

2. cars데이터의 점을 찍어라, 색깔은 blue, pch(점의 형태)는 17번째

3. car2데이터를 이용해 회귀직선을 그어라

4. 각점에 대한 범례를 표시해라

 

2번 줄의 points는 그래프상에 점을 찍는데 사용합니다. plot과 다른점은

plot(car2)를 하면 car1의 plot이 사라지고 car2 plot이 나타나지만, points(cars2)는 car1 plot위에 car2의 점을 찍습니다

또한, pch는 점의 형태를 나타냅니다. 기본 값은 1번으로 흰색 동그라미 이지만 임의로 설정해서 바꿀수 있습니다.

0부터 255까지 총 256개의 점의 형태를 지원하고 있습니다.

point

 

1번 줄 부터 3번 줄까지 실행하시면 아래 그림처럼 결과가 출력이 됩니다.

10

 

4번줄을 실행하시면 아무것도 뜨지 않을건데, locator(1)을 넣어주시면 범례 상자를 자신이 지정할수가 있습니다.

4번줄을 실행하시고 그래프상에 원하는 곳을 클릭하면 아래 그림 처럼 범례가 추가 된 모습을 보실 수  있습니다.

 

11

 

 


List of Articles
번호 제목 글쓴이 날짜 조회 수
공지 데이터시각화 강의 게시판 이용관련 공지사항 DataMarket 2014.05.21 81067
3 [BigData -Visualization for R] BoxPlot datamarket 2014.05.21 55248
2 [BigData -Visualization for R] 그래프기호 pch종류와 색상 datamarket 2014.05.21 82576
» [BigData -Visualization for R] 산점도(Plot) 1 datamarket 2014.05.21 60545
Board Pagination ‹ Prev 1 ... 2 3 Next ›
/ 3

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소

Designed by sketchbooks.co.kr / sketchbook5 board skin

Sketchbook5, 스케치북5

Sketchbook5, 스케치북5

Sketchbook5, 스케치북5

Sketchbook5, 스케치북5