close_btn
?

단축키

Prev이전 문서

Next다음 문서

+ - Up Down Comment Print
?

단축키

Prev이전 문서

Next다음 문서

+ - Up Down Comment Print

이전에 알고 있던 표에서 몇가지 더 추가시키죠 !

표현식

의미

동등 표현식

.

개행을 제외한 모든문자 (공백포함)

 [^\n\r]

\p{Hangul}

한글

 

\w

영소문자, 영대문자, 숫자, _(언더바)

 [A-Za-z0-9_]

\W

영소문자, 영대문자, 숫자, _(언더바)를 제외한 모든 문자

 

\d

숫자

[0-9]

\D

숫자를 제외한 모든문자

 

\s

공백, 탭, 개행

 

\S

공백, 탭, 개행을 제외한 모든문자

 

[\s\S]

모든 문자

 

위 이외에도 \n 개행, \t 탭, [\b] 백스페이스 등이 있습니다. 이들을 통틀어 메타문자라고 합니다.

 

추가시킨 내용은 이전 포스팅에서 배운 한글과 "\W", "\D", "\S" 입니다. "\d"가 숫자를 의미했지요 ! d를 대문자로 바꾼 "\D"는 정 반대의 의미를 가집니다. 숫자 이외의 모든 문자를 뜻하지요 ! "\W", "\S"도 마찬가지로 "\w", "\s"의 반대 의미를 가집니다.

여기에 [] 대괄호가 or의 의미를 가진다고 정규표현식 regular expression 1강(1) 에서 알려드렸습니다. 따라서 [\s\S]는 무엇을 의미할까요? 정반대 두가지를 or로 연결하였으므로 모든 경우의 수를 의미합니다 !

################################################

txt <- "abcd 0123 +-.,!@# ABCD 가나다라"ge_w<-gregexpr("\\W",txt,perl=TRUE)
ge_w
index<-ge_w[[1]]
len<-length(index)
for ( i in 1:len)
{
cat(substr(txt,index[i],index[i]))
}ge_d<-gregexpr("\\D",txt,perl=TRUE)
index<-ge_d[[1]]
len<-length(index)
for ( i in 1:len)
{
cat(substr(txt,index[i],index[i]))
}ge_s<-gregexpr("\\S",txt,perl=TRUE)
index<-ge_s[[1]]
index
len<-length(index)
for ( i in 1:len)
{
cat(substr(txt,index[i],index[i]))
}

 

> txt <- "abcd 0123 +-.,!@# ABCD 가나다라"
>
> ge_w<-gregexpr("\\W",txt,perl=TRUE)
> ge_w
[[1]]
[1] 5 10 11 12 13 14 15 16 17 18 23 24 25 26 27
attr(,"match.length")
[1] 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1> index<-ge_w[[1]]
> len<-length(index)
> for ( i in 1:len)
+ {
+ cat(substr(txt,index[i],index[i]))
+ }
+-.,!@# 가나다라

\W의 경우 영문자, 숫자를 제외한 특수문자와 한글 그리고 복사붙여넣기 과정에서 잘 표현되지 않았지만 공백까지 나타나 있습니다.

> ge_d<-gregexpr("\\D",txt,perl=TRUE)
> index<-ge_d[[1]]
> len<-length(index)
> for ( i in 1:len)
+ {
+ cat(substr(txt,index[i],index[i]))
+ }
abcd +-.,!@# ABCD 가나다라

\D의 경우 숫자를 제외한 모든 문자가 표시되었구요

> ge_s<-gregexpr("\\S",txt,perl=TRUE)
> index<-ge_s[[1]]
> index
[1] 1 2 3 4 6 7 8 9 11 12 13 14 15 16 17 19 20 21 22 24 25 26 27
attr(,"match.length")
[1] 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
> len<-length(index)
> for ( i in 1:len)
+ {
+ cat(substr(txt,index[i],index[i]))
+ }
abcd0123+-.,!@#ABCD가나다라

\S는 공백을 제외한 모든 문자가 표시되었습니다.

 

?

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
공지 초급 R 강의 게시판 이용 관련 공지사항 1 DataMarket 2014.05.21 587149
15 초급 [BigData - R강의 초급] 정규표현식 regular expression 4강 (1) – Anchors "^", "$" 2 DataMarket2 2014.05.23 115717
14 초급 [BigData - R강의 초급] 정규표현식 regular expression 3강 – alternation "|" DataMarket2 2014.05.23 110408
13 초급 [BigData - R강의 초급] 정규표현식 regular expression 2강(4) – 게으른 수량자 "+?", "*?", "{n,}?" 1 DataMarket2 2014.05.23 123227
12 초급 [BigData - R강의 초급] 정규표현식 regular expression 2강(3) – 수량자 "?" 1 DataMarket2 2014.05.23 122740
11 초급 [BigData - R강의 초급] 정규표현식 regular expression 2강(2) – 수량자 {} 1 DataMarket2 2014.05.23 116975
10 초급 [BigData - R강의 초급] 정규표현식 regular expression 2강(1) – 수량자 “+”, “*” DataMarket2 2014.05.23 120240
» 초급 [BigData - R강의 초급] 정규표현식 regular expression 1강(4) – 문자열 형태표현 ".", "\W", "\D", "\S" DataMarket2 2014.05.23 106772
8 초급 [BigData - R강의 초급] 정규표현식 regular expression 1강(3) – 문자열 형태표현 "\p{Hangul}"(한글), 특수문자 2 DataMarket2 2014.05.23 115062
7 초급 [BigData - R강의 초급] 정규표현식 regular expression 1강(2) – 문자열 형태표현 “\d”, “\s” DataMarket2 2014.05.23 105660
6 초급 [BigData - R강의 초급] 정규표현식 regular expression 1강(1) – 문자열 형태표현 ".", "\w" 3 DataMarket2 2014.05.23 127115
5 초급 [BigData - R강의 초급] 따옴표를 문자열로 인식시키려면? - escaper \ DataMarket2 2014.05.23 78891
4 초급 [BigData - R강의 초급] 문자열 패턴 regular expression 연습 DataMarket2 2014.05.23 79938
3 초급 [BigData - R강의 초급] 문자열 검색 – grep, regexpr, gregexpr DataMarket2 2014.05.23 112965
2 초급 [BigData - R강의 초급] 문자열 찾아바꾸기 – sub, gsub 1 DataMarket2 2014.05.23 102252
1 초급 [BigData - R강의 초급] 문자열 나누기 – strsplit, str_split DataMarket2 2014.05.23 118155
Board Pagination ‹ Prev 1 Next ›
/ 1

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소

Designed by sketchbooks.co.kr / sketchbook5 board skin

Sketchbook5, 스케치북5

Sketchbook5, 스케치북5

Sketchbook5, 스케치북5

Sketchbook5, 스케치북5