해보記/R

<記> R 함수 - 문자형

Light Pillar 2019. 12. 17. 20:24

문자형 데이터를 다루는데 주로 사용되는 함수

 

toupper( ) : 대문자로 전환

> x <- c("a", "b", "c", "d")
> x <- toupper(x)

tolower( ) : 소문자로 전환

> x <- tolower(x)

nchar( ) : 문자의 길이

> x <- c("apple", "table", "car")
> nchar(x)

strsplit( ) : 문자형 데이터를 정해진 구분자로 분리

> x <- "문자형 데이터를 정해진 구분자로 분리"
> split_x <- strsplit(x, split = " ")

strtrim( ) : 정의된 길이의 문자만을 추출

> x <- c("문자형",  "데이터를",  "정해진",  "구분자로",  "분리")
> strtrim(x, 2)
> strtrim(x, 4)

substr( ) : 문자의 일부분을 선택 혹은 변경

> substr("abdcegf", 1, 3)

paste( ) : 문자의 결합

> paste(x, collapse = " ")

grep( ) : 문자형 데이터 중 정의된 문자를 포함하는 인덱스

> x <- c("korea", "english", "china")
> grep("e", x)

regexpr( ) : 문자형 데이터 중 정의된 문자의 위치를 출력(첫 번째)

> regexpr("e", x)

grepexpr( ) : 문자형 데이터 중 정의된 문자의 위치를 출력(모두)

> gregexpr("e", x)

sub( ) : 문자 중 정의된 내용과 같은 경우 치환(첫 번째)

> sub("e", "E", x)
> sub("g", "G", xx)

gsub( ) : 문자 중 정의된 내용과 같은 경우 치환(모두)

> xx <- c("egg", "google", "guiter")
> gsub("g", "G", xx)