R에서 사용되는 데이터의 유형과 데이터 구조를 살펴보자.
데이터 유형
'mode()' 함수를 이용해 데이터의 유형을 확인할 수 있다. RStudio에서는 Values 창에서도 확인이 가능하다.
- 수치형(numeric) : 숫자로 이루어진 데이터 유형, 정수형(integer)과 실수형(double)으로 구분
- 논리형(logic) : 참(TRUE) 또는 거짓(FALSE)의 논리값이나 논리 연산자로 계산된 논리값
- 문자형(character) : 문자나 문자열
- 복소수형(complex) : 실수와 허수로 구성된 복소수
다음의 함수들은 반환값으로 데이터의 유형을 확인해 준다. 함수의 데이터형과 같은 데이터면 TRUE값을 반환한다.
is.numeric(x) | 수치형 여부 | is.integer(x) | 정수형 여부 | is.double(x) | 실수형 여부 |
is.logical(x) | 논리형 여부 | is.character(x) | 문자형 여부 | is.complex(x) | 복소수형 여부 |
is.na(x) | NA 여부 | is.nan(x) | NaN 여부 | is.null(x) | NULL 여부 |
is.infinite(x) | 무한수치 여부 | is.finite(x) | 유한수치 여부 |
NA : 결측값 (Not Available; missing value)
NaN : 수학적으로 정의가 불가능한 수 (Not a Number)
NULL : 데이터 유형과 자료의 길이도 0인 비어있는 값
데이터 구조
구분 | 내용 | 자료입력함수 |
벡터(vetor) | 하나 이상의 자료 값으로 1차원의 자료 구조 | c(), rep(), seq(), sequence() 등 |
행렬(matrix) | 동일한 유형의 자료 값으로 구성된 행과 열의 2차원 자료구조 |
cbind(), rbind(), matrix() 등 |
데이터 프레임(data.frame) | 변수와 관측치로 구성된 2차원의 자료구조 | data.frame() |
배열(array) | 동일한 유형의 자료 값으로 구성된 2차원 이상의 자료구조 | array() 등 |
리스트(list) | 서로 다른 자료 유형으로 구성이 가능하며 자료 객체 중 가장 자유로운 자료구조 | list() |
요인(factor) | 백터 객체 중 범주형 데이터를 원소로 갖는 자료구조 | factor(), ordered() 등 |
시계열(time serise) | 시간 등과 같이 일련의 시간 자료를 표현하는 자료구조 | ts() |
'해보記 > R' 카테고리의 다른 글
<記> R Data Input/Output - 파일에 데이터 저장하기 (0) | 2019.11.29 |
---|---|
<記> R Data Input/Output - 파일에서 데이터 가져오기 (0) | 2019.11.28 |
<記> R 변수와 벡터 (1) | 2019.11.19 |
<記> R 패키지 설치 - RStudio 에서 (0) | 2019.11.18 |
<記> RStudio 설치하기 및 기본 사용법 - 내친김에 (0) | 2019.11.17 |