해보記/R

<記> R 데이터 유형과 데이터 구조

Light Pillar 2019. 11. 20. 23:41

R에서 사용되는 데이터의 유형과 데이터 구조를 살펴보자.

 


 

데이터 유형

 

'mode()' 함수를 이용해 데이터의 유형을 확인할 수 있다. RStudio에서는 Values 창에서도 확인이 가능하다.

콘솔창에서 mode() 함수로 확인하기
Values 창에서 확인하기

  • 수치형(numeric) : 숫자로 이루어진 데이터 유형, 정수형(integer)과 실수형(double)으로 구분
  • 논리형(logic) : 참(TRUE) 또는 거짓(FALSE)의 논리값이나 논리 연산자로 계산된 논리값
  • 문자형(character) : 문자나 문자열
  • 복소수형(complex) : 실수와 허수로 구성된 복소수

다음의 함수들은 반환값으로 데이터의 유형을 확인해 준다. 함수의 데이터형과 같은 데이터면 TRUE값을 반환한다.

is.numeric(x) 수치형 여부 is.integer(x) 정수형 여부 is.double(x) 실수형 여부
is.logical(x) 논리형 여부 is.character(x) 문자형 여부 is.complex(x) 복소수형 여부
is.na(x) NA 여부 is.nan(x) NaN 여부 is.null(x) NULL 여부
is.infinite(x) 무한수치 여부 is.finite(x) 유한수치 여부    

  NA : 결측값 (Not Available; missing value)

  NaN : 수학적으로 정의가 불가능한 수 (Not a Number)

  NULL : 데이터 유형과 자료의 길이도 0인 비어있는 값

 

 

데이터 구조

구분 내용 자료입력함수
벡터(vetor) 하나 이상의 자료 값으로 1차원의 자료 구조 c(), rep(), seq(), sequence() 등
행렬(matrix) 동일한 유형의 자료 값으로 구성된 행과 열의 2차원 자료구조

cbind(), rbind(), matrix() 등

데이터 프레임(data.frame) 변수와 관측치로 구성된 2차원의 자료구조 data.frame()
배열(array) 동일한 유형의 자료 값으로 구성된 2차원 이상의 자료구조 array() 등
리스트(list) 서로 다른 자료 유형으로 구성이 가능하며 자료 객체 중 가장 자유로운 자료구조 list()
요인(factor) 백터 객체 중 범주형 데이터를 원소로 갖는 자료구조 factor(), ordered() 등
시계열(time serise) 시간 등과 같이 일련의 시간 자료를 표현하는 자료구조 ts()