해보記 37

<記> R Array

배열(Array) 배열(Array)은 행렬을 2차원 이상으로 확장시킨 객체로써 2차원의 구조를 갖는 행렬도 배열의 한 종류이다. 그러나 일반적으로 3차원 이상의 차원을 갖는 데이터 객체를 배열이라 부른다. array( ) 행렬의 속성과 같이 자료의 개수를 나타내는 length, 형태를 보여주는 mode, 각 차원의 벡터의 크기를 나타내는 dim, 그리고 각 차원의 리스트 이름을 나태내는 dimnames로 구성된다. # 배열의 생성 > array(1:6) # 1~6 자료로 1차원 배열 생성 > array(1:6, c(2, 3)) # 1~6 자료로 2차원 배열 생성 > array(1:8, c(2, 2, 2)) # 1~8 자료로 3차원 배열 생성 dim( ) > arr dim(arr) ary1 ary2 ary..

해보記/R 2019.12.03

<記> R Matrix

행렬(Matrix) 행렬(Matrix)은 동일한 형으로 구성된 2차원이 데이터 구조이다. 행의 차원과 열의 차원을 갖는 행렬은 수학에서의 행렬과는 달리 문자형이나 논리형 등을 원소로 사용할 수 있다. 그러나, 행렬의 원소는 한가지 형의 자료로만 구성되어야 한다. matrix( ) # 행렬(matrix)는 여러 변수들이 이차원적으로 모여 있는 개체로, 행렬을 생성하기 위해서는 matrix() 함수를 사용한다. > matrix(1:9, nrow=3) # nrow : 행의 개수 지정 # ncol : 열의 개수 지정, byrow=T : 행 기준 행렬을 생성 > matrix(c(1, 4, 7, 2, 5, 8, 3, 6, 9), byrow=T, ncol=3) 행렬에서의 데이터 추출 > mat mat[1, ] # 행..

해보記/R 2019.12.03

<記> R Vector

앞서 R에서 사용하는 데이터의 유형과 데이터 구조에 대해 간단하게 알아보았다. 2019/11/20 - [해보記/R] - R 데이터 유형과 데이터 구조 벡터(Vector)에 대해서도 간단하게 알아보았다 2019/11/19 - [해보記/R] - R 변수와 벡터 벡터를 비롯한 매트릭스, 배열, 데이터 프레임, 리스트 등에 대해서도 차차 더 알아보기로 하자. 벡터(Vector) 한 개 이상의 원소로 구성된 자료 구조로서 R의 '데이터 셋'(data set) 중에서 가장 기본이 되는 '데이터 셋'이다. 수치형 또는 문자형, 논리형 데이터를 원소(벡터의 원소는 한가지만 가능)로 하는 1차원의 배열 형태를 가진다. c( ) 함수 하나의 벡터에는 다른 형태의 데이터가 원소로 구성될 수 없다. 수치형 벡터는 정수, 실수..

해보記/R 2019.12.02

<記> CentOS 7에 PostgreSQL 12 설치하기

현재 구성하고 있는 서버에는 이미 CentOS를 설치할 때 패키지로 설치된 PostgreSQL이 있다.(솔직히 언제 어떻게 설치했는지 기억이 나질 않는다... ㅡㅡ; 그냥 패키지로 설치되었다 추측하고 있다.) # PostgreSQL 버전 확인 $ /usr/bin/postgres --version 기존에 설치되어 있는 PostgreSQL 9.2.24를 삭제하고 최신 버전의 PostgreSQL(11 이상)을 설치하려 한다. 1. PostgreSQL 9.2.24 삭제하기 먼저 service로 등록되어 실행되고 있는 PostgreSQL을 확인합니다. # 실행 서비스 확인 $ systemctl list-unit-files --type=service 그냥 이렇게 조회하면 너무 많이 나와 계속 스페이스를 눌러야 하죠..

해보記/Server 2019.12.02

<記> R Data Input/Output - 파일에 데이터 저장하기

파일에서 데이터를 가져오는 것에 이어서 파일에 데이터를 저장하는 것도 살펴보자. 데이터 Export 파일에 데이터를 저장하는 방법들 중 wrtite.table, write.csv 함수에 대해서 살펴보자. 우선 Export 하는데 이용할 데이터를 생성하고, 생성된 데이터를 파일로 저장하는 순서로 진행한다. # 샘플데이터 생성 # 난수 생성기의 seed 값 > n DT head(DT) #tail 함수로 DT에 있는 데이터의 뒤 몇개 데이터 조회 > tail(DT) write.csv() # write.csv() 함수로 CSV 파일에 저장하기 # DT의 데이터를 'out_test.csv' 파일에 저장한다. > write.csv(DT, "C:\\R_WD\\out_test.csv", sep=",", row.name..

해보記/R 2019.11.29

<記> R Data Input/Output - 파일에서 데이터 가져오기

R, RStudio를 이용해 데이터를 분석하기 위해서는 먼저 데이터를 R로 가져와야 한다. .csv 형태의 정형 데이터를 읽어서 R의 오브젝트에 입력하거나, 오브젝트의 내용을 .csv 파일로 내보내거나, DB에서 데이터를 읽어 오거나 또는 DB로 데이터를 저장하는 등의 데이터 I/O에 대해서 살펴보자. 데이터 Import 파일에서 데이터를 가져오는 방법은 다양하다. CSV(Comma-Separated Values)는 확장자의 뜻 그대로, 여러가지 필드를 컴마(쉼표 ,)로 구분해 놓은 정형화된 텍스트 데이터 파일이다. 예제 파일은 앞서 산점도에서 사용했던 데이터('hfda_ch09_employees_kr.csv')에서 20건의 데이터만 가져다 새로 생성한 'C:\\R_WD\\io_test.csv' 파일을 ..

해보記/R 2019.11.28

<記> R 데이터 유형과 데이터 구조

R에서 사용되는 데이터의 유형과 데이터 구조를 살펴보자. 데이터 유형 'mode()' 함수를 이용해 데이터의 유형을 확인할 수 있다. RStudio에서는 Values 창에서도 확인이 가능하다. 수치형(numeric) : 숫자로 이루어진 데이터 유형, 정수형(integer)과 실수형(double)으로 구분 논리형(logic) : 참(TRUE) 또는 거짓(FALSE)의 논리값이나 논리 연산자로 계산된 논리값 문자형(character) : 문자나 문자열 복소수형(complex) : 실수와 허수로 구성된 복소수 다음의 함수들은 반환값으로 데이터의 유형을 확인해 준다. 함수의 데이터형과 같은 데이터면 TRUE값을 반환한다. is.numeric(x) 수치형 여부 is.integer(x) 정수형 여부 is.doubl..

해보記/R 2019.11.20

<記> R 변수와 벡터

R을 이용하면서 사용하게 될 변수와 구조체 데이터의 가장 기본이 되는 벡터에 대해서 간략하게 알아보고자 한다. 벡터를 포함한 구조체 데이터(오브젝트)는 별도의 장에서 상세하게 다루기로 하자. 변수의 생성 및 삭제 R에서의 변수 생성은 대입 연산자( # 변수 생성 > x y ls() > x 변수의 데이터 유형이 수치형인 경우는 변수에 대한 기본적인 연산도 가능하다. > # 기본 사칙연산 > x + y > x - y > x * y > x / y 'ls.str()' 함수는 생성된 변수의 목록 뿐만 아니라 각 변수의 유형 및 값 등을 모두 보여준다. > ls.str() # 변수명 : 변수유형 값 변수의 삭제는 'rm()' 함수를 이용한다. 특정 변수를 삭제하고자 한다면 'rm()'함수에 인자 값으로 변수명을 전..

해보記/R 2019.11.19

<記> CentOS 7에 R, RStudio Server 설치하기

Windows에 R, RStudio 설치는 앞서 살펴본 바와 같다. 2019/11/14 - [해보記/R, RStudio] - R 설치부터 R에서 스크립트 실행까지 2019/11/17 - [해보記/R, RStudio] - RStudio 설치하기 및 기본 사용법 - 내친김에 이번엔 CentOS 7에 R과 RStudio를 설치해보려 한다. 0. 준비하기 먼저 EPEL(Extra Packages of Enterprise Linux) repo를 추가하여야 한다. 그래야 리눅스 콘솔에서 'yum' 명령어로 R과 RStudio를 설치할 수 있다. (이미 원격 데스크톱 연결을 위해 XRDP와 VNC 설치에 앞서 추가해 주었기에, 명령어만 확인하기로 하자.) # Root 권한 획득 $su - 암호 : # Reposito..

해보記/Server 2019.11.18

<記> R 패키지 설치 - RStudio 에서

패키지의 설치에 대해서는 앞서 살펴본 바가 있다. 2019/11/16 - [해보記/R] - R 패키지 설치 - RGui 에서 여기서는 RGui에서의 패키지 설치가 아닌 RStudio를 이용한 패키지 설치를 알아보려 한다. 나중에 다른 글에서 쓰게 될 패키지(data.table)를 설치해 보자. RStudio 우측 하단 창에서 'Packages'탭을 선택한다. 'install' 버튼을 클릭한다. 'Install' 버튼을 클릭하면 RStudio 왼쪽의 Console 창에 자동으로 'install.packages("data.table")' 명령어가 입력되고 설치가 진행된다. Packages 탭에서 패키지가 설치된 것을 확인할 수 있다. 설치는 되었지만 아직 로드가 되지 않은 상태 이므로, 해당 패키지를 사용하..

해보記/R 2019.11.18