상세 컨텐츠

본문 제목

R과 R Studio 설치 및 관련 정보

프로그래밍/Big Data

by 삶의 재발견 2014. 1. 29. 16:32

본문

반응형

■ R 개요


R은 공개 소프트웨어(Open Source)로 통계/데이터 마이닝, 시각화(Visualization)을 위한 분석 언어입니다. R은 주로 연구용으로 많이 사용되었으나 최근 빅데이터 분석과 관련하여 기업에서 많은 관심을 가지고 사용하려고 하는 추세입니다. 다양한 Package(패키지)를 지원하고 있어 다양한 기능이 제공되고 있어 필요한 대부분의 기능을 쉽게 이용할 수 있습니다.


R이 기존 SPSS, SAS, KXEN 등의 통계분석 또는 데이터마이닝 도구와 다른 차이점은 다음 3가지로 볼 수 있습니다.


1. 최신 통계 분석과 데이터마이닝을 R이라는 분석 플랫폼 하에서 제공

2. 스크립트 언어를 통해 쉽게 자동화 가능

3. 다양한 사용자들에 의해 다수의 예제와 Script가 공유(www.r-blogers.com)


■ R Download 및 설치


R은 공개 소프트웨어로 무료로 다운 받아 설치가 가능합니다.  설치시에는 폴더나 사용자명 등을 임의로 설치하지 말고 기본값(Default)으로 설치하는 것이 좋습니다.


http://cran.r-project.org/bin/windows/base/


R Download 및 설치


■ R Studio 다운로드 및 설치


R Studio는 R을 사용하기 쉽게 GUI 환경을 제공해주는 공개 무료 소프트웨어입니다.


http://www.rstudio.com/ide/download/desktop 


R Studio 다운로드 및 설치



■ R 관련 유용한 정보 제공 사이트


R에 관련된 정보를 제공하는 많은 사이트들이 있는데, 우선 다음 사이트가 유용하므로 참조하시면 좋습니다.


R을 이용한 데이터 마이닝에 필요한 패키지와 기법들의 연관성


데이터 마이닝에 필요한 R 패키지와 기법들



■ R에서 메모리 정리하는 법


R을 오래 실행하다 보면, 메모리가 차서 실행이 어려워지는 경우가 있습니다. 이러한 경우 간단하게 스크립트 창에서 gc() 명령을 입력/실행하면 됩니다.


R에서 메모리 정리하는 법


■ R에서 SQL 사용하기

R에 있는 데이터를 SQL문을 활용해서 관리(변경/처리)할 수 있습니다. SQL에 익숙하신 분들에게는 아주 편리한 기능으로 다음과 같이 상용하시면 됩니다.

install.packages("sqldf")

library(sqldf)

data(iris)


a<-sqldf("select sepal_Length from iris")


sqldf("select * from iris")

sqldf("select * from iris limit 10")

sqldf("select count(*) from iris where Species like 'Se%'")


참고로, sqldf에서는 "."을 사용하면 오류가 나므로, "sepal.Length"가 아닌 "sepal_Length" 처럼 사용해야 합니다.



■ R에서 한글이 깨질 때 처리법


R-Studio 사용시 한글이 깨지는 경우 처리는 상단 메뉴에서 Tools >> Global Options를 선택하고 다음 화면에서 UTF-8으로 선택하면 됩니다.

인코딩을 변경하고, 해당 창 닫았다 다시 열면 깨어진 한글이 제대로 잘 보입니다.


R UTF-8R에서 한글이 깨질 때 처리법



■ R에서 데이터 파일 불러오기


R에서 csv 파일을 읽기 위해서는 read.table() 또는 read.csv()를 활용하면 됩니다.


1. read.table() 


csv 파일에서 첫째줄을 변수명으로 저장하기 위해서는 header=T를 이용하고, 데이터가 ","로 구분되었음을 지정하기 위해서는  sep=","을 옵션을 주면 됩니다.


data <- read.table("job2.csv", header=T, sep=",")


데이터가 제대로 읽혀졌는지를 파악하기 위해서는  다음 명령을 수행하면 됩니다.


data


2. read.csv() 


mydata = read.csv("job2.csv") 

반응형

관련글 더보기