■ R 개요
R은 공개 소프트웨어(Open Source)로 통계/데이터 마이닝, 시각화(Visualization)을 위한 분석 언어입니다. R은 주로 연구용으로 많이 사용되었으나 최근 빅데이터 분석과 관련하여 기업에서 많은 관심을 가지고 사용하려고 하는 추세입니다. 다양한 Package(패키지)를 지원하고 있어 다양한 기능이 제공되고 있어 필요한 대부분의 기능을 쉽게 이용할 수 있습니다.
R이 기존 SPSS, SAS, KXEN 등의 통계분석 또는 데이터마이닝 도구와 다른 차이점은 다음 3가지로 볼 수 있습니다.
1. 최신 통계 분석과 데이터마이닝을 R이라는 분석 플랫폼 하에서 제공
2. 스크립트 언어를 통해 쉽게 자동화 가능
3. 다양한 사용자들에 의해 다수의 예제와 Script가 공유(www.r-blogers.com)
■ R Download 및 설치
R은 공개 소프트웨어로 무료로 다운 받아 설치가 가능합니다. 설치시에는 폴더나 사용자명 등을 임의로 설치하지 말고 기본값(Default)으로 설치하는 것이 좋습니다.
http://cran.r-project.org/bin/windows/base/
■ R Studio 다운로드 및 설치
R Studio는 R을 사용하기 쉽게 GUI 환경을 제공해주는 공개 무료 소프트웨어입니다.
http://www.rstudio.com/ide/download/desktop
■ R 관련 유용한 정보 제공 사이트
R에 관련된 정보를 제공하는 많은 사이트들이 있는데, 우선 다음 사이트가 유용하므로 참조하시면 좋습니다.
■ R에서 메모리 정리하는 법
R을 오래 실행하다 보면, 메모리가 차서 실행이 어려워지는 경우가 있습니다. 이러한 경우 간단하게 스크립트 창에서 gc() 명령을 입력/실행하면 됩니다.
install.packages("sqldf")
library(sqldf)
data(iris)
a<-sqldf("select sepal_Length from iris")
sqldf("select * from iris")
sqldf("select * from iris limit 10")
sqldf("select count(*) from iris where Species like 'Se%'")
참고로, sqldf에서는 "."을 사용하면 오류가 나므로, "sepal.Length"가 아닌 "sepal_Length" 처럼 사용해야 합니다.
■ R에서 한글이 깨질 때 처리법
R-Studio 사용시 한글이 깨지는 경우 처리는 상단 메뉴에서 Tools >> Global Options를 선택하고 다음 화면에서 UTF-8으로 선택하면 됩니다.
인코딩을 변경하고, 해당 창 닫았다 다시 열면 깨어진 한글이 제대로 잘 보입니다.
R에서 한글이 깨질 때 처리법
■ R에서 데이터 파일 불러오기
R에서 csv 파일을 읽기 위해서는 read.table() 또는 read.csv()를 활용하면 됩니다.
1. read.table()
csv 파일에서 첫째줄을 변수명으로 저장하기 위해서는 header=T를 이용하고, 데이터가 ","로 구분되었음을 지정하기 위해서는 sep=","을 옵션을 주면 됩니다.
data <- read.table("job2.csv", header=T, sep=",")
데이터가 제대로 읽혀졌는지를 파악하기 위해서는 다음 명령을 수행하면 됩니다.
data
2. read.csv()
mydata = read.csv("job2.csv")
R에서 T-Test 사용방법 (0) | 2018.01.08 |
---|---|
R을 이용해서 주가 데이터 가져오기: Yahoo Finance 이용 (0) | 2014.03.12 |
R을 이용한 클러스터 분석: iris (0) | 2014.02.06 |
R을 이용한 Visualization: tabplot, googleVis, ggplot2 (0) | 2014.02.05 |
웹 상의 데이터를 자동으로 모으는 소프트웨어 Outwit Hub (0) | 2014.02.02 |