흐르는 시간 속에서

고정 헤더 영역

글 제목

메뉴 레이어

흐르는 시간 속에서

메뉴 리스트

  • 홈
  • 태그
  • 미디어로그
  • 위치로그
  • 방명록
  • 분류 전체보기 (308)
    • Mobile & Web Business (15)
    • IT Issues (27)
    • Problem Solving (11)
    • 프로그래밍 (26)
      • 스크래치 (9)
      • Server (6)
      • Big Data (10)
    • Living (37)
    • Blogging (9)
    • 미국[USA] (166)
      • New Jersey (34)
      • NJ Shopping (6)
      • Road Trip USA (88)
      • Acadia National Park (6)
      • Florida (11)
      • New York (10)
      • Pennsylvania,Virginia, & Wa.. (9)
      • Massachusetts, Rhode Island.. (2)
    • 캐나다[Canada] (13)
    • 동남아시아[East South Asia] (2)

검색 레이어

흐르는 시간 속에서

검색 영역

컨텐츠 검색

R

  • R에서 일원배치분산분석(One-Way ANOVA)

    2018.01.18 by 삶의 재발견

  • R에서 T-Test 반복수행과 통계표 작성

    2018.01.12 by 삶의 재발견

  • R에서 T-Test 사용방법

    2018.01.08 by 삶의 재발견

  • R과 R Studio 설치 및 관련 정보

    2014.01.29 by 삶의 재발견

R에서 일원배치분산분석(One-Way ANOVA)

일원배치 분산분석(One-Way ANOVA)을 수행할 때 주의해야 할 사항은 다음 3가지 입니다. 1. 독립성: 독립변수의 그룹군은 상호 독립적이어야 함2. 정규성: 독립변수에 대한 종속변수는 정규분포를 만족해야 함3. 등분산성: 독립변수에 대한 종속변수의 분산은 각 군마다 동일해야 함 따라서 R을 이용한 One-Way ANOVA에서도 위의 가정을 확인 후 진행을 해야 합니다. iris 데이터에서 Species별 Sepal.Width에 대한 분석을 예로들어 진행하면 다음과 같습니다. 1. 먼저 정규성 검증을 위해서는 Shapiro-Wilk를 수행합니다. > tapply(iris$Sepal.Width, iris$Species, shapiro.test) $setosa Shapiro-Wilk normality..

프로그래밍/Big Data 2018. 1. 18. 11:48

R에서 T-Test 반복수행과 통계표 작성

R에서 T-Test를 여러 변수에 대해 수행하는 경우 다음과 같은 방법으로 하면 됩니다. 1. iris에서 2개의 그룹만 추출 > df_data % filter(Species %in% c("setosa","versicolor" )) 2. 모든 대상 변수(컬럼) 추출 # 모든 컬럼명 추출 후 분류가 되는 Species는 제외> t.cols t.cols lapply(df_data[,t.cols], function(x) t.test(x ~ df_data$Species, var.equal = TRUE)) "Sepal.Length" "Sepal.Width" "Petal.Length" "Petal.Width"에 대해서 각각의 T-Test 결과가 표시됩니다. 4. 문제점 위의 방법의 문제점은 분산 동질성 결과를 고려..

프로그래밍/Big Data 2018. 1. 12. 09:05

R에서 T-Test 사용방법

R에서 T-Test를 하는 방법은 다음과 같이 간단합니다. 우선 iris를 사용하면 다음과 같습니다. 1. iris에서 2개의 그룹만 추출 > df_data % filter(Species %in% c("setosa","versicolor" )) T-Test는 두 집단의 평균차이를 검정하는 것이므로 iris데이터에서 두개의 집단인 setosa와 versicolor만 추출합니다. 2, 분산동질성 검증 > var.test(Sepal.Length ~ Species, data = df_data) F test to compare two variances data: Sepal.Length by SpeciesF = 0.46634, num df = 49, denom df = 49, p-value = 0.008657alt..

프로그래밍/Big Data 2018. 1. 8. 13:29

R과 R Studio 설치 및 관련 정보

■ R 개요 R은 공개 소프트웨어(Open Source)로 통계/데이터 마이닝, 시각화(Visualization)을 위한 분석 언어입니다. R은 주로 연구용으로 많이 사용되었으나 최근 빅데이터 분석과 관련하여 기업에서 많은 관심을 가지고 사용하려고 하는 추세입니다. 다양한 Package(패키지)를 지원하고 있어 다양한 기능이 제공되고 있어 필요한 대부분의 기능을 쉽게 이용할 수 있습니다. R이 기존 SPSS, SAS, KXEN 등의 통계분석 또는 데이터마이닝 도구와 다른 차이점은 다음 3가지로 볼 수 있습니다. 1. 최신 통계 분석과 데이터마이닝을 R이라는 분석 플랫폼 하에서 제공2. 스크립트 언어를 통해 쉽게 자동화 가능3. 다양한 사용자들에 의해 다수의 예제와 Script가 공유(www.r-bloge..

프로그래밍/Big Data 2014. 1. 29. 16:32

추가 정보

인기글

최신글

페이징

이전
1
다음
TISTORY
흐르는 시간 속에서 © Magazine Lab
페이스북 트위터 인스타그램 유투브 메일

티스토리툴바