public bigdata

[R base] 2 본문

R programming/R base

[R base] 2

public bigdata 2019. 10. 29. 20:37

<R 산술 연산자>

<nrow(), ncol() vs NROW(), NCOL() 차이점>

> nrow, ncol함수는 행렬의 행과 열을 반환한다.(즉. 매트릭스가 아닌 벡터인 경우에  NULL반환)

> NROW, NCOL함수는 행렬, 벡터 모두 행과 열을 반환한다. 벡터의 경우에도 1열인 매트릭스로 인식하여 행과 열을 반환해 준다.

> 잠깐 헷갈렸던 것 : 1열인 매트릭스를 생성하면 벡터니까 nrow, ncol사용하면 NULL출력하겠네? 라고 생각하였으나 1열인 매트릭스를 생성하면 그대로 매트릭스이기 때문에 매트릭스의 행과 열을 그대로 반환해 준다.

> 나는 일관성을 위해서 NROW, NCOL을 사용해야지

 

<R 자료형>

- R 자료형 관련해 헷갈렸던 것들-

(참고 : 데이터 사이언스 스쿨)

  • NULL : 데이터가 없는 경우

  • Logical : 불리언, 참 또는 거짓

  • Int : 정수

  • Double : 복소수

  • Complex : 문자열

  • Character : 리스트

  • List : 리스트

  • Closure : 함수

> typeof() 함수를 통해서 자료형을 알아볼 수 있다.

> 클래스와 자료형은 다르다 (R에서 클래스는 변수가 가지는 속성의 하나이다)

  • 부동소수점 실수의 자료형은 double이지만 클래스는 numeric이다.

  • 함수의 자료형은 closure이지만 클래스는 function이다.

  • matrix, data.frame등의 클래스 객체나 사용자 정의 클래스의 자료형은 list이다.

<R code 단순형, 유지형>

R에는 단순형, 유지형이 존재한다. 단순형은 현재의 데이터 타입을 유지할 필요가 없는 경우(데이터 프레임에서 하나의 열만 선택한 경우 ex. data.frame[[1]]) 자동적으로 데이터 타입을 단순화 한다. 보통 리스트, 어레이, 팩터, 리스트

 

<R data type 판별 함수>

<chracter, factor summary 함수 적용 차이>

> summary(survey_vector)
   Length     Class      Mode 
        5 character character
> 
> # Generate summary for factor_survey_vector
> summary(factor_survey_vector)
Female   Male 
     2      3

<ordered factor 요소간 비교가 가능하다>

# Create factor_speed_vector
speed_vector <- c("medium", "slow", "slow", "medium", "fast")
factor_speed_vector <- factor(speed_vector, ordered = TRUE, levels = c("slow", "medium", "fast"))

# Factor value for second data analyst
da2 <- factor_speed_vector[[2]]

# Factor value for fifth data analyst
da5 <-factor_speed_vector[[5]]

# Is data analyst 2 faster than data analyst 5?
da2 < da5
factor_speed_vector
 

'R programming > R base' 카테고리의 다른 글

비표준평가 on base R  (0) 2022.01.06
[R base] 1  (0) 2018.04.29