public bigdata

R4DS (R FOR DATASCIENCE) 6장 본문

R programming/R4DS (R for DataScience)

R4DS (R FOR DATASCIENCE) 6장

public bigdata 2019. 12. 23. 22:51

6장 워크플로: 프로젝트

 

 

6.2 분석작업이 어디에 남아있는가?

  • 권장하지는 않지만 R 내에서 setwd를 통해 작업 디렉터리를 설정할 수도 있다.

6.3 경로와 디렉터리

 

1) 경로에는 2가지의 기본 스타일 mac/linux, window가 존재하므로 경로와 디렉터리는 약간 복잡하다. 서로 다른 세 가지 주요 방식이 있다.

가장 중요한 차이점은 경로의 구성요소를 분리하는 방법이다.

  • mac/linux : "plots/diamonds.pdf"
  • window : "plots\diamonds.pdf"

R은 현재의 플랫폼과 상관없이 2개의 타입 모두 동작하지만, 역슬래시는 R에서 특별한 의미가 있으므로 경로에 2개의 역슬래시를 사용해야 한다. 때문에 슬래시 하나만 사용하는 linux/mac 스타일을 사용하는 것이 좋다.

 

2) 절대 경로(즉. 작업 디렉터리와 관계없이 같은 위치를 가리키는 경로)의 표현이 다르다

  • window : "c:\servername" or "c\\servername"
  • mac/linux : "/users/hadley"

절대경로는 공유가 불가하므로 절대로 스크립트에서 사용해서는 안된다.

3) 마지막으로 사소한 차이점은 ~(물결표)가 가리키는 위치이다. ~는 홈 디렉터리로 가는 편리한 방법이다. window는 홈 디렉터리 개념을 가지고 있지 않으므로 windows에서는 홈 디렉터리 대신 문서 디렉터리를 가리킨다.

 

6.5 요약

  • 각 데이터 분석 프로젝트에 대해 Rstudio 프로젝트를 만든다.
  • 8장에서는 데이터를 불러오려는 위치에 데이터 파일을 보관한다
  • 스크립트도 같은 곳에 보관한다(스크립트를 편집하고 줄 단위 또는 전체 단위로 실행한다)
  • 결과물(플롯 또는 정제된 데이터)도 같은 곳에 저장한다.
  • 상대 경로만 사용하고 절대 경로는 사용하지 않는다.

의문점 : 상대 경로만 사용한다고 절대 경로에 비해서 좋은 점이 무엇인지... 상대 경로를 사용해도 폴더명이나. 다른 사람의 컴퓨터에서 실행했을 때 디렉터리가 변경되는 것은 똑같은게 아닌지. 프로젝트와 상대경로를 함께 사용하면 디렉토리에 소스코드가 영향을 받지 않아 정상작동할 것 같다. 프로젝트 단위로 공유하면 프로젝트 실행 시 프로젝트가 위치한 장소가 디렉터리로 지정되니까. ./ㅁㄴㅇㅁㄴㅇ/ㅁㅇㄴㅁㅇ 이렇게 계속 이어지면 ./(현재 프로젝트가 위치함으로서 지정된 디렉터리)를 활용할 수 있을 것으로 보인다.