일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 비율
- 이기적 유전자
- 동전 던지기
- 핵 개발
- R4DS
- 찬물샤워
- 최저 시급
- 선형성
- 산입범위
- t검정
- 성악설
- 산입 범위
- 유닛테스트
- 수학적 사고
- 아인슈타인
- 인터스텔라
- 조던피더슨
- R 기초
- 비행기 추락
- 티모시페리스
- 자기관리
- 큰수의 법칙
- 최저시급 개정안
- R 프로그래밍
- 통계 오류
- t-test
- 통계오류
- 멘탈관리
- 핵개발
- 비선형성
- Today
- Total
목록R programming (36)
public bigdata
해당 글은 R-blogger 포스트를 보고 개인적으로 정리한 내용이기에 중간중간 내용이 빠져있을 수 있으며 이해하기 어려울 것이다. 궁금하다면 원글을 참고할 것 ※ 병렬 처리는 컴퓨터 cpu의 여러 코어를 사용하여 여러 작업을 동시에 실행하는 것이다. 병렬 처리가 필요한 경우? 계산적으로 무거운 과정 여러 개의 기계 학습 모델을 장착하는 것 일반적으로 3분 이상 걸리는 프로세스가 있는 경우 병렬 프로세싱을 사용하면 좋다 하나의 과제가 있더라도 해당 과제를 작은 조각으로 나누면 병렬 처리의 이점을 얻을 수 있다 ※ R 병렬 프로그래밍에 널리 사용되는 패키지는 parallel, foreach가 있다. 1. 데이터 가져오기 library(tidyverse) # ggplot2, dplyr, tidyr, read..
1. "tidyverse"패키지 설치 error 회사에서 R studio server를 설치해 주었다. "tidyverse"패키지를 설치하려고 하니 다음과 같은 에러가 발생했다. > install.packages("tidyverse") Installing package into ‘/home/dfine/R/x86_64-pc-linux-gnu-library/3.4’ (as ‘lib’ is unspecified) also installing the dependencies ‘curl’, ‘httr’, ‘rvest’, ‘xml2’ URL 'https://cloud.r-project.org/src/contrib/curl_4.2.tar.gz'을 시도합니다 Content type 'application/x-gzip' ..
1. 찬엽님이 작성해 주신 ppt 파일
1. Tip 1) 그래프를 그렸을 때 어떤 데이터가 생성되었는지 알고 싶으면 ggplot_build를 사용하면 데이터를 살펴볼 수 있다. 2) stat_summary, stat_sum 등등 R에는 20개가 넘는 스탯이 있는데, stat_summary는 x축별 y값의 요약(group 인자가 더해지면 같은 x값 내에서 group에 따라 요약치를 달리 구한다. 아래 코드 및 플랏 처럼) data("iris") iris$random ggplot_build(p1)$data [[1]] fill x group y ymin ymax PANEL xmin xmax colour size linetype alpha 1 #00BFC4 1.225 2 3.413043 0 3.413043 1 1.00 1.45 NA 0.5 1 NA ..
저작권 : "R for DataScience by Hadley Wickham and Garrett Grolemund(O'Reilly). Copyright 2017 Garrett Grolemund, Hadley Wickham, 978-1-491-91039-9 1.1 들어가기 시작하기 전 ggplot2의 이론적 토대에 대해 더 자세히 알고 싶다면 The Layered Grammar of Graphics를 읽을 것을 추천한다. 1.2.3 그래프 작성 템플릿 ggplot(data=)+ (mapping=aes()) ggplot을 하면 좌표 시스템이 생성되고 레이어를 추가할 수 있다. 1.3 library(tidyverse) ggplot(data = mpg)+ geom_point(mapping = aes(x=dis..
> nrow, ncol함수는 행렬의 행과 열을 반환한다.(즉. 매트릭스가 아닌 벡터인 경우에 NULL반환) > NROW, NCOL함수는 행렬, 벡터 모두 행과 열을 반환한다. 벡터의 경우에도 1열인 매트릭스로 인식하여 행과 열을 반환해 준다. > 잠깐 헷갈렸던 것 : 1열인 매트릭스를 생성하면 벡터니까 nrow, ncol사용하면 NULL출력하겠네? 라고 생각하였으나 1열인 매트릭스를 생성하면 그대로 매트릭스이기 때문에 매트릭스의 행과 열을 그대로 반환해 준다. > 나는 일관성을 위해서 NROW, NCOL을 사용해야지 - R 자료형 관련해 헷갈렸던 것들- (참고 : 데이터 사이언스 스쿨) NULL : 데이터가 없는 경우 Logical : 불리언, 참 또는 거짓 Int : 정수 Double : 복소수 Com..
# Multiple plot function # # ggplot objects can be passed in ..., or to plotlist (as a list of ggplot objects) # - cols: Number of columns in layout # - layout: A matrix specifying the layout. If present, 'cols' is ignored. # # If the layout is something like matrix(c(1,2,3,3), nrow=2, byrow=TRUE), # then plot 1 will go in the upper left, 2 will go in the upper right, and # 3 will go all the way..
advanced R 교재를 보고 비표준평가에 대한 내용을 정리한 것이다. 개인적으로 이해하여 정리하고, 이해되지 않는 부분은 날려버렸다. 비표준평가 : 대부분의 프로그래밍 언어에서는 단지 함수의 인자로 값만 부여할 수 있지만 R은 인자에 표현식을 할당하여 함수의 인자로 지정할 수 있다. 인자에 할당할 당시에는 평가(계산 및 실행)하지 않고 함수 내부의 원하는 곳에서 실행하도록 하는 것이다. 이를 비표준평가라고 한다. 13.1 표현식 파악 substitute는 비표준평가를 가능하게 한다. 값이 아니라 해당 값을 계산하기 위한 코드를 찾아준다. substitute는 lexical scoping을 사용한다. 즉. substitute(x)이면 x가 무엇인지 참조한 뒤에 x에 들어있는 표현식을 인용한다. quot..
https://stackoverflow.com/questions/35272457/what-does-the-dplyr-period-character-reference What does the dplyr period character "." reference? What does the period . reference in the following dplyr code?: (df % f(x, .) is equivalent to f(x, y) and z %>% f(x, y, arg = .) is equivalent to f(x, y, arg = z). Using the dot for secondary purposes Often, some attribute or property of lhs is desired i..
1. lapply 2. sapply ##########예시############## sapply(cafe24$PC_URL, function(url){ url %>% read_html() %>% html_nodes(xpath = '//*[@property="product:sale_price:amount"]') %>% html_attr('content') }) sapply에서 data로는 vector, list, data.frame이 가능한데, vector가 들어가면 vector의 요소 하나씩 꺼내서 sapply의 function 인자로 들어간다. (아래 참조) min을 min(x)으로 사용하면 벡터 전체에서 최솟값을 찾아주지만 아래처럼 sapply에 벡터가 들어가는 경우에는 벡터의 요소 하나씩 꺼내서 fu..