일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 찬물샤워
- 이기적 유전자
- 핵개발
- 티모시페리스
- 아인슈타인
- 인터스텔라
- R 기초
- R 프로그래밍
- 성악설
- 수학적 사고
- 통계 오류
- 최저시급 개정안
- 조던피더슨
- 통계오류
- 선형성
- 산입범위
- t-test
- t검정
- 자기관리
- 동전 던지기
- 비율
- R4DS
- 최저 시급
- 산입 범위
- 멘탈관리
- 큰수의 법칙
- 비선형성
- 비행기 추락
- 유닛테스트
- 핵 개발
- Today
- Total
목록분류 전체보기 (121)
public bigdata

#########2강######## #1-1 숫자패턴 추출하기 import re x = 'My favorite numbers are 19 and 42' y = re.findall('[0-9]+', x) # x 문자열에서 정수 형태의 데이터 모두 추출하여 y에 리스트로 저장해줌 print(y) #1-2 영대문자 일부 매칭 import re x = 'My favorite numbers are 19 and 42' y = re.findall('[AEIOUMy]+', x) print(y) #2-1 탐욕적 방식의 패턴 찾기 # 만약 다음 문장에서 '^F.+:'라는 패턴과 일치하는 부분을 찾는다면, # x = 'From: Using the : character' # From: # From: Using the : # ..

잘 알려주셔서 감사합니다. pc 에서 보는 경우 코드가 길어서 보이지 않는데 (Shift + 마우스 드래그) 조합을 사용하면 쉽게 볼 수 있다. 1강 ## 정규식 간단한 요약 ## # ^ 라인의 처음을 매칭 # $ 라인의 끝을 매칭 # . 임의의 문자를 매칭 (와일드 카드) # \s 공백 문자를 매칭 # \S 공백이 아닌 문자를 매칭 # * 바로 앞선 문자에 적용되고 0 혹은 그 이상의 앞선 문자와 매칭을 표기함. # *? 바로 앞선 문자에 적용되고 0 혹은 그 이상의 앞선 문자와 매칭을 탐욕적이지 않은 방식으로 표기함. # + 바로 앞선 문자에 적용되고 1 혹은 그 이상의 앞선 문자와 매칭을 표기함 # +? 바로 앞선 문자에 적용되고 1 혹은 그 이상의 앞선 문자와 매칭을 탐욕적이지 않은 방식으로 표기..
1. 찬엽님이 작성해 주신 ppt 파일

1. Tip 1) 그래프를 그렸을 때 어떤 데이터가 생성되었는지 알고 싶으면 ggplot_build를 사용하면 데이터를 살펴볼 수 있다. 2) stat_summary, stat_sum 등등 R에는 20개가 넘는 스탯이 있는데, stat_summary는 x축별 y값의 요약(group 인자가 더해지면 같은 x값 내에서 group에 따라 요약치를 달리 구한다. 아래 코드 및 플랏 처럼) data("iris") iris$random ggplot_build(p1)$data [[1]] fill x group y ymin ymax PANEL xmin xmax colour size linetype alpha 1 #00BFC4 1.225 2 3.413043 0 3.413043 1 1.00 1.45 NA 0.5 1 NA ..

1. 나누기, 몫, 나머지 구분 R Python 나누기 /(결과 : 실수) /(결과 : 실수) 몫 %% // 나머지 %/% %

저작권 : "R for DataScience by Hadley Wickham and Garrett Grolemund(O'Reilly). Copyright 2017 Garrett Grolemund, Hadley Wickham, 978-1-491-91039-9 1.1 들어가기 시작하기 전 ggplot2의 이론적 토대에 대해 더 자세히 알고 싶다면 The Layered Grammar of Graphics를 읽을 것을 추천한다. 1.2.3 그래프 작성 템플릿 ggplot(data=)+ (mapping=aes()) ggplot을 하면 좌표 시스템이 생성되고 레이어를 추가할 수 있다. 1.3 library(tidyverse) ggplot(data = mpg)+ geom_point(mapping = aes(x=dis..

> nrow, ncol함수는 행렬의 행과 열을 반환한다.(즉. 매트릭스가 아닌 벡터인 경우에 NULL반환) > NROW, NCOL함수는 행렬, 벡터 모두 행과 열을 반환한다. 벡터의 경우에도 1열인 매트릭스로 인식하여 행과 열을 반환해 준다. > 잠깐 헷갈렸던 것 : 1열인 매트릭스를 생성하면 벡터니까 nrow, ncol사용하면 NULL출력하겠네? 라고 생각하였으나 1열인 매트릭스를 생성하면 그대로 매트릭스이기 때문에 매트릭스의 행과 열을 그대로 반환해 준다. > 나는 일관성을 위해서 NROW, NCOL을 사용해야지 - R 자료형 관련해 헷갈렸던 것들- (참고 : 데이터 사이언스 스쿨) NULL : 데이터가 없는 경우 Logical : 불리언, 참 또는 거짓 Int : 정수 Double : 복소수 Com..
# Multiple plot function # # ggplot objects can be passed in ..., or to plotlist (as a list of ggplot objects) # - cols: Number of columns in layout # - layout: A matrix specifying the layout. If present, 'cols' is ignored. # # If the layout is something like matrix(c(1,2,3,3), nrow=2, byrow=TRUE), # then plot 1 will go in the upper left, 2 will go in the upper right, and # 3 will go all the way..

advanced R 교재를 보고 비표준평가에 대한 내용을 정리한 것이다. 개인적으로 이해하여 정리하고, 이해되지 않는 부분은 날려버렸다. 비표준평가 : 대부분의 프로그래밍 언어에서는 단지 함수의 인자로 값만 부여할 수 있지만 R은 인자에 표현식을 할당하여 함수의 인자로 지정할 수 있다. 인자에 할당할 당시에는 평가(계산 및 실행)하지 않고 함수 내부의 원하는 곳에서 실행하도록 하는 것이다. 이를 비표준평가라고 한다. 13.1 표현식 파악 substitute는 비표준평가를 가능하게 한다. 값이 아니라 해당 값을 계산하기 위한 코드를 찾아준다. substitute는 lexical scoping을 사용한다. 즉. substitute(x)이면 x가 무엇인지 참조한 뒤에 x에 들어있는 표현식을 인용한다. quot..

https://stackoverflow.com/questions/35272457/what-does-the-dplyr-period-character-reference What does the dplyr period character "." reference? What does the period . reference in the following dplyr code?: (df % f(x, .) is equivalent to f(x, y) and z %>% f(x, y, arg = .) is equivalent to f(x, y, arg = z). Using the dot for secondary purposes Often, some attribute or property of lhs is desired i..