| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | ||||||
| 2 | 3 | 4 | 5 | 6 | 7 | 8 |
| 9 | 10 | 11 | 12 | 13 | 14 | 15 |
| 16 | 17 | 18 | 19 | 20 | 21 | 22 |
| 23 | 24 | 25 | 26 | 27 | 28 | 29 |
| 30 |
- openai
- javascript
- php
- data structure
- DATAPATH
- CSS
- computer
- Rag
- MIPS
- AI
- Pipelining
- for
- github
- html
- web
- Java
- DS
- architecture
- python
- react
- Class
- Linux
- DB
- function
- control
- mysql
- XML
- Algorithm
- instruction
- system
- Today
- Total
목록R programming (11)
YYYEJI
안녕하세요! 송로지입니다 🌷 Stringr은 문자열을 다룰 때 쓰는 R의 패키지입니다!하나씩 살펴보겠습니다!!! str_trim()문자열 양쪽 끝의 공백(space)를 제거해주는 함수입니다!str_trim(" this is a test ") str_pad()문자열 길이를 7로 맞추되, 부족한 부분을 왼쪽(left)에 "0"으로 채우는 코드입니다!str_pad("24498", width=7, side="left", pad="0") str_detect()각 요소에 "Alice"가 포함되어 있는지 논리값(TRUE/FALSE)로 알려주는 함수입니다!friends str_replace()문자열에서 "Alice"를 "David"로 바꿔주는 코드입니다!!friends 추가로 ~~ tolower(),..
안녕하세요! 송로지입니다 🌷 lubridate 패키지는 날짜/시간을 자동으로 인식해주는 패키지입니다!!복잡한 as.Date() 대신 ymd(), mdy() 같은 함수를 쓸 수 있습니다!! library(lubridate)ymd("2015-08-25")ymd("2015 August 25")mdy("August 25, 2015")hms("13:33:09")ymd_hms("2015/08/25 13.33.09")날짜의 형식이 달라도 알아서 인식해주는 패키지이기 때문에 사용해보시면 좋을 것 같아요~~
안녕하세요! 송로지입니다 🌷 R 언어에서 변수의 타입을 살펴보면,character - "Hello", "123", "A"numeric - 23.44, 120, NaN, Infinteger - 4L, 1123Lfactor - factor("Hello"), factor(8)logical - TRUE, FALSE, NA가 있습니다!! 근데 ........... numeric의 NaN와 logical의 NA는 무슨 차이인가............ 우선 NA은 Not Available의 약자로, 데이터가 존재하지 않음을 의미합니다.!"값이 아예 없다", "모름" 같은 의미입니다 NaN는Not a Number의 약자로,수학적으로 정의되지 않는 값을 의미합니다!0을 0으로 나눌 때 => 이건 숫자가 아니야..
안녕하세요! 송로지입니다 🌷 my_vector 안에 숫자 값을 넣어줬습니다!my_vector order() 함수는 정렬된 인덱스를 반환하고,sort() 함수는 정렬된 값을 반환합니다!! 기본적으로 오름차순이 default 값이고,내림차순으로 하고 싶다면 ???my_vector[order(my_vector, decreasing = TRUE)]# [1] 89 35 23 12 6 4sort(my_vector, decreasing = TRUE)# [1] 89 35 23 12 6 4속성으로 decreasing을 넣어주면 됩니다!!
안녕하세요! 송로지입니다 🌷 R 스튜디오에서 데이터를 읽어오는 함수를 정리해 보겠습니다 ㅎㅎㅎㅎㅎㅎㅎㅎㅎㅎㅎㅎㅎㅎㅎㅎ read.csv()csv 파일은 Comma-Separated Values의 약자로 쉼표로 구분된 데이터들의 모임입니다!data_csv stringsAsFactors = FALSE → 문자형 열을 Factor로 바꾸지 않고 그대로 문자열로 읽는다는 의미입니다.TRUE로 처리하면 문자열을 Factor로 읽어올 수도 있습니다! read.table()확장자가 txt인 text 파일을 불러오는 함수입니다!data 반대로, 쓰는 함수도 존재합니다!write.table(data, "my_table.txt", sep = "\t", row.names = FALSE, sep='\t')
안녕하세요! 송로지입니다 🌷 깔끔한 데이터를 얻기 위해서는 데이터를 살펴본 뒤 데이터를 분석하기 전 깨끗한 데이터로 변환해야 됩니다! 데이터를 불러오고, 원시 데이터를 탐색합니다.* 구조 확인: class(), dim(), names(), str(), glimpse(), summary()데이터 확인: head(), tail()시각화: hist(), polt()데이터를 정제할 때는 오류/결측치/중복을 제거하게 됩니다. 데이터 정리는 아래와 같습니다.원칙: 행=관측 값, 열 = 변수, 테이블 = 관측 단위입니다. Messy Data의 특징을 살펴보면,* 열 이름이 값일 때* 변수들이 행과 열에 동시에 있을 때* 여러 변수가 한 열에 있을 때* 다른 단위가 한 테이블에 섞여 있을 때 입니다!!!!! ..
안녕하세요! 송로지입니다 🌷 R 언어에 있는 함수에 대해서 알아보아요 !! Split(df, split_var ... )Split(벡터/리스트/데이터프레임 등, 그룹 기준(factor나 범주형 변수) ...) split함수는 split_var을 기준으로 데이터를 그룹별 리스트로 나눠줍니다!split(mtcars, mtcars$cyl) subset(df, condition, select=)subset(데이터프레임, 조건식(TRUE/FALSE), 특정 열만 선택 가능) 이 함수는 조건에 만족하는 행만 반환합니다!subset(mtcars, mpg>25) merge(x, y, all=FALSE)merge(데이터1, 데이터 2, FALSE(내부조인, 공통된 값만 추출), TRUE(외부조인, 모든 값 포..
안녕하세요! 송로지입니다 🌷 R 언어에서 sample() 함수는 데이터에서 무작위로 표본을 뽑는 함수라고 합니다!!sample(x, size, replace=FALSE, prob=NULL)sample(대상, 개수, 복원 추출 여부, 각 원소가 선택될 확률)본원 추출 여부는 TRUE이면, 중복 허용본원 추출 여부가 FALSE이면, 중복이 불가능하다는 의미입니다! 함수를 사용해 보면 이렇습니다!x Women 데이터는 R에 이미 내장되어 있는 데이터입니당women_shuffle 원래 women 데이터 프래임의 행 순서를 무작위로 바꿔서, women_shuffle에 저장하게 되는 코드입니다! 감사합니다!