공부잡동사니

dplyr 패키지(select ,mutate,filter ...)which.min,which.max 본문

빅데이터 분석/R프로그래밍

dplyr 패키지(select ,mutate,filter ...)which.min,which.max

공부잡상인 2025. 4. 5. 18:33

# doBy     : ~by (order, sample) 상위
# plyr     : apply 계열 함수(적용함수) 상위 
# reshape2 : stack/unstack 상위
# dplyr    : 구조화된 R 문법 제공(sql처럼)

install.packages('dplyr')
library(dplyr)

# dplyr의 구조화된 문법
# 1. select : 컬럼의 선택
# 2. mudate : 컬럼 가공
# 3. filter : 행 선택
# 4. group_by : 그룹연산
# 5. arrange : 정렬
# 6. summarise_each : 그룹연산의 실제 연산 조건

# 주의 : 문법적 순서에 따른 파싱 가능 여부(컬럼 정의 순서 달라짐)
emp %>%                     
  select(ENAME, EMPNO) %>%   # ENAME, EMPNO만 다음 라인으로 전달
  mutate(new_sal=SAL*1.1)    # mutate에서는 SAL을 알 수 없음

순차적으로 진행되기 때문에 sal 선택 안할시 밑에서 불러올수 없다 

select 절에서 ENAME,EMPON 만 다른 라인에 전달 


emp %>%
  mutate(new_sal=SAL*1.1) %>%
  select(ENAME, EMPNO, new_sal) 
   전체를 불러온후 new_sal 만들고 밑으로 전달하기 때문에 가능하다 

which .min ,  which.max

최소값 ,최대값 의 위치를 리턴

리턴받는 위치값으로 최소값 최대값 찾을수 있다