공부잡동사니

NA치환 ,replace,데이터 프레임 브로드 캐스팅 ,Multi-inde 본문

빅데이터 분석/파이썬

NA치환 ,replace,데이터 프레임 브로드 캐스팅 ,Multi-inde

공부잡상인 2025. 4. 6. 13:38

NA 치환

1.np where 

-1차원 ,2차원 가능 

2.조건 치환 

-직접수정방식은 1차원만 가능 

-loc 매서드는 1차원 boolean 값만 전달 가능 (2차원은 불가능)

3.적용함수의 사용 

-1차원 map 메서드 가능

-2차원 applymap 메서드 가능

4.Na 치환함수 fillna()중요

-1차원 ,2차원 가능 

fillna({'컬럼 1':'값1,'컬럼2':값2}]:dict 형태로 컬럼별 NA 치환값 적용 가능

fillna(method ='ffill'/'bfill')이전 값으로 치환,다음값으로 치환 

 replace 메서드
 1. 문자열 메서드 형태(기본 파이썬 제공)
 - 문자열 치환만 가능
 - 패턴치환 가능
 - 벡터 연산 불가
 - 문자값 이외 old값 사용 불가
 - 문자값 이외 new값 사용 불가


# 2. pandas 값 치환 메서드 형태(pandas 제공)
# - 값 치환, 패턴치환 불가
# - NA(old value) 치환 가능
# - NA로(new value) 치환 가능
# - 벡터 연산 가능


 [브로드캐팅]
 브로드캐스팅 : 서로 다른 크기의 배열, 데이터프레임이 반복 연산되는 개념

1.array에서의 브로드 캐스팅 기능 


 2. DataFrame에서의 브로드캐스팅 기능


# Multi-Index
 - index가 여러 층(level)을 갖는 형태
 - 파이썬 Multi-Index 지원(R에서는 불가)
 - 각 층은 level로 선택 가능(상위레벨(0))

 

1. Multi-Index 생성
     col1  col2
A 상위레벨  a 
  b    3
B 하위레벨 a
  b

'빅데이터 분석 > 파이썬' 카테고리의 다른 글

(un)stack,pivot_table  (0) 2025.04.06
멀티인덱스 (생성,색인,정렬,연산,축변경)  (0) 2025.04.06
DataFrame (연산,메서드 )  (0) 2025.04.05
실습정리,series ,data frame  (0) 2025.04.05
정리  (0) 2025.04.05