공부잡동사니

DataFrame (연산,메서드 ) 본문

빅데이터 분석/파이썬

DataFrame (연산,메서드 )

공부잡상인 2025. 4. 5. 23:26

python 의 색인 방법 

1.기본색인 R과 유사 : [ROW INDEX, COLUMN INDEX]

2.numpy 의 리스트 색인 :[[ROW INDEX],[ COLUMN INDEX]]=[np.ix_([row index],[column index])]

3.pandas 의 리스트 색인 :[ROW INDEX],[ COLUMN INDEX] 불가 

->df.iloc[row index,colunmn index ] 위치기반 

->df.loc[row name,column name]이름 기반 (조건 가능 )

 

pandas 에서 의 in 연사자 :isin 메서드 중요

df1['name']in ['mango' ,'cherry'] -시리즈에 대해 in 연산자 처리 불가능 

df1['name'][0] in ['mango' ,'cherry'] -스칼라에 대해 in 연산자 처리가능 

df1['name']isin (['mango' ,'cherry']) -시리즈에 대해 isin 메서드 가능 

 

참고- 슬라이스 색인 형태 

n:m->(m-1)까지 추출 (마지막 범위 미포함 )  <=>숫자 슬라이스 

name1:name2=> name1에서 name2 까지 추출 범위 포함 <=> 문자 슬라이스  

 

[DataFrame]

index(행)와 column(컬럼)으로 구성 

key(column )-value 구조 

 

1.생성

data frame (dict(or array),index =,columns=)

2.색인

df.loc :이름 색인

df.lioc :위치 섹인 

drop 메서드

3.기본메서드 

4.indexx 수정

5.구조 수정 

6.산술연산

#같은 index 같은 column 끼리 매칭 시켜 연산처리
#매칭되지 않는 index의 연산 끼리 결과는 Na
#산술연산 메서드 add,sub,mul,div 는 NA로 리턴 되는 현상 방지
#더하기 곱하기 나누기 빼기 

#[참고 df1+df2 처리방식 ] 

[참고 numpy 와 pandas 의 산술연산 메서드 비교 ]

7.정렬

8.reindex