공부잡동사니

변수선택법(전진,후진,stepwise)이상치 점검 (R) 본문

빅데이터 분석/머신러닝

변수선택법(전진,후진,stepwise)이상치 점검 (R)

공부잡상인 2025. 4. 6. 23:03

[변수선택법 전진후진 stepwise] 

1.전진 선택법 forward selection 
-절편만 있는 모델에서 기준 통계치를 가장 많이개선시키는 변수를 차례로 추가하는 방법
y=x1
y=x1+x2
y=x1+x2+x3

2.후진선택법(backward selection)
-모든  변수가 포함된 모델에서 기준 통계치에 가장 도움이 되지 않는 변수를 하나씩 제거하는 방법
y=x1+x2+x3+x4+x5
y=x1+x2+x3+x4
y=x1+x2+x3        

3.단계적 선택법 stepwise selection

-모든 변수가 포함된 모델에서 출발, 기준치에가장 도움이 되지 않는 변수는 삭제, 
-변수 중 기준 통계치를 가장 개선시키는 변수를 추가하는 과정을 반복하여 변수를 선택하는 방법
y=x1+x2+x3+x4+x5 #다섯개 설명변수중 x5가 제거 되었다 
y=x1+x2+x3+x4    #나머지들중에 가장 변수중요도가 낮은게 x4로 선택되었다 
y=x1+x2+x3      #제거된 변수중 추가 변수있는지를 확인한다 이전에 제거한것이 더좋을수 있다 
y=x1+x2+x3+x5   #이전에 제거되었던 변수를 다시 추가한다 


[이상치 검정] 
-항상제거 하지않는다 수정 도 한다 
-1.y가 연속형일 경우
-희귀모델 적용후 이상치 검정 수행 
-통계적 모델을 통한 유의성 검저 가능 p-value
-outliertest 확인가능