Notice
Recent Posts
Recent Comments
Link
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | |||
| 5 | 6 | 7 | 8 | 9 | 10 | 11 |
| 12 | 13 | 14 | 15 | 16 | 17 | 18 |
| 19 | 20 | 21 | 22 | 23 | 24 | 25 |
| 26 | 27 | 28 | 29 | 30 |
Tags
- MyBatis
- jsp 환경 #환경구축 #웹사이트 구축
- 스프링
- 오라클
- 데이터 마이닝
- mvc 구조
- JSP
- 웹 스프링
- 랜덤포레스트
- 로지스틱
- 페이지 연결
- 영상처리
- 환경구축
- #도커 #도커개념 #도커장단점
- mariadb # mariadb 다운로드
- 스프링 검색
- 환경설정
- qe #qa #qc
- DB
- 장고 # 댓글추가
- 장고
- 머신러닝
- 글쓴이 추가
- 머신러닝 #머신러닝 종류
- 장고 #네비게이션
- 에외처리
- 데이터마이닝
- 하둡
- R 스튜디오
- 데이터 베이스
Archives
- Today
- Total
공부잡동사니
변수선택법(전진,후진,stepwise)이상치 점검 (R) 본문
[변수선택법 전진후진 stepwise]
1.전진 선택법 forward selection
-절편만 있는 모델에서 기준 통계치를 가장 많이개선시키는 변수를 차례로 추가하는 방법
y=x1
y=x1+x2
y=x1+x2+x3
2.후진선택법(backward selection)
-모든 변수가 포함된 모델에서 기준 통계치에 가장 도움이 되지 않는 변수를 하나씩 제거하는 방법
y=x1+x2+x3+x4+x5
y=x1+x2+x3+x4
y=x1+x2+x3
3.단계적 선택법 stepwise selection
-모든 변수가 포함된 모델에서 출발, 기준치에가장 도움이 되지 않는 변수는 삭제,
-변수 중 기준 통계치를 가장 개선시키는 변수를 추가하는 과정을 반복하여 변수를 선택하는 방법
y=x1+x2+x3+x4+x5 #다섯개 설명변수중 x5가 제거 되었다
y=x1+x2+x3+x4 #나머지들중에 가장 변수중요도가 낮은게 x4로 선택되었다
y=x1+x2+x3 #제거된 변수중 추가 변수있는지를 확인한다 이전에 제거한것이 더좋을수 있다
y=x1+x2+x3+x5 #이전에 제거되었던 변수를 다시 추가한다








[이상치 검정]
-항상제거 하지않는다 수정 도 한다
-1.y가 연속형일 경우
-희귀모델 적용후 이상치 검정 수행
-통계적 모델을 통한 유의성 검저 가능 p-value
-outliertest 확인가능



'빅데이터 분석 > 머신러닝' 카테고리의 다른 글
| 교호작용(개념),의사결정나무,교차검증(p) (0) | 2025.04.06 |
|---|---|
| 데이터분석 ,mglearn(시각화 모듈 ),KNN (p) (0) | 2025.04.06 |
| 군집분석(계층적 군집 분석,NBClust,kmeans(비계층적군집분석)(R) (0) | 2025.04.06 |
| 분류(KNN),군집분석(계층적 군집분석)(R) (0) | 2025.04.06 |
| 의사결정 나무 ,랜덤포레스트(R) (0) | 2025.04.06 |