다항 로지스틱 회귀분석 예제

범주형 응답에는 2개의 가능한 결과가 있습니다. 예: 스팸 또는 하지 예 3. 고등학생에 입학하면 일반 프로그램, 직업 프로그램 및 학업 프로그램 중에서 프로그램을 선택할 수 있습니다. 그들의 선택은 그들의 쓰기 점수와 사회적 경제 상태를 사용하여 모델링 될 수 있습니다. 실시예 2. 생물학자는 악어가 만드는 음식 선택에 관심이있을 수 있습니다. 성인 악어는 어린 악어와 다른 환경 설정을 가질 수 있습니다. 여기서 결과 변수는 식품 유형이며 예측 변수는 악어 및 기타 환경 변수의 크기일 수 있습니다. 이 기계 학습 시리즈에서는 선형 회귀, 다항식 회귀를 다루었으며 보스턴 하우징 데이터 집합에서 이 두 모델을 모두 구현했습니다. 지금까지, 우리는 다항식 회귀 뒤에 이론의 대부분을 다루었습니다. 이제 이전 블로그에서 분석한 보스턴 하우징 데이터 집합에서 이러한 개념을 구현해 보겠습니다. 주문하지 않고 세 개 이상의 범주.

예: 어떤 음식이 더 선호되는지 예측(채식, 비채식, 비건) 로지스틱 회귀는 회귀 계수(즉, 매개 변수)의 선형 함수로서 “1” 또는 “성공” 응답의 로그 배당률을 모델화하지만 로그 배당률이 예측 변수의 선형 함수입니다. 원래 피처를 특정 도의 다항식 피쳐로 변환한 다음 선형 회귀를 적용하는 함수를 정의해 보겠습니다. 아래에서는 nnet 패키지의 다중 놈 함수를 사용하여 다항 로지스틱 회귀 모델을 추정합니다. 다항 회귀가 가능한 다른 R 패키지에는 다른 기능이 있습니다. mlogit 패키지처럼 데이터의 모양을 변경하고 Hilbe의 로지스틱 회귀 모델에 있는 예제 코드를 미러백할 필요가 없기 때문에 다놈 함수를 선택했습니다. 원래 기능을 더 높은 순서로 변환하려면 scikit-learn에서 제공하는 PolynomialFeatures 클래스를 사용합니다. 다음으로 선형 회귀를 사용하여 모델을 학습합니다. 실시예 1. 사람들의 직업 선택은 부모의 직업과 자신의 교육 수준에 의해 영향을받을 수 있습니다. 우리는 교육 수준과 아버지의 직업과 자신의 직업 선택의 관계를 연구 할 수 있습니다. 직업 선택은 직업의 범주로 구성된 결과 변수가 될 것입니다.

Share on FacebookPin on PinterestTweet about this on TwitterShare on TumblrShare on Google+Digg this