일반화가법모델

  • 사전 지식이나 회귀 진단을 통해 응답변수와 예측변수 사이에 비선형 관계가 있다는 것을 알았다고 하자.
  • 다항 항은 관계를 포착하기에 유연성이 부족할 수 있으며 스플라인 항은 매듭을 어디로 할지 정해줘야 한다.
  • 일반화가법모델(GAM, Generalized Additive Model): 스플라인 회귀를 자동으로 찾는 기술
  • R의 gam 패키지로 주택 데이터에 GAM 모델을 적합하는 방법
    • s(SqFtTotliving) 옵션: 스플라인 항에 대한 ‘최적’ 매듭 점을 찾도록 gam 힘수에 전달
> lm_gam <- gam(AdjSalePrice ~ s(SqFtTotLiving) + SqFtLot + Bathrooms +  Bedrooms + BldgGrade, data=house_98105)
> terms <- predict.gam(lm_gam, type='terms')
> partial_resid <- resid(lm_gam) + terms
> df <- data.frame(SqFtTotLiving = house_98105[, 'SqFtTotLiving'], Terms = terms[, 5], PartialResid = partial_resid[, 5])
> ggplot(df, aes(SqFtTotLiving, PartialResid)) + geom_point(shape=1) + scale_shape(solid = FALSE) + geom_smooth(linetype=2) + geom_line(aes(SqFtTotLiving, Terms)) + theme_bw()
`geom_smooth()` using method = 'loess' and formula 'y ~ x'

'Predictive Analytics' 카테고리의 다른 글

스플라인  (0) 2019.10.01
다항회귀  (0) 2019.09.30
회귀 진단: 가설 검정  (0) 2019.09.27
회귀식 해석  (0) 2019.09.27
회귀에서의 요인변수  (0) 2019.09.27

+ Recent posts