다변량자료분석 예제 정리 및 코드 정리
14개의 feature를 갖는 329개의 지역 데이터, PCA를 통해 차원 축소하기
기존 14개 feature 중 9개의 feature(CaseNum, Long, Lat, Pop, stNum 제외)를 이용하여 PCA 진행.
place_pca = prcomp(x = log(dat[,1:9])) #PCA 수행을 위해 저장 및 plot 그리기
screeplot(place_pca,npcs = 9,type = "lines")
PC1을 기준으로 Arts, HlthCare이 비교적 중요한 변수라고 할 수 있고, PC2 입장에서는 HlthCare가 중요한 변수라고 말할 수 있다.
Diabetes data 이용하여 clustering 분석 해보기
Hierarchical clustering, K-means clustering, Mixture model based clustering을 각각 실행하고 비교한다.
iris data 이용하여 logistic regression으로 추정 해보기
단, 두 그룹만 존재(Setosa,Versicolor)
data = data[(data$Species == "setosa") | (data$Species == "versicolor"), ]
행렬화를 이용하여 S(variance-covariance), eigenvalue, eigenvector