Professional Documents
Culture Documents
Melnyk Laba6
Melnyk Laba6
ЗВІТ
До лабораторної роботи №6
З дисципліни «Інтелектуальний аналіз даних»
Виконали:
Команда групи ФЛ-35
Микулинська Марта
Мельник Лоліта
Прийняв:
Андруник В.А.
Львів 2021
Мета роботи: набути практичних навичок роботи з дослідницьким факторним
аналізом та аналізом основних компонентів в середовищі Rstudio.
Хід роботи
Тут аналіз головних компонент проводиться для вихідної таблиці даних без
змінної CONT із зазначенням, що повинна бути виділена одна головна компонента
без обертання. Оскільки PCA проводиться на основі кореляційної матриці, перш ніж
вийняти компонент вихідні дані автоматично перетворюються в таку матрицю.
і
2.4. Обчислення значень головних компонент
Дані щодо промірів тіла представляють собою кореляції між цими промірами, але
не було окремих промірів для кожної з 305 дівчат. Коефіцієнти можна отримати за
допомогою наступного програмного коду.
Для того щоб вирішити, скільки чинників витягти, треба скористатись функцією
fa.parallel ():
Рис.29 Діаграма для візуалізації похилого обертання двох факторів для результатів
психологічних тестів з набору даних ability.cov
Рис.31 Результат команди для розрахунку значень двох виділених факторів в консолі
3. Виконати Приклад з методичного посібника для аналізу подібних компонентів
та розвідувального факторного налізу. В якості прикладу використовуються дані про
валовий державний продукт від Латтіна, Керролла та Гріна (2003) (Lattin, Carroll, and
Green). Дані наведені для 50 спостережень (штати США) та 13 категорій (сільське
господарство, гірничодобувна промисловість, торгівля тощо) для валового
державного продукту, вираженого у частках. Завантажуємо датасет з Гугл диску:
pca_gsp.csv.
mydata<- read.csv("C:/pca_gsp.csv")
attach(mydata)
# Define variables
X <- cbind(Ag, Mining, Constr, Manuf, Manuf_nd, Transp, Comm, Energy, TradeW,
TradeR, RE, Services, Govt)
# Descriptive statistics
summary(X)
Рис.32
cor(X)
Рис.33
summary(pca1)
Рис.34
Далі у нас йде графік завантаження, щоб визначити, які змінні мають найбільший
вплив на кожен компонент та завантаження основних компонентів та графік власних
значень для факторного аналізу та аналізу головних компонентів. Діаграма
відображає власні значення в кривій донизу, упорядковуючи значення від
найбільших до найменших.
loadings(pca1)
Рис.35
#pca1$loadings
plot(pca1)
Рис.36
screeplot(pca1, type="line", main="Scree Plot")
Рис.37
biplot(pca1)
Рис.38
# Scores of the components
pca1$scores[1:10,]
Рис.39
# Rotation
varimax(pca1$loadings[,1:3])
Рис.40
promax(pca1$loadings[,1:3])
Рис.41
# Factor analysis
fa1
Рис.42
fa2 <- factanal(X, factor=3, rotation="varimax")
fa2
Рис.43
fa3
Рис.44
fa3$scores
Рис.45
fa4
Рис.46
#install.packages("REdaS")
library(REdaS)
KMOS(X)
bart_spher(X)
Рис.48
Висновок: під час виконання цієї лабораторної роботи, було набуто практичних
навичок роботи з дослідницьким факторним аналізом та аналізом основних
компонентів в середовищі Rstudio. Також ознайомлено з теоретичними відомостями
та лекційним матеріалом, виконано Приклади з посібника "Аналіз та візуалізація
даних в R", для реалізації аналізу подібних компонентів та факторного налізу та
приклад з методичного посібника для аналізу подібних компонентів та
розвідувального факторного налізу на прикладі даних ВВП США (2003 рік).