lexxai / goit_python_ds_hw_06

Модуль 6. Навчання без вчителя.  Кластерізація. KMeans. Principal Component Analysis

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Модуль 6. Навчання без вчителя.

З циклу домашніх завдань Python Data Science.

Домашнє завдання

Завдання, що пропонуються, необхідно оформити у вигляді одного jupyter ноутбука.

Завдання 1

У цьому завданні вам потрібно завантажити ось цей датасет. Тут ви знайдете 2 файли - з двовимірним датасетом та датасетом mnist. Для кожного з них застосуйте алгоритм K-means для кластеризації. Щоб знайти оптимальну кількість кластерів, скористайтесь ліктевим методом.

Завдання 2

Візуалізуйте результат роботи кластеризації. Для випадку з mnist датасетом, вам потрібно ще скористатись алгоримтом PCA щоб зменшити розмірність вашим даних до 2-вимірного варіанту.

Результат

Завдання 1

Резульат розбитя на кластери зорбражень з бази MNIST

784 ознак, k=19

PCA (0.95), 114 ознак, k=13

Завдання 2

About

Модуль 6. Навчання без вчителя.  Кластерізація. KMeans. Principal Component Analysis

License:MIT License


Languages

Language:Jupyter Notebook 100.0%