Project Machine Learning with Python from DQLab
Terdapat 2 dasar tipe sistem rekomendasi:
- Sistem Rekomendasi Sederhana
- Sistem Rekomendasi Berdasarkan Konten dari Fiturnya
Sistem Rekomendasi Sederhana, seperti namanya adalah sistem rekomendasi yang hanya menggunakan urutan sebagai dasar perhitungannya, yang biasanya digunakan dalam '5 film terbaik' kita akan menggunakan urutan berdasarkan mungkin vote terbanyak, rating tertinggi, penjualan film paling tinggi, atau apapun yang lain. Dalam kasus ini, kita akan menggunakan kombinasi antara rata-rata rating, jumlah vote, dan membentuk metric baru dari metric yang sudah ada, kemudian kita akan melakukan sorting untuk metric ini dari yang tertinggi ke terendah.
Simple Recommender Engine menawarkan rekomendasi yang umum untuk semua user berdasarkan popularitas film dan terkadang genre.
Ide awal di balik sistem rekomendasi ini adalah sebagai berikut.
- Film-film yang lebih populer akan memiliki kemungkinan yang lebih besar untuk disukai juga oleh rata-rata penonton.
- Model ini tidak memberikan rekomendasi yang personal untuk setiap tipe user.
- Implementasi model ini pun juga bisa dibilang cukup mudah, yang perlu kita lakukan hanyalah mengurutkan film-film tersebut berdasarkan rating dan popularitas dan menunjukkan film teratas dari list film tersebut. Sebagai tambahan, kita dapat menambahkan genre untuk mendapatkan film teratas untuk genre spesifik tersebut.
Formula dari IMDB dengan Weighted Rating
Task 1 - Library Import and File Unloading
Pekerjaan pertama yang harus dilakukan adalah melakukan import library dan membaca dataset yang akan digunakan dalam project ini
Task 2 - Cleaning table movie
Sebelum mengolah data lebih lanjut untuk membuat sistem rekomendasi, kita harus melakukan cleaning pada data terlebih dahulu.
- 5 Data teratas dari table movie
- Info Data dari Setiap Kolom
- Pengecekan Data dengan Nilai NULL
- Analisis Kolom dengan data bernilai NULL
- Membuang Data dengan Nilai NULL - part
- Mengubah Nilai '\N'
- Mengubah nilai genres menjadi list
Task 3 - Cleaning table ratings
Sama seperti yang sudah kita lakukan sebelumnya pada table movie, sekarang kita akan melakukan cleaning pada table ratings.
Task 4 - Joining table movie and table ratings
Perlu untuk dilakukan join pada table movie dan rating untuk mendapatkan rating dari tiap film yang ada pada table movie.
- Inner Join table movie dan table rating
- Memperkecil ukuran Table
Task 5 - Building Simple Recommender System
kembali ke formula IMDB weighted average, kita sudah memiliki value v dan R. Sekarang kita perlu mencari untuk value C dan m
Project ini dapat diakses melalui https://academy.dqlab.id/main/package/practice/212.