LintangWisesa / Ujian_AnalyticsVisualization_JCDS08

Panduan Soal Ujian Data Analytics & Visualization Job Connector Data Science batch 8

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Soal Ujian Data Science - Data Analytics & Visualization

Lintang_Purwadhika

Soal 1 - Distributor Die Cast πŸš—

hotwheels

Anda adalah distributor ternama di bidang jual-beli die cast (miniatur moda transportasi) yang menjual beragam produk dari vendor-vendor berkualitas, dengan 7 kantor cabang tersebar di beberapa negara dunia. Disediakan database yang menyimpan berbagai data terkait usaha Anda, mulai dari daftar customer, karyawan, produk hingga transaksi yang dilakukan.

Unduh database .sql di repo ini (/database/retrowheels.sql) dan import ke local MySQL server Anda. Tata cara import database juga tercantum di folder: (/database). Kemudian selesaikan soal-soal berikut. Anda dilarang keras mengubah struktur & format tabel serta database yang telah disediakan.

  1. Rumuskan single query untuk menampilkan jumlah total customer yang Anda layani, beserta jumlah total kota & negara asal customer-customer Anda. Contoh output yang diharapkan:

    +-----------+--------+-----------+
    | Customers | Cities | Countries |
    +-----------+--------+-----------+
    |       122 |     95 |        27 |
    +-----------+--------+-----------+

    Anda memiliki 122 customer dari 95 kota yang tersebar di 27 negara!

  2. Rumuskan single query untuk menampilkan resources yang Anda miliki, mulai dari jumlah karyawan, jumlah kantor & lokasi negaranya, jumlah barang yang dijual, total stok barang & jumlah vendor yang menjadi partner Anda. Contoh output yang diharapkan:

    +-----------+---------+---------+----------+---------------+---------+
    | Employees | Offices | Country | Products | StockProducts | Vendors |
    +-----------+---------+---------+----------+---------------+---------+
    |        23 |       7 |       5 |      110 |        555131 |      13 |
    +-----------+---------+---------+----------+---------------+---------+

    Anda memiliki 23 karyawan di 7 kantor yang berada di 5 negara, dengan 110 model die cast (total stok mencapai 555131 item) yang didistribusikan dari 13 vendor partner.

  3. Dari soal sebelumnya tercatat Anda memiliki 110 model die cast dengan total stok 555131 item. Jika dikategorikan, produk yang Anda jual terbagi menjadi 7 product line die cast, yakni model mobil klasik, mobil vintage, sepeda motor, pesawat terbang, kapal laut, kereta api serta truk & bus. Rumuskan single query yang dapat menampilkan harga produk terendah & tertinggi untuk masing-masing kategori. Contoh output yang diharapkan:

    +------------------+----------+----------+
    | productLine      | minPrice | maxPrice |
    +------------------+----------+----------+
    | Classic Cars     |    15.91 |   103.42 |
    | Motorcycles      |    24.14 |    91.02 |
    | Planes           |    29.34 |    77.27 |
    | Ships            |    33.30 |    82.34 |
    | Trains           |    26.72 |    67.56 |
    | Trucks and Buses |    24.92 |    84.76 |
    | Vintage Cars     |    20.61 |    86.70 |
    +------------------+----------+----------+
  4. Rumuskan single query yang dapat menampilkan daftar 10 customer paling royal (paling banyak mendatangkan uang bagi kita), yang total nominal transaksinya paling tinggi. Data yang ditampilkan adalah nama customer, kota & negara asal, beserta total uang yang dihabiskan di produk kita. Contoh output yang diharapkan:

    +------------------------------+---------------+-------------+-----------+
    | customerName                 | city          | country     | total     |
    +------------------------------+---------------+-------------+-----------+
    | Euro+ Shopping Channel       | Madrid        | Spain       | 715738.98 |
    | Mini Gifts Distributors Ltd. | San Rafael    | USA         | 584188.24 |
    | Australian Collectors, Co.   | Melbourne     | Australia   | 180585.07 |
    | Muscle Machine Inc           | NYC           | USA         | 177913.95 |
    | Dragon Souveniers, Ltd.      | Singapore     | Singapore   | 156251.03 |
    | Down Under Souveniers, Inc   | Auckland      | New Zealand | 154622.08 |
    | AV Stores, Co.               | Manchester    | UK          | 148410.09 |
    | Anna's Decorations, Ltd      | North Sydney  | Australia   | 137034.22 |
    | Corporate Gift Ideas Co.     | San Francisco | USA         | 132340.78 |
    | Saveley & Henriot, Co.       | Lyon          | France      | 130305.35 |
    +------------------------------+---------------+-------------+-----------+
  5. Pada 2003-06-05, terdapat pembayaran masuk sebesar US$ 14571.44. Tampilkan data seputar transaksi tersebut, mencakup nama customer yang melakukan pembayaran, nama produk yang dibeli, jumlah tiap produk yang dibeli dan harga satuannya. Pastikan total harga yang dibeli sesuai dengan data pembayaran masuk. Output yang diharapkan:

    +-------------------+--------------------------------+-----------------+-----------+
    | customername      | productname                    | quantityOrdered | priceEach |
    +-------------------+--------------------------------+-----------------+-----------+
    | Atelier graphique | 1965 Aston Martin DB5          |              26 |    120.71 |
    | Atelier graphique | 1999 Indy 500 Monte Carlo SS   |              46 |    114.84 |
    | Atelier graphique | 1948 Porsche Type 356 Roadster |              34 |    117.26 |
    | Atelier graphique | 1966 Shelby Cobra 427 S/C      |              50 |     43.27 |
    +-------------------+--------------------------------+-----------------+-----------+

    Jika Anda cek jumlah total dari quantityOrdered dikali priceEach dari tabel di atas, hasilnya 14571.44. Dan transaksi pembayaran tersebut terjadi tepat pada tanggal 2003-06-05.

βœ… Kirim & lampirkan jawaban soal ini dalam bentuk text (.txt) via email ke lintang@purwadhika.com dengan subject email "NamaLengkap_DieCast".


Soal 2 - World Happiness πŸ˜„

Disediakan dataset laporan tingkat kebahagiaan di berbagai negara di dunia, unduh di sini: World Happiness. Gunakan hanya dataset 2019.csv, lalu buatlah sebuah file notebook (.ipynb) dan selesaikanlah beberapa soal berikut:

  1. Untuk setiap numerik feature/column (kecuali column Overall Rank), hitunglah:

    • Mean, Median dan Modus
    • Range, Q1, Q3 dan IQR
    • Standard Deviasi & Variance
    • Z-score tiap data point
  2. Untuk setiap numerik feature/column (kecuali column Overall Rank), carilah data outlier-nya berdasarkan:

    • IQR method
    • Z-score method
  3. Tampilkan sebaran masing-masing numerik feature/column (kecuali column Overall Rank) dalam bentuk boxplot dan histogram!

  4. Di antara semua numerik feature/column (kecuali column Overall Rank), feature/column mana saja yang sangat mempengaruhi happiness score suatu negara? Buktikan dengan menghitung nilai:

    • Covariance
    • Pearson Correlation
    • Spearman Correlation
    • Kendall Correlation
  5. Visualisasikan dalam bentuk bar chart data berikut:

    • 10 Negara dengan GDP per capita tertinggi.
    • 10 Negara dengan Healthy life expectancy tertinggi.
    • 10 Negara dengan Perceptions of corruption tertinggi.

βœ… Push & commit jawaban Anda ke sebuah repo github dengan nama Soal2_WorldHappiness. Kirim & lampirkan url repo github Anda via email ke lintang@purwadhika.com dengan subject email "NamaLengkap_WorldHappiness".


Soal 3 - Indonesia Covid-19 Maps 🌏

Jumlah kasus infeksi virus corona Covid-19 masih terus mengalami peningkatan. Hingga Minggu (29/3/2020) sore, jumlah kasus infeksi Covid-19 yang telah dilaporkan di seluruh dunia adalah sebanyak 669.312 kasus dengan 145.609 pasien sembuh dan 31.700 meninggal dunia. Wabah ini telah dilaporkan di lebih dari 170 negara di dunia, termasuk Indonesia.

Disediakan:

  • Data sebaran Covid-19 tiap provinsi di Indonesia: klik sini, untuk mengaksesnya silakan gunakan teknik web scraping.
  • Data lokasi latitude & longitude tiap provinsi di Indonesia: klik sini, untuk mengaksesnya silakan lakukan GET request ke https://raw.githubusercontent.com/LintangWisesa/Indonesia-Covid19-Maps/master/data/gps_indonesia.json.

Dengan data tersebut, buatlah sebuah peta sebaran Covid-19 per provinsi di Indonesia, dengan minimum requirements sebagai berikut:

  • Tampilkan marker di setiap provinsi.
  • Saat marker diklik akan menampilkan popup message total kasus, pasien sembuh & kematian akibat Covid-19 di provinsi tersebut.
  • Jawaban yang diminta berupa 1 file notebook (.ipynb) berisi proses ekstraksi & data cleaning, beserta 1 file html peta sebaran Covid-19 per provinsi (.html).
  • Contoh output dapat Anda simak di bit.ly/cov19id. Tampilan tidak harus sama, utamakan fitur.

βœ… Push & commit jawaban Anda ke sebuah repo github dengan nama Soal3_Covid19. Kirim & lampirkan url repo github Anda via email ke lintang@purwadhika.com dengan subject email "NamaLengkap_Covid19".


πŸ”ΈπŸ”ΈπŸ”ΈπŸ”ΈπŸ”ΈπŸ”ΈπŸ”ΈπŸ”ΈπŸ”ΈπŸ”ΈπŸ”ΈπŸ”ΈπŸ”ΈπŸ”ΈπŸ”ΈπŸ”ΈπŸ”ΈπŸ”ΈπŸ”ΈπŸ”ΈπŸ”ΈπŸ”ΈπŸ”ΈπŸ”ΈπŸ”ΈπŸ”ΈπŸ”ΈπŸ”ΈπŸ”ΈπŸ”ΈπŸ”ΈπŸ”ΈπŸ”ΈπŸ”ΈπŸ”ΈπŸ”ΈπŸ”ΈπŸ”ΈπŸ”Έ

Remedial Ujian Python Data Analytics & Visualization

Soal - πŸ” Nutrisi McD 🍟

Disediakan dataset daftar nutrisi tiap menu di McDonald, unduh di sini: Nutrition Facts for McDonald's Menu. Buatlah sebuah file notebook (.ipynb) dan selesaikanlah beberapa soal berikut:

  1. Untuk feature/column Serving Size, Calories, & Total Fat hitunglah:

    • Mean, Median dan Modus
    • Range, Q1, Q3 dan IQR
    • Standard Deviasi & Variance
    • Z-score tiap data point
  2. Untuk feature/column Serving Size, Calories, & Total Fat carilah data outlier-nya berdasarkan:

    • IQR method
    • Z-score method
  3. Untuk menu dengan kategori Coffee & Tea, Breakfast, Chicken & Fish, Beef & Pork & Snacks & Sides, tampilkan sebaran data dalam bentuk boxplot dan histogram untuk feature/column Serving Size, Calories, & Total Fat.

  4. Untuk menu dengan kategori Coffee & Tea, Breakfast, Chicken & Fish, Beef & Pork & Snacks & Sides, visualisasikan dalam bentuk bar chart data berikut:

    • 5 Menu dengan Serving Size tertinggi tiap kategori.
    • 5 Menu dengan Calories tertinggi tiap kategori.
    • 5 Menu dengan Total Fat tertinggi tiap kategori.

Catatan:

βœ… Commit & push source code jawaban soal ini ke Github Anda, buatlah repo dengan nama Nutrisi_McD, kemudian lampirkan url link repo Github Anda via email ke lintang@purwadhika.com!


#HappyCoding ☺️

Lintang Wisesa πŸ’Œ lintangwisesa@ymail.com

Facebook | Twitter | Google+ | Youtube | :octocat: GitHub | Hackster

About

Panduan Soal Ujian Data Analytics & Visualization Job Connector Data Science batch 8