fpazio100 / Rekrutacja_2022

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Rekrutacja do Koła Naukowego Data Science w 2022

Cześć! Ruszamy z rekrutacją do Koła Naukowego!

Aby się dostać w nasze szeregi, należy wykonać JEDNO z trzech zadań i wysłać je do 2022.10.23 do godziny 23:55. Zadanie będzie trzeba przedstawić w formie prezentacji trwającej nie dłużej niż 10 minut.

Jak udostępnić rozwiązanie?

  1. Zrobić forka tego ropozytorium
  2. Dodanie pliki z rozwiązaniami zadań do utworzonego forka. Rozwiązania powinny być umieszczone w odpowiednich folderach:
    • zadanie_programistyczne/ImieNazwisko
    • zadanie_analiza_danych/ImieNazwisko
    • zadanie_machine_learning/ImieNazwisko
  3. Utworzenie nowego pull requesta z forka do tego repo

Zadania:

  • Analiza danych - eksploracja zbioru związanego z tematem E-commerce. Metoda eksploracji jest dowolna, oceniany jest tylko efekt końcowy.

  • Zadanie programistyczne - zaimplementuj w języku Python/R algorytm do znajdywania najkrótszej ścieżki w grafie. Przykładowe dane - słownik, gdzie kluczem jest tupla (punkty połączone ze sobą) a wartością odległość między punktami:

{
  ("B", "D"): 2,
  ("D", "A"): 1,
  ("B", "A"): 4,
  ("A", "C"): 2,
  ("B", "E"): 3,
  ("C", "D"): 7,
  ("E", "C"): 3
} 
  • Machine learning - na wybranym przez siebie zbiorze danych (mają to być dane tabelaryczne (ustrukturyzowane), a problem ma być klasyfikacyjny) należy stworzyć prosty model machine learningowy wraz z całym procesem przetwarzania danych tj. oczyszczanie, transformacje, kodowanie itd.. Najważniejszym kryterium oceny tego zadania będzie metodyka tworzenia modelu, jakość procesu przetwarzania danych wejściowych oraz podejście do oceny jego jakości Macie pytania? Wątpliwości? Nie krępujcie się pytać!! Chętnie pomożemy! Powodzenia!

About


Languages

Language:Jupyter Notebook 100.0%