-
podstawowe elementy składni
-
-
Środowisko pracy do pracy z danymi – anakonda, jupyter, biblioteki i moduły
-
-
-
Korzystanie z pythona – notebooks, skrypty
-
-
Data wrangling, munging, tidying
-
Biblioteka Pandas – wprowadzenie. Czytanie danych
-
Data Wrangling w praktyce – podstawowe operacje
-
Biblioteka Pandas – wybieranie kolumn i „krojenie danych”
-
-
Pandas – agregacja, grupowanie
-
Matplotlib – wprowadzenie
-
-
Konfiguracja wykresu, sztuczki i kruczki
-
-
Różnice i podobieństwa do Matplotlib
-
Dash by Plotly - interfejsy webowe
8. Zewnętrzne źródła danych
-
Pojęcie API i korzystanie z nich. JSON
-
Samodzielne pobieranie danych
-
-
Biblioteki Beautiful Soup, lxml
-
-
Metryki skuteczności optymalizacja modeli
-
Trening klasyfikatorów w scikit
-
-
Badanie charakterystyk modeli
-
14. Wprowadzenie do maszynowego przetwarzania tekstu
-
Specyfika danych tekstowych
-
Postawowe metryki dla danych tekstowych
-
Klasyfikacja dokumentów w Scikit.
Aby odtworzyć środowisko wykładu można skorzystać z polecenia:
conda create --name <envname> --file requirements.txt