chenchen37 / Python-Data-Science-Practice

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Python Data Science Practice

Homework

Numpy

  • 陣列的定義與屬性
  • 陣列中不同的資料型態
  • 陣列的初始化
  • 陣列的算術運算
  • 常見的陣列方法與函式
  • 陣列的索引、切片和迭代

Pandas

  • 物件的定義與屬性
  • DataFrame 的初始化
  • DataFrame 的資料選取
  • 算術運算特性
  • 迭代與重複操作
  • Dataframe 的新增與刪除
  • 外部資料存取
  • 撰寫樞紐分析表
  • 執行聚合運算(Split-Apply-Combine Strategy)
  • 時間序列資料處理
  • 大型資料處理與效能調校

Visualization

  • 資料視覺化工具與常見統計圖表介紹
  • 使用 Matplotlib 繪製各種常用圖表
  • 使用 Seaborn 進行資料視覺化
  • 運用實際資料集進行資料視覺化練習
  • 結合 Pandas 與 Matplotlib 進行進階資料視覺化練習
  • BOKEH 輕鬆以網頁呈現視覺化圖表
  • Basemap 進行地理資訊繪圖
  • 使用 PANDAS 與 BASEMAP 將數據整合於地理資訊圖表

Statistics

  • 用統計描述資料的樣態
  • 用機率分布描述亂中有序的世界 - 離散型機率分配
  • 用機率分佈描述亂中有序的世界-連續型分配
  • 用貝式定理讓你決策更精準
  • 掌握 A/B test的精隨 - 假設檢定的概念
  • 掌握 A/B test的精隨 - 假設檢定的進階概念與種類
  • A/B test 的執行流程與計算

Exploratory Data Analysis (EDA)

  • 淺談資料科學與 EDA 所扮演的角色與重要性
  • 數據理解與重覆和遺失值處理
  • 異常值偵測
  • 遺失值與異常值的進階補值策略
  • 探討變數之間的關係
  • 從資料中生成特徵
  • 從資料中選取好的特徵

Project 1 - Use A/B test to evaluate the effect of the new E-commerce website

  • 了解Binomial分布,以及用常態分布求統計解的方法
  • 判讀 A/B Test 結果
  • 如何決定最小樣本數
  • 如何以z-score, p-value, 信賴區間判斷 A/B Test 結果是否顯著

Project 2 - Use A/B test to evaluate the eeffect of the new Udacity website

  • 決定最小樣本數
  • 開發自定義新賴區間函數

Project 3 - Actual Price Registration of Real Estate Analysis

  • 串接不同地區不動產資料
  • 資料清洗、過濾
  • 建立自訂義特徵加入分析
  • 找出與實價登錄總價高度相關變數
  • 視覺化分析

Project 4 - COVID19 Analysis

  • COVID19 Analysis

Project 5 - Netflix Analysis

  • 資料清洗
  • 建立自訂義特徵加入分析
  • 視覺化分析

About


Languages

Language:Jupyter Notebook 100.0%