timcsy / DataOrganization

Home Page:https://hackmd.io/@timcsy/DataOrganization

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

DataOrganization

詳見:https://hackmd.io/@timcsy/DataOrganization 範例資料夾在 Root 資料夾底下

概念

  • 資料中心化
    • 有一個「抽象」統一存放的位置
    • 像是 Git 的 tracking,監控這些資料
    • 盡量使這個系統能包含到所有檔案
    • 資料與裝置系統分開
  • 使用去中心化
    • 可以從資料中心取用資料來用,並定期放回
    • 取用頻率階層(Frequency Hierachy)

中心 Scope

  • 原則
    • 有一個獨立於裝置的抽象目錄
    • 裝置自行快取資料
      • (確保有一裝置有所有資料)
    • 裝置有衝突要 Merge
      • 雲端可以自動同步減少 Merge 的步驟
      • 可以藉由取用頻率階層減少衝突
        • 越不常用的檔案存放到越少的裝置
      • 如何記錄修改時間及修改項目?
        • 同步後就不需再紀錄
    • 同一份資料可以保存多處
    • 別人的分享先保存到 Files,之後再整理
      • 整理後就定型了,複製新的
      • 因為只有 Files 是自動同步的
  • 中心個體(Subject)
    • 使用者 User
    • 群組 Group
    • 家 Home
    • 公司 Company
    • 共用 Public

取用頻率階層 Frequency Hierachy

  • 頻繁 Files
    • weeks
    • < 16 GB
  • 儲存 Storage
    • months
    • < 256 GB
  • 封存 Archive
    • years
    • < 4 TB
  • 備份 Backups
    • decades
    • < 64 TB

整理備份步驟

  • 照取用頻率階層來決定備份週期
  • 這一層要備份,要等更頻繁那層整理完再備份,讓那層的東西在這層可以找得到(讓那層變成真正的快取),如果沒整理,則只能備份尚未整理的那層
  • 不同裝置系統資料獨立備份到最底層
    • 這裡指的資料指的是沒有加入到中心控制的資料

原則

  • 超過 7 個檔案或資料夾始做分類
  • 3 是最美的