enpitut2019 / catchapp-analysis

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

arXivデータ,PDFデータの取得解析

integration

  • 統合されたソースが格納
  • masterにはこのディレクトリのみマージ
  • 依存関係
    • pandas
    • arxiv
    • requests
    • googletrans

parts

  • arxiv
    • arxivからのデータの取得
    • 依存関係
      • pandas
      • arxiv
  • chart-extraction
    • PDFからの文字列抽出
  • string-extraction
    • PDFからの図表抽出
  • translation
    • 翻訳

About


Languages

Language:HTML 91.0%Language:Python 6.3%Language:Dockerfile 2.7%