Cpaulyz / BigDataAnalysis

NJUSE-大数据分析课程作业

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Assignment1

使用scala实现wordcount

基于Spark RDD

Assignment2

作业

  • README说明在/Assginment2下的README.md
  • 使用方法为
    • TF-IDF
    • TextRank
    • WordCount

Assignment3

  • OCR识别图片,提取转移矩阵

  • PageRank计算

  • 考虑:如果是1万张图片呢

Assignment4

  • SVD 书面

Assignment5

使用多种方法分类鸢尾花数据集

Assignment6

推荐算法 MovieLens数据集

  • CF
  • Content-Based

Assignment8

知识图谱补全

  • 使用FB15K-237数据集
  • 进行transE建模、链接预测

About

NJUSE-大数据分析课程作业


Languages

Language:Python 91.3%Language:Java 5.8%Language:Scala 2.9%