Liuyang829 / data-visulazation-project

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

data-visualization

A Vue.js project with echarts

Build Setup

# install dependencies
npm install

# serve with hot reload at localhost:8080

npm run dev

Dataset

https://www.kaggle.com/danofer/dbpedia-classes

本项目所使用的数据集来自 Kaggle, 名为 DBPedia Classes, 是一个包括文本信息, 层次信息可适用于多个任务的文本数据集, 文件类型为 csv 文件, 主要记录了维基百科中众多文章信息, 并进过了一定的清洗与整理, 本课题主要关注于其三层类别的层次信息。

在类别层次信息上, 第一层级为 9 类, 第二层为 70 类, 第三层为 219 类, 共 342782 篇维基百科文章数据, 每一个数据条目分别包括了文章内容, 第一层类别, 第二层类别, 第三层类别, 文章标题, 文章的字数共 6 个字段。

Details

src\assets\makecsv.py用来从csv文件中选取数据

src\assets\makejson.py用来根据生成的csv数据文件生成json格式的文件(关键)

src\assets\DBP_wiki1000.csv 为从所有数据中随机选取出的1000条数据

test5.json对应的就是1000条数据的json数据

About


Languages

Language:JavaScript 54.2%Language:Python 17.1%Language:Vue 14.9%Language:HTML 13.8%