Roshanson / TextInfoExp

自然语言处理实验(sougou数据集),TF-IDF,文本分类、聚类、词向量、情感识别、关系抽取等

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

构建实验环境

1 安装python(2.7) https://www.python.org/

2 安装pip:

2.1 下载pip https://pypi.python.org/pypi/pip/9.0.1

2.2 解压缩后,安装指令 python setup.py install

2.3 pip升级 python -m pip install --upgrade pip

2.4 pip安装扩展包 pip install jieba (这里以jieba包为例),如果速度较慢,可改为国内的阿里源, 即 pip install jieba -i http://mirrors.aliyun.com/pypi/simple/ --trusted-host mirrors.aliyun.com

4 使用GitHub获取代码

4.1 安装git https://git-scm.com/

4.2 登陆自己的GitHub账号,找到自己的项目,(别人的需要先fork过来,也可以直接 git clone xxx,或者直接下载zip包放进pycharm)

4.3 打开pycharm,首先设置git的位置及github账号,点击Test都通过后继续,依次在菜单栏点击 VCS checkout from version control GitHub,登陆自己的账号后选择相应的项目,得到代码。

4.4 (更新fork的项目到最新的版本)Syncing a fork https://help.github.com/articles/syncing-a-fork/

5 ipython交互式开发环境

5.1 安装ipython pip install ipython

5.2 安装jupyter(即notebook) pip install notebook

5.3 jupyter notebook 启动,打开浏览器即可(默认1224端口)

About

自然语言处理实验(sougou数据集),TF-IDF,文本分类、聚类、词向量、情感识别、关系抽取等


Languages

Language:Python 28.9%Language:C++ 17.6%Language:Java 16.7%Language:HTML 13.8%Language:C 11.9%Language:M4 10.5%Language:Makefile 0.6%Language:MATLAB 0.1%