ligenlin1985's starred repositories
usa_stock_data_crawler
美国股票爬取(NASDAQ,AMEX,NYSE)
fddc02_intro
【梳理】FDDC2018金融算法挑战赛02-A股上市公司公告信息抽取
2-scikit-learn-intro
利用Scikit Learn对秒级股票数据进行建模预测
XueQiuSuperSpider
雪球股票信息超级爬虫
Chinese-public-firm-prospectuses-analysis
Crawl and download IPO prospectuses from CSRC website(http://ipo.csrc.gov.cn/), convert PDF file into txt file and extract information from texts. 从**证监会网站爬取并下载IPO招股说明书之后转换成txt格式,然后提取文本信息。
pythonpdfstudy
使用python 提取pdf中的数据并写入到excel或者存到数据库
pdf_information_extraction
提取非扫描版pdf表格信息的py3脚本
pdf-extract-images
提取文件夹内所有pdf文件的图片
pdfbookmark
提取,添加PDF文件的书签
pdf_extractor
提取PDF文件关键字,统计出现次数,写入Excel
pdf2htmlEX
Convert PDF to HTML without losing text or format.
pdf2htmlEX
Convert PDF to HTML without losing text or format.