DanielisLearning's repositories

Python-100-Days

Python - 100天从新手到大师

Language:HTMLStargazers:0Issues:0Issues:0

DouBanSpider

豆瓣读书的爬虫

Language:PythonStargazers:0Issues:0Issues:0

Movie_Robot

使用网络爬虫搜索视频源,支持关键字和链接搜索,主要的解析源来自全民解析,通过网络爬虫对播放页面进行解析,找出最原始的播放网页,然后拿出最原始的播放链接(无广告效果)对URL进行显示在Django网页上,通过Django桥接的方式进行VIP视频观看,利用js+css制作搜索页面,最后通过Pythonanythere进行Django托管,欢迎体验

Language:PythonStargazers:0Issues:0Issues:0

UGC-Analysis

本软件包括对于在线原始评论采集、评论情感计算并分类展示、以及对于用户打分、服务评分等结构化数据进行可视化三个主要功能模块。本软件的主要技术特征在于改造和使用了网络爬虫,来为本软件提供实时数据采集的能力,并将评论情感极性分析和用户打分相结合,在首先考虑用户打分的情况下,再对用户评论进行情感极性分析,通过两者综合考虑,即可解决由于部分用户打分和具体评论情感不一致的问题,增加了平台对于UGC((User Generated Content))展示的质量,最后对用户打分的结构化数据进行统计和可视化分析,对用户评论信息和售卖情况更加直观的展示。

Language:PythonLicense:MITStargazers:0Issues:0Issues:0

funNLP

中英文敏感词、语言检测、中外手机/电话归属地/运营商查询、名字推断性别、手机号抽取、身份证抽取、邮箱抽取、中日文人名库、中文缩写库、拆字词典、词汇情感值、停用词、反动词表、暴恐词表、繁简体转换、英文模拟中文发音、汪峰歌词生成器、职业名称词库、同义词库、反义词库、否定词库、汽车品牌词库、汽车零件词库、连续英文切割、各种中文词向量、公司名字大全、古诗词库、IT词库、财经词库、成语词库、地名词库、历史名人词库、诗词词库、医学词库、饮食词库、法律词库、汽车词库、动物词库、中文聊天语料、中文谣言数据、百度中文问答数据集、句子相似度匹配算法集合、bert资源、文本生成&摘要相关工具、cocoNLP信息抽取工具、国内电话号码正则匹配、清华大学XLORE:中英文跨语言百科知识图谱、清华大学人工智能技术系列报告、自然语言生成、NLU太难了系列、自动对联数据及机器人、用户名黑名单列表、罪名法务名词及分类模型、微信公众号语料、cs224n深度学习自然语言处理课程、中文手写汉字识别、中文自然语言处理 语料/数据集、变量命名神器、分词语料库+代码、任务型对话英文数据集、ASR 语音数据集 + 基于深度学习的中文语音识别系统、笑声检测器、Microsoft多语言数字/单位/如日期时间识别包、中华新华字典数据库及api(包括常用歇后语、成语、词语和汉字)、文档图谱自动生成、SpaCy 中文模型、Common Voice语音识别数据集新版、神经网络关系抽取、基于bert的命名实体识别、关键词(Keyphrase)抽取包pke、基于医疗领域知识图谱的问答系统、基于依存句法与语义角色标注的事件三元组抽取、依存句法分析4万句高质量标注数据、cnocr:用来做中文OCR的Python3包、中文人物关系知识图谱项目、中文nlp竞赛项目及代码汇总、中文字符数据、speech-aligner: 从“人声语音”及其“语言文本”产生音素级别时间对齐标注的工具、AmpliGraph: 知识图谱表示学习(Python)库:知识图谱概念链接预测、Scattertext 文本可视化(python)、语言/知识表示工具:BERT & ERNIE、中文对比英文自然语言处理NLP的区别综述、Synonyms中文近义词工具包、HarvestText领域自适应文本挖掘工具(新词发现-情感分析-实体链接等)、word2word:(Python)方便易用的多语言词-词对集:62种语言/3,564个多语言对、语音识别语料生成工具:从具有音频/字幕的在线视频创建自动语音识别(ASR)语料库。

Language:PythonStargazers:0Issues:0Issues:0
Stargazers:0Issues:0Issues:0
Stargazers:0Issues:0Issues:0

jd_spider

两只蠢萌京东的分布式爬虫.

Language:PythonStargazers:0Issues:0Issues:0

patent_spider

使用西瓜代理爬取国家知识产权局专利信息

Language:PythonStargazers:0Issues:0Issues:0

Python-Offer

《剑指Offer》面试题Python实现

Language:PythonStargazers:0Issues:0Issues:0

python-spider-1

:rainbow:Python3网络爬虫实战:VIP视频破解助手;GEETEST验证码破解;小说、动漫下载;手机APP爬取;财务报表入库;火车票抢票;抖音APP视频下载;百万英雄辅助;网易云音乐下载;B站视频和弹幕下载;京东晒单图下载

Language:PythonStargazers:0Issues:0Issues:0

pytorch-captcha-recognition

基于CNN训练的一套 "端到端" 的验证码识别模型,使用深度学习+训练数据+大量计算力,纯数字识别率高达 99.99%,数字+字母识别率 96%

Language:PythonLicense:Apache-2.0Stargazers:0Issues:0Issues:0

darknet_captcha

基于darknet实现目标检测,提供识别点选验证码的实例和训练自己数据的API

Language:PythonLicense:Apache-2.0Stargazers:0Issues:0Issues:0

Taobao_Spider-1

基于Scrapy的Python3分布式淘宝爬虫

Language:PythonStargazers:0Issues:0Issues:0

bili-spider

📺 B 站全站视频信息爬虫

Language:PythonLicense:MITStargazers:0Issues:0Issues:0

py-elasticsearch-django

基于python语言开发的千万级别搜索引擎

Language:PythonStargazers:0Issues:0Issues:0

ScriptTools

一些常用脚本

Language:PythonStargazers:0Issues:0Issues:0

Cookie-Pool

一个强大的Cookie池项目,超乎你的想象

Language:PythonStargazers:0Issues:0Issues:0

qrcode

artistic QR Code in Python (Animated GIF qr code)- Python 艺术二维码生成器 (GIF动态二维码、图片二维码)

Language:PythonLicense:GPL-3.0Stargazers:0Issues:0Issues:0
Language:PythonStargazers:0Issues:0Issues:0

tb1688

淘宝1688采购批发网站爬虫

Language:PythonStargazers:0Issues:0Issues:0

Anti-Anti-Spider

越来越多的网站具有反爬虫特性,有的用图片隐藏关键数据,有的使用反人类的验证码,建立反反爬虫的代码仓库,通过与不同特性的网站做斗争(无恶意)提高技术。(欢迎提交难以采集的网站)(因工作原因,项目暂停)

Language:HTMLStargazers:0Issues:0Issues:0

douyin_spider-1

批量下载收藏的抖音短视频

Language:PythonStargazers:0Issues:0Issues:0

happy-spiders

🔧 🔩 🔨 收集整理了爬虫相关的工具、模拟登陆技术、代理IP、scrapy模板代码等内容。

Language:PythonStargazers:0Issues:0Issues:0

Python-FFmpeg-Video

Python调用ffmpeg开源视频处理库,来实现视频批量的处理:水印、背景音乐、剪辑、合并、帧率、速率、分辨率等操作

Language:PythonStargazers:0Issues:0Issues:0

puzzle

🌷 使用5000张二次元图片生成海报大图,计算颜色相似度。Make a poster with 5000 pictures,Python spider and Color similarity measure

Language:PythonLicense:Apache-2.0Stargazers:0Issues:0Issues:0

hive

lots of spider (很多爬虫)

Language:PythonStargazers:0Issues:0Issues:0

python_spider_jobs

python写的爬虫,爬取51job前程无忧、智联招聘的大城市(北京、上海、深圳、广州、杭州、成都、武汉、长沙、珠海)各种编程岗位的职位数。

Language:PythonLicense:Apache-2.0Stargazers:0Issues:0Issues:0

Scrapy_IPProxyPool

免费 IP 代理池。Scrapy 爬虫框架插件

Language:PythonStargazers:0Issues:0Issues:0

Python-crawler

从头开始 系统化的 学习如何写Python爬虫。 Python版本 3.6

Language:HTMLStargazers:0Issues:0Issues:0