Max's repositories
Coursera-ML-AndrewNg-Notes
吴恩达老师的机器学习课程个人笔记
team-learning-data-mining
主要存储Datawhale组队学习中“数据挖掘/机器学习”方向的资料。
algorithm
data struct and algorithm notes & codes
awesome-chatgpt-prompts-zh
ChatGPT 中文调教指南。各种场景使用指南。学习怎么让它听你的话。
Bigdata-Movie
本项目以数据采集、处理、分析及数据可视化为项目流程,实现百万级电影数据离线处理与计算。功能包括python爬虫,Matplotlib、Echarts数据可视化、Mapreduce、hive数据统计、情感分析、词图云、电影票房与评分预测
CODE
SSM三大框架笔记
Data-Science-Notes
数据科学的笔记以及资料搜集
Deep-Learning-Coursera
吴恩达深度学习课程课后编程作业
Film-Data-Analysis-and-visualization
豆瓣电影网与艺恩票房网的电影数据采集与分析及可视化
JavaFamily
【Java面试+Java学习指南】 一份涵盖大部分Java程序员所需要掌握的核心知识。
kg_movie
构建一个电影的知识图谱实例
learn-nlp-with-transformers
we want to create a repo to illustrate usage of transformers in chinese
LeetCode-Py
算法通关手册(LeetCode), Algorithm Handbook, LeetCode 题解, Solutions to LeetCode by Python.
live2d-widget
把萌萌哒的看板娘抱回家 (ノ≧∇≦)ノ | Live2D widget for web platform
mall4cloud
⭐️⭐️⭐️ Springcloud商城 O2O商城 小程序商城 PC商城 H5商城 APP商城 Java商城 分销商城 多用户商城 uniapp商城 微服务商城
ML-notes
notes about machine learning
movie_kg
基于知识图谱的电影智能问答。neo4j构建电影图谱,spark ml完成问答意图分类,将问答语句转为cypher查询语句完成匹配查询。
mtime_spider-data_visualization
时光网电影 Top100 爬虫和数据可视化
my_note
linux学习笔记
QASystemOnMedicalKG
构建医疗知识图谱
re01
《Re01:从零开始的编程之路》是一套专门面向零基础同学,全程以实战为主的编程教学视频课。从零基础到能够独立开发商业级项目。
Recommended-system
推荐系统学习笔记,包括论文、代码实现、相关推荐比赛等
slight-star.github.io
我的个人网站
spider-BaiduIndex
百度指数、百度搜索、百度登录、天眼查等数据SDK
team-learning-program
主要存储Datawhale组队学习中“编程、数据结构与算法”方向的资料。
texture-classification-based-on-BPNN-and-dictionary
代码主要包括:1。特征提取 首先对文本信息进行分词处理,采用基于字符串匹配的方法: 假如一段叫:李二狗就是一个** 基于匹配的方法就是依次截取一到多个词,并与字典库进行匹配。如二狗,如果匹配到字典中有这个词,则将其分为一个词;当取到“狗就”,发现字典中没有与之匹配的,则说明这个不是一个词语,进行顺序操作,最优将这段话分为:李 二狗 就是 一个 **。 2. 得到分词后的文本之后,就是转换成数字编码,因此电脑没办法识别汉字。这一部分叫特征表示,即用数字的方式表示中文文本,采用的方法是基于词带模型的特征表示: 词带就是字典--程序中那个dictionary.mat。我们将分词处理之后的文本中的每一个词语,分别与字典中的词进行匹配,只要出现过就为1,否则为0。 如 字典中的词含有:李 周 吴 郑 王 他妈的 就是 大 ** 一个 三炮 也是 瓜娃子,一共13词(当然正常的词典都是上万个词),将1中得到的词语与之匹配,则李二狗就是一个**对应的数字编码就应该是 1 0 0 0 0 0 1 0 1 1 0 0 0 3,通过2我们将文本表示成了数字,但是这样的表示通常都是稀疏的(因为一般字典都含有上万个词,所以得到的数字表示大部分都是0),为此我们利用降维方法,消除掉这些冗余特征。这里我们采用的PCA(主成分分析)进行降维,并降至15维。 4. 文本分类,采用的就是bp网络 代码修改的地方不多,主要就是超参数的选择,(1)如pca的降维数,维数过高,包含冗余数据,过低又会删除掉重要信息。(2)bp网络结构的调整,如隐含层节点数,学习率,等
Waking-Up
计算机基础(计算机网络/操作系统/数据库/Git...)面试问题全面总结,包含详细的follow-up question以及答案;全部采用【问题+追问+答案】的形式,即拿即用,直击面试;可用于模拟面试、面试前复习、短期内快速备战面试...