本组织为燕山大学信院528实验室,整个项目由实验室内各个成员提供,此项目主旨在于帮助通过协作开发,提高实验组水平,帮助所有人更好得积累baseline和学习
此文档为项目的归档文档,便于对不同项目进行索引,包含组织内的所有项目以及对应的简介
用于存储所有组内的可开源的推荐系统基本模板(尚在开发过程中)
项目地址:https://github.com/ysu528/RecommenderSystems
例如CTR模型,可以在对应的赛事项目上来尝试
项目地址:https://github.com/ysu528/ysu528kaggle
本教程主要是针对具有机器学习基础并想找推荐算法岗位的同学,由推荐算法基础、推荐算法入门赛、新闻推荐项目及推荐算法面经组成,形成了一个完整的从基础到实战再到面试的闭环。主要分为三个阶段,分别是推荐系统基础、推荐系统进阶和推荐算法面经
项目地址:https://github.com/ysu528/fun-rec
本开源项目代表了我们的一种尝试:我们将教给读者概念、背景知识和代码;我们将在同一个地方阐述剖析问题所需的批判性思维、解决问题所需的数学知识,以及实现解决方案所需的工程技能。
项目地址:https://github.com/ysu528/d2l-zh
“周志华老师的《机器学习》(西瓜书)是机器学习领域的经典入门教材之一,周老师为了使尽可能多的读者通过西瓜书对机器学习有所了解, 所以在书中对部分公式的推导细节没有详述,但是这对那些想深究公式推导细节的读者来说可能“不太友好”,本书旨在对西瓜书里比较难理解的公式加以解析,以及对部分公式补充具体的推导细节。”
项目地址:https://github.com/ysu528/pumpkin-book
本书分为监督学习和无监督学习两篇,全面系统地介绍了统计学习的主要方法。包括感知机、k近邻法、朴素贝叶斯法、决策树、逻辑斯谛回归与最大熵模型、支持向量机、提升方法、EM算法、隐马尔可夫模型和条件随机场,以及聚类方法、奇异值分解、主成分分析、潜在语义分析、概率潜在语义分析、马尔科夫链蒙特卡罗法、潜在狄利克雷分配和PageRank算法等。本书通过第1章、第12章、第13章、第22章进行总结,其余每章都介绍一种统计学习方法。叙述从具体问题或实例入手,由浅入深,阐明思路,给出必要的数学推导,便于读者掌握统计学习方法的实质,学会运用。为满足读者进一步学习的需要,书中还介绍了一些相关研究,给出了少量习题,列出了主要参考文献。
项目地址:https://github.com/ysu528/statistical-learning-method-solutions-manual
巨硬的NumPy 教程包括两部分:《从小白到入门》和《从入门到精通》。 《从小白到入门》旨在帮助没有基础的同学快速掌握 numpy 的常用功能,保证日常绝大多数场景的使用。 《从入门到精通》目的是帮助有进一步需要的同学对 numpy 进行更深入地了解,主要包括基本介绍、原理分析、基本操作和例子。
项目地址:https://github.com/ysu528/powerful-numpy
项目中介绍了常见的机器学习算法,包含了基础介绍、资源内容、代码细节等内容,帮助初学者在100天内逐步探索机器学习的实践细节,可以说对于0基础用户非常的友好,如果你没有什么算法经验,那么建议你跟随文章的学习进度,阅读各种基础资料,并逐步实践各个代码片段,相信对自己的技术提升是非常有帮助的。
项目地址:https://github.com/ysu528/100-Days-Of-ML-Code
汇总了几乎所有Kaggle历史竞赛解决方案和Top思路的网页,新的比赛一结束,这个名单就会更新
项目地址:https://github.com/ysu528/kaggle-solutions
项目地址:https://github.com/ysu528/ysu528LearningResources
本项目主要存储Datawhale组队学习中“数据挖掘/机器学习”方向的资料。
项目地址:https://github.com/ysu528/team-learning-data-mining
动态更新工作中实现或者阅读过的计算广告相关论文、学习资料和业界分享,作为自己工作的总结,也希望能为计算广告相关行业的同学带来便利。 所有资料均来自于互联网,如有侵权,请联系王喆。同时欢迎对计算广告感兴趣的同学与我讨论相关问题,我的联系方式如下:
- Email: wzhe06@gmail.com
- LinkedIn: 王喆的LinkedIn
- 知乎私信: 王喆的知乎
项目地址:https://github.com/ysu528/Ad-papers
动态更新工作中实现或者阅读过的推荐系统相关论文、学习资料和业界分享,作为自己工作的总结,也希望能为推荐系统相关行业的同学带来便利。 所有资料均来自于互联网,如有侵权,请联系王喆。同时欢迎对推荐系统感兴趣的同学与我讨论相关问题,我的联系方式如下:
- Email: wzhe06@gmail.com
- LinkedIn: 王喆的LinkedIn
- 知乎私信: 王喆的知乎
项目地址:https://github.com/ysu528/Reco-papers
该存储库提供有关推荐系统的精选论文列表RSP,包括综合调查、一般推荐系统、社交推荐系统、基于深度学习的推荐系统、推荐系统中的冷启动问题、高效推荐系统、推荐系统中的探索和利用问题、可解释性 在推荐系统以及推荐系统的点击率预测、推荐系统的知识图谱、基于评论的推荐系统、会话推荐系统、工业/实用推荐系统和隐私保护推荐系统。
项目地址:https://github.com/ysu528/RSPapers
这是在 IEEE Transactions on Knowledge and Data Engineering 上提交的调查论文“A Survey on Accuracy-oriented Neural Recommendation: From Collaborative Filtering to Information-rich Recommendation”的存储库
项目地址:https://github.com/ysu528/AWS-recommendation-papers
顶级大佬在白板上推导了各个机器学习算法的过程
视频地址:https://www.bilibili.com/video/BV1aE411o7qd?spm_id_from=333.337.search-card.all.click
语雀文档地址:https://www.yuque.com/books/share/f4031f65-70c1-4909-ba01-c47c31398466?#
由于算法知识点繁杂,将自己学习到的算法、做过的题目分类整理好是有必要的。 一个算法模板应当涵盖以下几点: 对该算法的基本介绍(核心**、复杂度等) 参考链接或书籍章节(讲的比较好的资料) 模板代码(可以包含一些注释、使用说明) 模板补充内容(常见题型中的额外代码、建模技巧等) 相关题目链接(模板题、经典题、思维转换题等)
项目地址:https://github.com/ysu528/codeforces-go
做啥事情做多了,都能发现套路的,我把各种算法套路框架总结出来,相信可以帮助其他人少走弯路。我这个纯靠自学的小童鞋,花了一年时间刷题和总结,自己写了一份算法小抄,后面有目录,这里就不废话了。
项目地址:https://github.com/ysu528/fucking-algorithm
SparrowRecSys是一个电影推荐系统,名字SparrowRecSys(麻雀推荐系统),取自“麻雀虽小,五脏俱全”之意。项目是一个基于maven的混合语言项目,同时包含了TensorFlow,Spark,Jetty Server等推荐系统的不同模块。希望你能够利用SparrowRecSys进行推荐系统的学习,并有机会一起完善它。
项目地址:https://github.com/ysu528/SparrowRecSys
本项目是一个选排课系统项目,整个系统包括登录模块、成员模块、排课模块和抢课模块,面向管理员的主要业务为成员管理,进行创建或者删除成员,以及排课管理,设置教师与课程的绑定关系,面向学生的主要业务为抢课以及查看学生课表。就消息队列+令牌环处理抢课高并发问题。
项目文档:https://bytedancecampus1.feishu.cn/docs/doccngiFrZry8S8Y8wqy1wdxKOh#
项目地址:https://github.com/ysu528/Course-Selection-System
从初级开发者到资深架构师,看这些基本就够了
项目地址:https://github.com/ysu528/architect-awesome
项目大量介绍了各类常用的基础知识点,包括算法、操作系统 网络、面向对象、数据库、Java、系统设计、工具、编码实践等多个方面
项目地址:https://github.com/ysu528/CS-Notes
python学习的一百天,对于python学习新手有很大的帮助
项目地址:https://github.com/ysu528/Python-100-Days
无需多言,崔庆才出品的爬虫课程可以说的上是全网最经典的一套
项目地址:https://github.com/ysu528/Python3WebSpider
燕山大学528实验组新生培养方案
项目地址:https://github.com/ysu528/ysu528NewStars
网站:https://www.latexstudio.net/
项目地址:https://github.com/ysu528/fucking-algorithm
项目地址:https://github.com/wg/wrk
matplotlib使用学习
项目地址:https://github.com/ysu528/fantastic-matplotlib
许多项目调试环节是需要在pycharm中进行的,而且pycharm可以很方便进行本地code和服务器上code的数据同步
不少项目环境配置很麻烦,如果采用docker直接打包好,移植就会变得简单许多
当今的时代处处充斥着大数据的影子,大数据技术也为信息技术发展带来了重大的变革,并深刻影响着人们生活的方方面面。而我们旨在带领大家走进大数据时代的浪潮中,理解并能够使用目前主流的大数据处理架构Hadoop解决相应的问题,从小白到实践者。