kiddingmu's repositories
awesome-books
技术类精华书单推荐,包括 前端、后端、数据结构与算法、计算机基础、设计模式、数据库等书籍。
ChatSensitiveWords
利用LLM+敏感词库,来自动判别是否涉及敏感词。
cloudera-scripts-for-log4j
Scripts for addressing log4j zero day security issue
Database-Series
📚深入浅出数据库存储:数据库理论、关系型数据库、文档型数据库、键值型数据库、New SQL、搜索引擎、数据仓库与 OLAP、大数据与数据中台
DataX
DataX是阿里云DataWorks数据集成的开源版本。
datax-cloud-base
智数通提供了元数据管理、数据标准管理、数据质量管理、主数据管理、数据集市管理、可视化图表看板、流程管理等微服务,是为数据治理而生的企业级一站式数据中台。
datax-web
DataX集成可视化页面,选择数据源即可一键生成数据同步任务,支持批量创建RDBMS数据同步任务,集成开源调度系统,支持分布式、增量同步数据、实时查看运行日志、监控执行器资源、KILL运行进程、数据源信息加密等。
Django-Data-quality-system
数据治理、数据质量检核/监控平台(Django+jQuery+MySQL)
e-books
IT technical related e-books and PPT information, continuous updating. For those in need, Keep real, peace and love.
funNLP
中英文敏感词、语言检测
grokking-system-design
Grokking system design
IntelligentRiskControl
《智能风控——原理、算法与工程实践》
ituring_books
图灵程序设计丛书分享
jumpserver
JumpServer 是全球首款开源的堡垒机,是符合 4A 的专业运维安全审计系统。
linuxtools_rst
Linux工具快速教程
NLP-Dictionary
情感词典、停用词典、同义词典、程度词典、否定词典、敏感词典
PESCMS-Ticket
PESMCS Ticket (下称PT) 是一款基于 GPLv2 协议发布的开源客服工单系统。
Security-PPT
大安全各领域各公司各会议分享的PPT
sensitive-stop-words
互联网常用敏感词、停止词词库
sensitive-word
👮♂️The sensitive word tool for java.(敏感词/违禁词/违法词/脏词。基于 DFA 算法实现的高性能 java 敏感词过滤工具框架。请勿发布涉及政治、广告、营销、翻墙、违反国家法律法规等内容。高性能敏感词检测过滤组件,附带繁体简体互换,支持全角半角互换,汉字转拼音,模糊搜索等功能。)
sensitive-words-filter
:page_facing_up:Sensitive word filtering items provide TTMP, DFA, DAT, hash bucket, and Tire algorithm support filtering. Supports text highlighting, filtering, verdicts, and alternative interface support.敏感词过滤项目,提供TTMP、DFA、DAT、hash bucket、Tire算法支持过滤。可以支持文本的高亮、过滤、判词、替换的接口支持。
skycloud-admin-vue
skycloud-base 运维管理平台前端页面
skycloud-datax
基于阿里Datax改版web datax ,支持管理平台与restful风格API
SparkOnHBase
SparkOnHBase
stat451-machine-learning-fs20
STAT 451: Intro to Machine Learning @ UW-Madison (Fall 2020)
tencent-sensitive-words
腾讯的离线敏感词库
textfilter
敏感词过滤的几种实现+某1w词敏感词库
vulfocus
🚀Vulfocus 是一个漏洞集成平台,将漏洞环境 docker 镜像,放入即可使用,开箱即用。