mcxiaoxiao / xiaohongshuCrawler

小红书简易爬虫 📕 获取文章title、文章id、文章内容、话题标签

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

xiaohongshuCrawler

小红书 📕 获取文章title、文章id、文章内容、话题标签,

GitHub language count GitHub contributors GitHub Repo stars

Static Badge Static Badge Static Badge Static Badge

🏫 Student of @HRBUST 👨‍💻 @mcxiaoxiao

Introduction 🙌

xiaohongshuCrawler 📕 简单的小红书爬虫 python+油猴脚本模拟操作实现

demo

demo

三步实现

0️⃣ 🤔 安装脚本

直接在线安装 安装到浏览器

使用Tampermonkey导入Tampermonkey.js

1️⃣ 🤔 复制新页面中实时提取的id-title键值对到data.txt

3️⃣ 运行

Window

python crawlerTool.py


Linux/Mac

bash start.sh

About

小红书简易爬虫 📕 获取文章title、文章id、文章内容、话题标签

License:MIT License


Languages

Language:JavaScript 54.1%Language:Jupyter Notebook 25.8%Language:Python 14.2%Language:Shell 5.8%