joneqian / dy

抖音弹幕获取(电脑端抓包版本)

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

抖音弹幕获取

  1. 这个只适合轻度弹幕获取的情况,因为定时重启浏览器进程问题,是必然会出现弹幕遗漏的情况的。之所以需要重启浏览器进程,是因为发现pupeteer或者playwright中的抓包都会出现内存泄露情况,未找到解决方案,故采用定时器处理方案,来定时处理该问题

本版本支持docker启动,当然yarn start 也是可以的,需要主动配置redis。弹幕信息完全走redis,如有数据库需求,自行扩展.在config目录中加一个config文件,输出redis配置和mongo url的配置信息即可

  1. 核心代码完全就在util/cron中,核心**就是抓包,不会破解接口加密算法,只能抓包了。之所以cron 也完全是被迫解决内存泄露问题,20分钟重启一次,测试下来支撑一个热点视频的弹幕抓取是没问题的。如果之后pupeteer升级或者找到解决方案,就可以摒弃这个定时处理了

  2. proto的字段更新就直接分析抖音前端网页就行了,找到相应字段,注意点,字段顺序编号不能错

About

抖音弹幕获取(电脑端抓包版本)


Languages

Language:TypeScript 55.5%Language:JavaScript 42.7%Language:Dockerfile 1.6%Language:Shell 0.2%