CLI 版本
GUI 版本
日本电影元数据 抓取工具 | 刮削器,配合本地影片管理软件 Emby, Jellyfin, Kodi 等管理本地影片,该软件起到分类与元数据(metadata)抓取作用,利用元数据信息来分类,供本地影片分类整理使用。
- 本软件仅供技术交流,学术交流使用
- 本软件作者编写出该软件旨在学习 Python ,提高编程水平
- 用户在使用本软件前,请用户自觉遵守当地法律法规,如果本软件使用过程中存在违反当地法律法规的行为,请勿使用该软件
- 用户在使用本软件时,若在用户所在地产生一切违法行为由用户承担
- 严禁用户将本软件使用于商业和个人其他意图
- 本软件作者保留最终决定权和最终解释权
若用户不同意上述条款任意一条,请勿使用本软件
- 本软件不提供任何影片下载地址,仅供本地影片分类整理使用
- 元数据包括了影片的封面,导演,演员,简介,类型......
- 本软件永久免费,除了作者钦点以外
- 认真看 异常处理(重要)
- 多线程爬取可能会触发网站反爬机制,同时也违背了些道德,故单线程运行
- 请clone源码包运行,并手动安装Python3环境
- 把软件拉到和电影的同一目录
- 设置 config.ini 文件的代理(路由器拥有自动代理功能的可以把 proxy= 后面内容去掉)
- 运行软件等待完成
- 把 JAV_output 导入至 Kodi, Emby, Jellyfin 中。
详细请看以下完整文档
如果运行源码版,运行前请安装Python环境和安装以下模块
在终端 cmd/Powershell/Terminal 中输入以下代码来安装模块
pip install requests pyquery lxml Beautifulsoup4 pillow
[common]
main_mode=1
1为普通模式,
2为整理模式:仅根据女优把电影命名为番号并分类到女优名称的文件夹下
success_output_folder=JAV_outputd
failed_output_folder=failed
设置成功输出目录和失败输出目录
方便PT下载完既想刮削又想继续上传的仓鼠党同志
[common]
soft_link=0
1为开启软链接模式
0为关闭
[proxy]
proxy=127.0.0.1:1081
timeout=10
retry=3
proxy=127.0.0.1:1081
打开config.ini
,在[proxy]
下的proxy
行设置本地代理地址和端口,支持Shadowxxxx/X,V2XXX本地代理端口
素人系列抓取建议使用日本代理
路由器拥有自动代理功能的可以把proxy=后面内容去掉
本地代理软件开全局模式的用户同上
如果遇到tineout错误,可以把文件的proxy=后面的地址和端口删除,并开启代理软件全局模式,或者重启电脑,代理软件,网卡
timeout=10
10为超时重试时间 单位:秒
retry=3
3即为重试次数
[update]
update_check=1
0为关闭,1为开启,不建议关闭
[media]
media_warehouse=emby
#emby plex kodi
可选择emby, plex, kodi
如果是PLEX,请安装插件:XBMCnfoMoviesImporter
[escape]
literals=\
folders=failed,JAV_output
literals=
标题指定字符删除,例如iterals=\()
,则删除标题中\()
字符
folders=
指定目录,例如folders=failed,JAV_output
,多目录刮削时跳过failed,JAV_output
[debug_mode]
switch=1
如要开启调试模式,请手动输入以上代码到config.ini
中,开启后可在抓取中显示影片元数据
[Name_Rule]
location_rule=actor+'/'+number
naming_rule=number+'-'+title
已有默认配置
title = 片名
actor = 演员
studio = 公司
director = 导演
release = 发售日
year = 发行年份
number = 番号
cover = 封面链接
tag = 类型
outline = 简介
runtime = 时长
上面的参数以下都称之为变量
自定义规则方法:有两种元素,变量和字符,无论是任何一种元素之间连接必须要用加号 + ,比如:'naming_rule=['+number+']-'+title
,其中冒号 ' ' 内的文字是字符,没有冒号包含的文字是变量,元素之间连接必须要用加号 +
目录结构规则:默认 location_rule=actor+'/'+number
不推荐修改时在这里添加 title,有时 title 过长,因为 Windows API 问题,抓取数据时新建文件夹容易出错。
影片命名规则:默认 naming_rule=number+'-'+title
在 Emby, Kodi等本地媒体库显示的标题,不影响目录结构下影片文件的命名,依旧是 番号+后缀。
[update]
update_check=1
1为开,0为关
可以在多个有影片目录的父目录下搜索影片后缀,然后剪切到和程序同一目录下
建议使用视频合并合并为一个视频文件
可以把多集电影按照集数后缀命名为类似ssni-xxx-cd1.mp4m,ssni-xxx-cd2.mp4,abp-xxx-CD1.mp4
的规则,只要含有-CDn./-cdn.
类似命名规则,即可使用分集功能
运行 AV_Data_capture.py/.exe
当文件名包含: 中文,字幕,-c., -C., 处理元数据时会加上中文字幕标签
可以打开cmd命令提示符,把 AV_Data_capture.py/.exe
拖进cmd窗口回车运行,查看错误,出现的错误信息依据以下条目解决
跳转 网络设置
字幕文件前缀必须与影片文件前缀一致,才可以使用该功能
在软件所在文件夹下新建 JAV_output 文件夹,可能是你没有把软件拉到和电影的同一目录
请设置好代理
同上
可以提取元数据的网站:avsox, javbus, javdb, dmm(fanza), fc2, jav321, mgstage(素人)
目前作者已经完善了番号提取机制,功能较为强大,各大网站的影片请用以下规则命名(dmm(fanza)下载的影片除外)
COSQ-004.mp4
对于dmm(fanza)上下好的电影,请使用影片cid命名,示例如下
kawd00969.mp4
条件:文件名中间要有下划线或者减号"_","-",没有多余的内容只有番号为最佳,可以让软件更好获取元数据 对于多影片重命名,可以用 ReNamer 来批量重命名
暂时无解,可能是网络问题或者pillow模块打包问题,你可以用源码运行(要安装好第一步的模块)
针对格式比较奇葩的番号
影片放在和程序同一目录下,拖动至AV_Data_Capture.exe
,即可完成刮削和整理
开启 SMB,并在 Windows 上挂载为网络磁盘即可使用本软件,也适用于其他 NAS
怎么样,看着自己的日本电影被这样完美地管理,是不是感觉成就感爆棚呢?
tg官方电报群: 点击进群