CrazyBoyM / dreambooth-for-diffusion

文生图大模型训练工具箱 (完整封装stable diffusion全量微调训练流程, 可训练定制自己的独特风格、人物概念,开箱即用, 含自动图像标注、权重转换、训练参数配置等)

Home Page:https://www.codewithgpu.com/i/CrazyBoyM/dreambooth-for-diffusion/dreambooth-for-diffusion

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

关于输入图像维度的问题

littlewater3 opened this issue · comments

看到有说明输入的图像需要转化为512512维度的图像。
我有大概数千张32
32的带类别标签的图像,如何采用这些图像去重新训练stable diffusion model?
需要缩放为512512吗?还是说有办法拿这些3232的图像直接去训练。
如果去训练改模型,vae、unet、text encoder这些权重哪些需要改变?
我是刚入门的小白,望大佬指教

commented

Case there are always Rectangular shape picture,and also different on phones and computers . I added a width and a height parameter so that I can train as shapes of arbitrary proportions as I want.

commented

解决了这个问题