关于测试时长

Question

关于测试时长

vito929 opened this issue a year ago · comments

vito929 commented a year ago

您好，
感谢您的开源，
在论文中我读到用2080Ti显卡可以达到25fps的速度（14401440）。我现在使用2080Ti显卡目前还达不到15fps(≈14fps) 的速度而且是在(512512)的分辨率下。想请问您

这个速度是否是正常？毕竟目前我用的是DECA来fit
我测试速度的方式是否合理？希望你能指出问题，十分感谢

关于测试速度的方式，我是这样做的：

一共输入1000张 512*512 图片，计算总时长，从而得到 fps
计时部分不进行IO操作，提前读取好1000张图片，reenact之后不保存image

torch.cuda.synchronize()
start = time.time()

for i,img in enumerate(tqdm(path_list)):
    
    # ------------------ fitting ------------------------
    drv_params = drv_fitting.fitting(i)
    drv_headpose = pose_lml_extractor.get_pose(
        src_params['shape'], drv_params['exp'], drv_params['pose'],
        drv_params['scale'], drv_params['tx'], drv_params['ty'])

    drv_lmks = pose_lml_extractor.get_project_points(
        src_params['shape'], drv_params['exp'], drv_params['pose'],
        drv_params['scale'], drv_params['tx'], drv_params['ty'])
    # ------------------ reenactment ------------------ 
    drv_face = dict()
    drv_face = load_data(opt,drv_face,drv_headpose,drv_lmks) 

    drv_face['landmark_img'] = landmark_img_generator.generate_landmark_img(drv_face['landmarks'])
    drv_face['landmark_img'] = [value.unsqueeze(0) for value in drv_face['landmark_img']]
    model.reenactment(src_face['landmark_img'], drv_face['headpose'].unsqueeze(0), drv_face['landmark_img'])
    
    visual_results = model.get_current_visuals()
    

        

torch.cuda.synchronize()
dur = time.time()-start

WX1999 · Answer 1 · Fri Mar 17 2023 09:58:06 GMT+0800 (China Standard Time)

你可以只测reenactment的速度这个DECA是很慢的所以达不到论文里的速度

vito929 · Answer 2 · Sat Mar 18 2023 21:22:22 GMT+0800 (China Standard Time)

你好，
根据你所说，这次我只测试了reenactment的速度，这次达到了 70fps，果然是这个DECA速度很慢。谢谢
请问可以给我一些建议吗，关于如何提升DECA fitting这一步的速度？

WX1999 · Answer 3 · Mon Mar 20 2023 17:17:30 GMT+0800 (China Standard Time)

可以尝试使用一个轻量的3DMM模型替换 DECA

vito929 · Answer 4 · Wed Mar 29 2023 21:40:00 GMT+0800 (China Standard Time)

可以尝试使用一个轻量的3DMM模型替换 DECA

请问可以推荐一个light-weighted 3DMM模型吗？谢谢