cross-modality-pretraining

There are 0 repository under cross-modality-pretraining topic.

TXH-mercury / VAST
Code and Model for VAST: A Vision-Audio-Subtitle-Text Omni-Modality Foundation Model and Dataset
audio-language cross-modality-pretraining dataset multimodal-foundation-model vision-audio-subtitle-text vision-language
Language:Jupyter Notebook 235