MovieFactory: Automatic Movie Creation from Text using Large Generative Models for Language and Images-Reference-Cited by-同舟云学术

MovieFactory: Automatic Movie Creation from Text using Large Generative Models for Language and Images

Published:2023-10-26 Issue: Volume: Page:
ISSN:
Container-title:Proceedings of the 31st ACM International Conference on Multimedia
language:
Short-container-title:

Author:

Zhu Junchen¹^ORCID,Yang Huan²^ORCID,He Huiguo²^ORCID,Wang Wenjing³^ORCID,Tuo Zixi⁴^ORCID,Cheng Wen-Huang⁵^ORCID,Gao Lianli¹^ORCID,Song Jingkuan¹^ORCID,Fu Jianlong²^ORCID

Affiliation:

1. University of Electronic Science and Technology of China, Chengdu, China

2. Microsoft, Beijing, China

3. Peking University, Beijing, China

4. Xi'an Jiaotong University, Xi'an, China

5. National Taiwan University, Taipei, Taiwan Roc

Publisher

ACM

Link

https://dl.acm.org/doi/pdf/10.1145/3581783.3612707

Reference40 articles.

1. Max Bain , Arsha Nagrani , Gü l Varol, and Andrew Zisserman . 2021 . Frozen in Time : A Joint Video and Image Encoder for End-to-End Retrieval. In ICCV. Max Bain, Arsha Nagrani, Gü l Varol, and Andrew Zisserman. 2021. Frozen in Time: A Joint Video and Image Encoder for End-to-End Retrieval. In ICCV.

2. Yogesh Balaji , Seungjun Nah , Xun Huang , Arash Vahdat , Jiaming Song , Karsten Kreis , Miika Aittala , Timo Aila , Samuli Laine , Bryan Catanzaro , Tero Karras , and Ming-Yu Liu . 2022. eDiff-I: Text-to-Image Diffusion Models with an Ensemble of Expert Denoisers. arXiv ( 2022 ). Yogesh Balaji, Seungjun Nah, Xun Huang, Arash Vahdat, Jiaming Song, Karsten Kreis, Miika Aittala, Timo Aila, Samuli Laine, Bryan Catanzaro, Tero Karras, and Ming-Yu Liu. 2022. eDiff-I: Text-to-Image Diffusion Models with an Ensemble of Expert Denoisers. arXiv (2022).

3. Andreas Blattmann , Robin Rombach , Huan Ling , Tim Dockhorn , Seung Wook Kim , Sanja Fidler, and Karsten Kreis. 2023 . Align your Latents : High-Resolution Video Synthesis with Latent Diffusion Models. In CVPR. Andreas Blattmann, Robin Rombach, Huan Ling, Tim Dockhorn, Seung Wook Kim, Sanja Fidler, and Karsten Kreis. 2023. Align your Latents: High-Resolution Video Synthesis with Latent Diffusion Models. In CVPR.

4. Kelvin C.K. Chan Shangchen Zhou Xiangyu Xu and Chen Change Loy. 2022. Investigating Tradeoffs in Real-World Video Super-Resolution. In CVPR. Kelvin C.K. Chan Shangchen Zhou Xiangyu Xu and Chen Change Loy. 2022. Investigating Tradeoffs in Real-World Video Super-Resolution. In CVPR.

5. Prafulla Dhariwal and Alexander Quinn Nichol. 2021. Diffusion Models Beat GANs on Image Synthesis. In NeurIPS Marc'Aurelio Ranzato Alina Beygelzimer Yann N. Dauphin Percy Liang and Jennifer Wortman Vaughan (Eds.). Prafulla Dhariwal and Alexander Quinn Nichol. 2021. Diffusion Models Beat GANs on Image Synthesis. In NeurIPS Marc'Aurelio Ranzato Alina Beygelzimer Yann N. Dauphin Percy Liang and Jennifer Wortman Vaughan (Eds.).

Cited by 1 articles. 订阅此论文施引文献订阅此论文施引文献，注册后可以免费订阅5篇论文的施引文献，订阅后可以查看论文全部施引文献

1. TopicDVC: Dense Video Captioning with Topic Guidance;2024 IEEE 10th International Conference on Edge Computing and Scalable Cloud (EdgeCom);2024-06-28