SUR-adapter: Enhancing Text-to-Image Pre-trained Diffusion Models with Large Language Models-Reference-Cited by-同舟云学术

SUR-adapter: Enhancing Text-to-Image Pre-trained Diffusion Models with Large Language Models

Published:2023-10-26 Issue: Volume: Page:
ISSN:
Container-title:Proceedings of the 31st ACM International Conference on Multimedia
language:
Short-container-title:

Author:

Zhong Shanshan¹^ORCID,Huang Zhongzhan¹^ORCID,Wen Weushao¹^ORCID,Qin Jinghui²^ORCID,Lin Liang¹^ORCID

Affiliation:

1. Sun Yat-sen University, Guangzhou, China

2. Guangdong University of Technology, Guangzhou, China

Funder

National Natural Science Foundation of China (NSFC)

GuangDong Basic and Applied Basic Research Foundation

China Postdoctoral Science Foundation funded project

Publisher

ACM

Link

https://dl.acm.org/doi/pdf/10.1145/3581783.3611863

Reference58 articles.

1. VQA: Visual Question Answering

2. Fan Bao , Shen Nie , Kaiwen Xue , Chongxuan Li , Shiliang Pu , Yaole Wang , Gang Yue , Yue Cao , Hang Su , and Jun Zhu . 2023. One Transformer Fits All Distributions in Multi-Modal Diffusion at Scale. ArXiv abs/2303.06555 ( 2023 ). Fan Bao, Shen Nie, Kaiwen Xue, Chongxuan Li, Shiliang Pu, Yaole Wang, Gang Yue, Yue Cao, Hang Su, and Jun Zhu. 2023. One Transformer Fits All Distributions in Multi-Modal Diffusion at Scale. ArXiv abs/2303.06555 (2023).

3. Omer Bar-Tal , Lior Yariv , Yaron Lipman , and Tali Dekel . 2023. MultiDiffusion: Fusing Diffusion Paths for Controlled Image Generation. arXiv preprint arXiv:2302.08113 2 ( 2023 ). Omer Bar-Tal, Lior Yariv, Yaron Lipman, and Tali Dekel. 2023. MultiDiffusion: Fusing Diffusion Paths for Controlled Image Generation. arXiv preprint arXiv:2302.08113 2 (2023).

4. Dmitry Baranchuk , Ivan Rubachev , Andrey Voynov , Valentin Khrulkov , and Artem Babenko . 2021. Label-Efficient Semantic Segmentation with Diffusion Models. ArXiv abs/2112.03126 ( 2021 ). Dmitry Baranchuk, Ivan Rubachev, Andrey Voynov, Valentin Khrulkov, and Artem Babenko. 2021. Label-Efficient Semantic Segmentation with Diffusion Models. ArXiv abs/2112.03126 (2021).

5. Georgios Batzolis Jan Stanczuk Carola-Bibiane Schonlieb and Christian Etmann. 2021. Conditional Image Generation with Score-Based Diffusion Models. Georgios Batzolis Jan Stanczuk Carola-Bibiane Schonlieb and Christian Etmann. 2021. Conditional Image Generation with Score-Based Diffusion Models.

Cited by 4 articles. 订阅此论文施引文献订阅此论文施引文献，注册后可以免费订阅5篇论文的施引文献，订阅后可以查看论文全部施引文献

1. FHS-adapter: fine-grained hierarchical semantic adapter for Chinese landscape paintings generation;Heritage Science;2024-07-30

2. Language-Guided Zero-Shot Object Counting;2024 IEEE International Conference on Multimedia and Expo Workshops (ICMEW);2024-07-15

3. Mirror Gradient: Towards Robust Multimodal Recommender Systems via Exploring Flat Local Minima;Proceedings of the ACM Web Conference 2024;2024-05-13

4. Advanced Deep Learning Techniques for High-Quality Synthetic Thermal Image Generation;Mathematics;2023-10-27