[Paper Reivew] RealFill: Reference-Driven Generation for Authentic Image Completion
RealFill은 참조 이미지의 내용을 바탕으로 목표 이미지의 누락된 영역을 충실하게 복원하는 Authentic Image Completion 방법입니다.
RealFill은 참조 이미지의 내용을 바탕으로 목표 이미지의 누락된 영역을 충실하게 복원하는 Authentic Image Completion 방법입니다.
본 논문에서는 AnomalyDiffusion이라는 few-shot diffusion 기반 anomaly generation 모델을 제안합니다.
개인화 이미지 생성을 정리한 Survey 논문입니다.
개인화 이미지 생성을 정리한 Survey 논문입니다.
개인화 이미지 생성을 정리한 Survey 논문입니다.
Imagen Video는 텍스트 조건에 따라 고해상도 비디오를 생성하는 시스템으로, Cascaded video diffusion model을 기반으로 합니다.
Text-only pretrained large language model의 텍스트 임베딩을 활용해, 이미지 합성에서 fidelity와 image-text alignment를 크게 향상시킨 T2I model Imagen을 제시한 논문입니다.
Chameleon은 텍스트와 이미지를 함께 처리하고 생성할 수 있는 token-based mixed-modal model으로, 기존 모델을 능가하는 성능을 보이며 안정적인 훈련을 위한 새로운 architecture 및 training 방법론을 제시합니다.
텍스트와 이미지 생성을 위한 단일 모델로, 두 가지 다른 최적화 목표를 결합해 효율적인 mult-modality 생성을 구현한 방법입니다.
VQ-Diffusion이 갖는 문제를 Discrete Classifier-free Guidance, High-quality Inference Strategy을 이용해 개선한 연구입니다.