Models & AlgorithmsEN

512×512에서 1024×1024로: Latent Diffusion이 해상도 한계를 깬 방법

픽셀 공간 diffusion의 메모리 폭발 문제를 Latent Space가 어떻게 해결했는지. VAE 압축부터 Stable Diffusion 구조까지 완전 분석.

512×512에서 1024×1024로: Latent Diffusion이 해상도 한계를 깬 방법

Latent Diffusion Models: Stable Diffusion의 핵심 원리

TL;DR: Latent Diffusion은 픽셀 공간 대신 압축된 latent 공간에서 diffusion을 수행합니다. 이로써 고해상도 이미지 생성이 실용적으로 가능해졌고, Stable Diffusion의 기반 기술이 되었습니다.

1. 왜 Latent Space인가?

1.1 픽셀 공간의 문제

DDPM/DDIM의 한계:

🔒

이어서 읽으려면 로그인이 필요합니다

무료 회원가입으로 전체 콘텐츠를 확인하세요.

관련 포스트