Models & AlgorithmsEN

SANA: O(n²)→O(n) Linear Attention으로 1024² 이미지 0.6초 생성

Self-Attention의 quadratic 복잡도 문제를 Linear Attention이 어떻게 해결했는지. DiT 대비 100배 빠른 생성의 비밀.

SANA: O(n²)→O(n) Linear Attention으로 1024² 이미지 0.6초 생성

SANA: Linear Attention으로 초고속 고해상도 이미지 생성

TL;DR: SANA는 Linear Attention과 효율적인 토큰 압축을 통해 1024×1024 이미지를 0.6초 만에 생성합니다. DiT 대비 100배 이상 빠르면서 동등한 품질을 유지하는 획기적인 아키텍처입니다.

1. 소개: 속도와 품질의 트레이드오프 극복

1.1 기존 Diffusion 모델의 속도 문제

고해상도 이미지 생성은 계산 비용이 막대합니다:

🔒

이어서 읽으려면 로그인이 필요합니다

무료 회원가입으로 전체 콘텐츠를 확인하세요.

관련 포스트