PaperBanana: AI가 논문 그림까지 자동으로 그려준다
SOTAAZ·

PaperBanana: AI가 논문 그림까지 자동으로 그려준다

PaperBanana 프레임워크 전체 구조
논문 쓸 때 가장 시간 잡아먹는 게 뭘까요? 실험? 글쓰기? 많은 연구자들이 "그림 그리기"를 꼽습니다. 방법론 다이어그램, 아키텍처 도식, 결과 시각화... 하나하나 만들다 보면 며칠이 훌쩍 지나가죠.
Google과 북경대 연구팀이 이 문제를 해결하기 위해 PaperBanana를 발표했습니다. 논문 텍스트만 주면 출판 수준의 학술 일러스트레이션을 자동으로 생성해주는 에이전트 시스템입니다.
왜 필요한가?
LLM이 논문 작성, 코드 생성, 실험 설계까지 도와주는 시대입니다. 하지만 그림은? 여전히 사람이 PowerPoint, Figma, TikZ로 하나하나 만들어야 합니다.
- 방법론 다이어그램 하나에 반나절
- 수정 요청 오면 처음부터 다시
- 일관된 스타일 유지하기도 어려움
PaperBanana는 이 병목을 해결합니다.
어떻게 작동하나?

에이전트 파이프라인 상세
PaperBanana는 4개의 전문화된 에이전트가 협업하는 구조입니다:
1. Reference Retrieval Agent
- 유사한 논문들의 그림 스타일 검색
- 해당 분야의 시각적 컨벤션 파악
- 참고할 레이아웃 패턴 수집
2. Content Planning Agent
- 논문 텍스트에서 핵심 개념 추출
- 그림에 포함할 요소 결정
- 정보 계층 구조 설계
3. Image Rendering Agent
- Vision-Language Model 활용
- 실제 이미지 생성
- 텍스트, 화살표, 박스 등 배치
4. Iterative Refinement Agent
- 생성된 그림 자체 평가
- 개선점 식별 및 수정
- 품질 기준 충족까지 반복
성능: PaperBananaBench

평가 결과 비교
연구팀은 NeurIPS 2025 논문에서 292개 테스트 케이스를 수집해 벤치마크를 만들었습니다.
평가 기준:
- Faithfulness: 논문 내용과 일치하는가
- Conciseness: 불필요한 요소 없이 간결한가
- Readability: 이해하기 쉬운가
- Aesthetics: 시각적으로 보기 좋은가
PaperBanana는 모든 기준에서 기존 방법들을 앞섰습니다.
확장 가능성

생성된 일러스트레이션 예시
방법론 다이어그램뿐 아니라 통계 플롯 생성도 가능합니다:
- 실험 결과 그래프
- 비교 차트
- 데이터 분포 시각화
한계와 전망
현재 한계:
- 복잡한 3D 구조는 아직 어려움
- 도메인별 특수 표기법 지원 제한적
- 생성 시간이 수 분 소요
하지만 AI 연구 워크플로우 자동화의 마지막 퍼즐 조각으로서 의미가 큽니다. 논문 작성의 전 과정이 AI 지원을 받을 수 있는 시대가 다가오고 있습니다.
리소스
- 논문: PaperBanana: Automating Academic Illustration for AI Scientists
- 저자: Google Research, 북경대학교