나만의 autoresearch 만들기 — 다른 도메인에 자율 실험 적용하기
autoresearch 패턴을 텍스트 분류, 이미지 분류, RAG 파이프라인에 적용합니다. 범용 실험 러너와 program.md 템플릿 제공.

나만의 autoresearch 만들기 -- 다른 도메인에 자율 실험 적용하기
Karpathy의 autoresearch는 LLM 사전학습에 특화된 자율 실험 시스템입니다. Part 1에서 전체 구조를, Part 2에서 에이전트의 실험 전략과 결과 분석을 다뤘습니다. 여기까지 읽으셨다면 한 가지 질문이 떠오를 겁니다.
"이걸 내 문제에도 쓸 수 있을까?"
이번 글에서는 autoresearch의 핵심 패턴을 추출하고, 텍스트 분류, 이미지 분류, RAG 파이프라인이라는 세 가지 도메인에 적용하는 방법을 다룹니다. 마지막에는 범용 실험 러너 코드와 program.md 템플릿을 제공합니다.
시리즈: Part 1: 구조 분석 | Part 2: 실험 전략 | Part 3 (이 글)
autoresearch의 핵심 패턴 추출
autoresearch 전체를 관통하는 구조는 놀라울 정도로 단순합니다. 파일 3개, 규칙 5단계, 설계 원칙 몇 가지. 이것만 추출하면 어떤 ML 태스크에든 적용할 수 있습니다.
3-파일 아키텍처
autoresearch의 파일 구조를 역할별로 정리하면 다음과 같습니다.
| 파일 | 역할 | 수정 주체 |
|---|---|---|
prepare.py | 고정 인프라 (데이터, 평가, 유틸리티) | 인간 (최초 1회) |
train.py | 실험 대상 (모델, 하이퍼파라미터, 학습 루프) | 에이전트 (매 실험) |
program.md | 에이전트 프로토콜 (실험 규칙, 평가 기준) | 인간 (메타 최적화) |
관련 포스트

Paperclip — AI 에이전트로 "무인 회사"를 운영하는 오픈소스 프레임워크
3주 만에 GitHub 3만 스타. AI 에이전트들을 조직도, 예산, 거버넌스로 관리하는 오픈소스 멀티에이전트 오케스트레이션 플랫폼. Heartbeat 시스템, 에이전트별 월 예산, 회사 템플릿까지.

AgentScope 프로덕션 배포 — Runtime, 모니터링, 스케일링
agentscope-runtime Docker 배포, OpenTelemetry 트레이싱, AgentScope Studio, RL 파인튜닝, 프로덕션 체크리스트.

AgentScope 실시간 음성 에이전트 — 3가지 음성 AI 앱 직접 만들기
음성 챗봇, AI 동시통역기, 음성 CS 봇 — RealtimeAgent + Gradio로 3가지 실전 음성 앱 직접 구축.