autoresearch 실전 — GPU 하나로 밤새 실험 돌리기
환경 설정부터 에이전트 실행, 밤새 100개 실험 결과 분석까지. 작은 GPU에서도 돌리는 튜닝 가이드와 실전 팁.

autoresearch 실전 — GPU 하나로 밤새 실험 돌리기
Part 1에서 Karpathy의 autoresearch가 어떤 구조인지 살펴봤습니다. 세 줄 요약하면 이렇습니다.
train.py하나에 GPT 모델 + 옵티마이저 + 훈련 루프가 들어 있다.- AI 에이전트(Claude Code 등)가 이 파일을 수정하고, 5분간 훈련하고, val_bpb가 개선되면 유지(keep), 아니면 폐기(discard)한다.
program.md가 에이전트의 행동 규칙을 정의한다. 사람은 이 마크다운만 편집한다.
Part 2에서는 직접 환경을 세팅하고, 에이전트를 띄우고, 밤새 돌린 결과를 분석하는 과정을 다룹니다.
환경 설정 — 시작하기
요구사항
| 항목 | 최소 | 권장 |
|---|---|---|
| GPU | NVIDIA GPU (CUDA 지원) | H100 80GB |
| Python | 3.10+ | 3.12 |
| 패키지 매니저 | uv | uv |
| 에이전트 | Claude Code 또는 Codex | Claude Code |
H100이 아니어도 됩니다. 4090, A100, 3090 등에서도 돌아갑니다. 다만 5분 고정 시간 예산 안에 처리하는 토큰 수가 달라집니다. GPU별 튜닝 방법은 뒤에서 따로 다룹니다.
관련 포스트

AI Tools
Paperclip — AI 에이전트로 "무인 회사"를 운영하는 오픈소스 프레임워크
3주 만에 GitHub 3만 스타. AI 에이전트들을 조직도, 예산, 거버넌스로 관리하는 오픈소스 멀티에이전트 오케스트레이션 플랫폼. Heartbeat 시스템, 에이전트별 월 예산, 회사 템플릿까지.

AI Tools
AgentScope 프로덕션 배포 — Runtime, 모니터링, 스케일링
agentscope-runtime Docker 배포, OpenTelemetry 트레이싱, AgentScope Studio, RL 파인튜닝, 프로덕션 체크리스트.

AI Tools
AgentScope 실시간 음성 에이전트 — 3가지 음성 AI 앱 직접 만들기
음성 챗봇, AI 동시통역기, 음성 CS 봇 — RealtimeAgent + Gradio로 3가지 실전 음성 앱 직접 구축.