autoresearch 실전 — GPU 하나로 밤새 실험 돌리기

Part 1에서 Karpathy의 autoresearch가 어떤 구조인지 살펴봤습니다. 세 줄 요약하면 이렇습니다.

train.py 하나에 GPT 모델 + 옵티마이저 + 훈련 루프가 들어 있다.
AI 에이전트(Claude Code 등)가 이 파일을 수정하고, 5분간 훈련하고, val_bpb가 개선되면 유지(keep), 아니면 폐기(discard)한다.
program.md가 에이전트의 행동 규칙을 정의한다. 사람은 이 마크다운만 편집한다.

Part 2에서는 직접 환경을 세팅하고, 에이전트를 띄우고, 밤새 돌린 결과를 분석하는 과정을 다룹니다.

환경 설정 — 시작하기

요구사항

항목	최소	권장
GPU	NVIDIA GPU (CUDA 지원)	H100 80GB
Python	3.10+	3.12
패키지 매니저	uv	uv
에이전트	Claude Code 또는 Codex	Claude Code

H100이 아니어도 됩니다. 4090, A100, 3090 등에서도 돌아갑니다. 다만 5분 고정 시간 예산 안에 처리하는 토큰 수가 달라집니다. GPU별 튜닝 방법은 뒤에서 따로 다룹니다.

git clone https://github.com/karpathy/autoresearch cd autoresearch # uv 패키지 매니저 설치 (이미 있으면 건너뜀) curl -LsSf https://astral.sh/uv/install.sh | sh # 의존성 설치 (PyTorch 2.9.1, pyarrow, rustbpe, tiktoken 등) uv sync # 데이터 다운로드 + 토크나이저 훈련 (~2분) uv run prepare.py

autoresearch 실전 — GPU 하나로 밤새 실험 돌리기

autoresearch 실전 — GPU 하나로 밤새 실험 돌리기

환경 설정 — 시작하기

요구사항

설치 및 데이터 준비

이어서 읽으려면 로그인이 필요합니다

관련 포스트

Google COSMO 해부 — 온디바이스 AI 에이전트의 새 아키텍처

스스로 진화하는 AI 에이전트 — 2026년의 새로운 패러다임

나만의 LLM Knowledge Base 구축하기 — Karpathy 스타일 지식 시스템