AgentScope 실시간 음성 에이전트 — OpenAI/Gemini/DashScope Realtime API
TTS 모델 6종, RealtimeAgent, 음성+도구 결합, 멀티모달 파이프라인으로 실시간 음성 에이전트 구축.

AgentScope 실시간 음성 에이전트 — OpenAI/Gemini/DashScope Realtime API
텍스트 에이전트의 한계는 명확합니다. 고객이 전화로 문의하면? 운전 중에 에이전트를 써야 하면? 시각 장애인 사용자가 접근하려면?
AgentScope는 실시간 음성 에이전트를 일급 기능으로 지원합니다. OpenAI, Gemini, DashScope의 Realtime API를 동일한 인터페이스로 사용하고, 기존 도구와 파이프라인을 그대로 음성 에이전트에 연결할 수 있습니다.
시리즈: Part 1: 시작하기 | Part 2: 멀티 에이전트 | Part 3: MCP 서버 연동 | Part 4: RAG + 메모리 | Part 5 (이 글) | Part 6: 프로덕션 배포
1. 음성 에이전트 개요
관련 포스트

AI Tools
AgentScope 프로덕션 배포 — Runtime, 모니터링, 스케일링
agentscope-runtime Docker 배포, OpenTelemetry 트레이싱, AgentScope Studio, RL 파인튜닝, 프로덕션 체크리스트.

AI Tools
AgentScope RAG + 메모리 아키텍처 — 지식 기반 에이전트 만들기
KnowledgeBase, 벡터 저장소(Qdrant/Milvus), ReMe 장기 메모리로 지식 기반 에이전트 구축.

AI Tools
AgentScope MCP 서버 연동 — 외부 도구 통합 실전
MCP 클라이언트(Stdio/HTTP)로 외부 도구 연동, A2A 프로토콜로 크로스 프레임워크 통신, 커스텀 MCP 서버 구축.