smolagents documentation
Human-in-the-Loop: 사용자와 상호작용하며 에이전트 계획 수정하기
Human-in-the-Loop: 사용자와 상호작용하며 에이전트 계획 수정하기
이 페이지에서는 smolagents 라이브러리의 고급 사용법을 소개합니다. 특히 사용자와의 상호작용을 통한 계획 생성, 계획 수정, 그리고 에이전트 워크플로에서의 메모리 보존을 위한 Human-in-the-Loop (HITL) 접근 방식을 중점적으로 설명합니다.
예제는 examples/plan_customization/plan_customization.py의 코드를 기반으로 합니다.
개요
이 예제는 다음과 같은 Human-in-the-Loop 전략을 구현하는 방법을 안내합니다.
- 단계 콜백(step callback)을 사용하여 계획 생성 후 에이전트 실행 중단하기
- 사용자가 실행 전에 에이전트의 계획을 검토하고 수정할 수 있도록 지원 (Human-in-the-Loop)
- 에이전트의 메모리를 보존하면서 실행 재개하기
- 사용자 피드백을 기반으로 계획을 동적으로 업데이트하여 사용자가 제어권을 유지하도록 지원
핵심 개념
단계 콜백을 이용한 계획 중단
에이전트가 계획을 생성한 후 일시 중지하도록 설정할 수 있습니다. 이는 PlanningStep에 단계 콜백을 등록하여 구현합니다.
agent = CodeAgent(
model=InferenceClientModel(),
tools=[DuckDuckGoSearchTool()],
planning_interval=5, # 5단계마다 계획
step_callbacks={PlanningStep: interrupt_after_plan},
max_steps=10,
verbosity_level=1
)Human-in-the-Loop: 대화형 계획 검토 및 수정
에이전트가 계획을 생성하면, 콜백 함수가 해당 계획을 사용자에게 보여주고 다음 옵션 중 하나를 선택하도록 안내합니다.
- 계획 승인
- 계획 수정
- 실행 취소
예제 상호작용:
============================================================
🤖 에이전트 계획 생성됨
============================================================
1. 최근 AI 발전 사항 검색
2. 상위 결과 분석
3. 가장 중요한 3가지 돌파구 요약
4. 각 돌파구에 대한 소스 포함
============================================================
옵션을 선택하세요.
1. 계획 승인
2. 계획 수정
3. 취소
선택 (1-3):이 Human-in-the-Loop 단계를 통해 사용자는 실행이 계속되기 전에 개입하여 계획을 검토하고 수정할 수 있으며, 이를 통해 에이전트의 행동이 사용자의 의도와 일치하도록 보장할 수 있습니다.
사용자가 수정을 선택하면 계획을 직접 편집할 수 있으며, 업데이트된 계획은 이후 실행 단계에서 사용됩니다.
메모리 보존 및 실행 재개
reset=False 옵션으로 에이전트를 실행하면 이전의 모든 단계와 메모리가 보존됩니다. 이를 통해 중단 또는 계획 수정 후에도 실행을 이어서 진행할 수 있습니다.
# 첫 번째 실행 (중단될 수 있음)
agent.run(task, reset=True)
# 보존된 메모리로 재개
agent.run(task, reset=False)에이전트 메모리 검사
에이전트의 메모리를 검사하여 지금까지 수행된 모든 단계를 확인할 수 있습니다.
print(f"현재 메모리에 {len(agent.memory.steps)}개의 단계가 포함되어 있습니다.")
for i, step in enumerate(agent.memory.steps):
step_type = type(step).__name__
print(f" {i+1}. {step_type}")Human-in-the-Loop 워크플로우 예시
- 에이전트가 복잡한 작업을 받아 실행을 시작합니다.
- 계획 단계가 생성되고, 사용자 검토를 위해 실행이 일시 중지됩니다.
- 사용자가 계획을 검토하고 필요에 따라 수정합니다 (Human-in-the-Loop).
- 승인되거나 수정된 계획으로 실행을 재개합니다.
- 모든 단계는 향후 실행을 위해 보존되어 투명성과 제어권을 보장합니다.
오류 처리
예제는 다음에 대한 오류 처리를 포함합니다.
- 사용자 취소
- 계획 수정 오류
- 실행 재개 실패
요구사항
- smolagents 라이브러리
- DuckDuckGoSearchTool (smolagents에 포함)
- InferenceClientModel (🤗 Hugging Face API 토큰 필요)
교육적 가치
이 예제는 다음을 시연합니다.
- 사용자 정의 에이전트 동작을 위한 단계 콜백 구현 방법
- 다중 단계 에이전트의 메모리 관리 기법
- 에이전트 시스템의 사용자 상호작용 패턴
- 동적 에이전트 제어를 위한 계획 수정 기법
- 대화형 에이전트 시스템의 오류 처리 방법
전체 코드는 examples/plan_customization에서 확인하세요.