Claim: Long-running agent work needs human approval touchpoints
주장
코딩 에이전트가 장시간 작업을 수행할수록, 사람의 역할은 사라지는 것이 아니라 짧고 정확한 승인/검토 touchpoint로 바뀐다.
근거
- OpenAI는 Codex mobile preview에서 질문 응답, 방향 전환, 승인, diff/test 결과 확인을 모바일에서 이어가는 사용 패턴을 설명한다.
근거 수준
- Tier A:
s11-openai-codex-mobile - Tier B:
- Tier C:
반론 / 의심
- 모바일 승인 흐름이 복잡한 코드 리뷰나 보안 검토에는 부족할 수 있다.
- OpenAI 제품 발표 기반이라, 일반 에이전트 운영 원칙으로 확대하려면 다른 출처가 필요하다.
반대 근거
-
검증 방법
- 실제 작업 로그에서 모바일 승인 후 rework 감소 여부를 측정한다.
- 모바일 승인 가능 작업과 desktop review가 필요한 작업을 분리한다.
사용 가이드
현재는 unverified다. 글에서는 "OpenAI는 이런 방향을 제시했다" 수준으로만 쓴다.
상태 변경 기록
- 2026-05-15: Source Card 1개 기반으로 생성.