Claim: Long-running agent work needs human approval touchpoints

주장

코딩 에이전트가 장시간 작업을 수행할수록, 사람의 역할은 사라지는 것이 아니라 짧고 정확한 승인/검토 touchpoint로 바뀐다.

근거

  • OpenAI는 Codex mobile preview에서 질문 응답, 방향 전환, 승인, diff/test 결과 확인을 모바일에서 이어가는 사용 패턴을 설명한다.

근거 수준

  • Tier A: s11-openai-codex-mobile
  • Tier B:
  • Tier C:

반론 / 의심

  • 모바일 승인 흐름이 복잡한 코드 리뷰나 보안 검토에는 부족할 수 있다.
  • OpenAI 제품 발표 기반이라, 일반 에이전트 운영 원칙으로 확대하려면 다른 출처가 필요하다.

반대 근거

-

검증 방법

  • 실제 작업 로그에서 모바일 승인 후 rework 감소 여부를 측정한다.
  • 모바일 승인 가능 작업과 desktop review가 필요한 작업을 분리한다.

사용 가이드

현재는 unverified다. 글에서는 "OpenAI는 이런 방향을 제시했다" 수준으로만 쓴다.

상태 변경 기록

  • 2026-05-15: Source Card 1개 기반으로 생성.