Concept: Coding Agent Sandbox

정의

Coding Agent Sandbox는 코딩 에이전트가 파일 시스템과 네트워크에 접근할 때, workspace write와 외부 통신을 제한하는 실행 경계다.

쉽게 말하면, 에이전트에게 "이 방 안에서는 일해도 되지만, 방 밖의 물건은 만지지 말고 인터넷 문은 허락받기 전까지 열지 마"라고 정해두는 장치다. 좋은 말로 조심하라고 시키는 것이 아니라, 운영체제나 실행 도구가 실제로 못 하게 막는 쪽에 가깝다.

예를 들어 코딩 에이전트가 테스트를 돌리거나 파일을 고칠 수는 있어야 한다. 하지만 사용자의 다른 폴더를 마음대로 바꾸거나, 승인 없이 네트워크로 데이터를 보내면 안 된다. 샌드박스는 이 둘 사이의 경계를 만든다.

핵심 특징

  • 파일 읽기와 쓰기 권한을 분리한다.
  • workspace 또는 허용된 writable root 안에서만 변경을 허용한다.
  • 네트워크 접근은 기본 차단 또는 승인 기반으로 둔다.
  • 프롬프트 규칙이 아니라 OS/harness 수준의 제약이 필요하다.

비유

  • 놀이터의 모래상자: 아이가 안에서 마음껏 놀 수 있지만, 모래가 집 전체로 퍼지지 않게 경계가 있다.
  • 주방 작업대: 칼과 불을 쓰지만, 작업대 밖의 물건까지 건드리지 않게 구역을 나눈다.
  • 임시 작업실: 실패해도 피해가 작업실 안에 머물도록 만든다.

헷갈리기 쉬운 점

  • 샌드박스는 "에이전트를 믿는다"가 아니라 "에이전트가 실수해도 피해 범위를 줄인다"에 가깝다.
  • 승인 버튼과 샌드박스는 다르다. 승인은 사람이 허락하는 절차이고, 샌드박스는 허락되지 않은 행동을 기술적으로 막는 경계다.
  • 샌드박스가 있으면 모든 위험이 사라지는 것은 아니다. 네트워크 차단, 파일 권한, 실행 환경마다 빈틈과 tradeoff가 있다.

인용 출처

  • content/wiki/sources/s12-openai-codex-windows-sandbox.md

근거 수준

  • Tier A: OpenAI Windows sandbox engineering/security article
  • Tier B:
  • Tier C:

관련 엔티티

  • OpenAI
  • Codex
  • Windows

관련 개념

  • agent-permissions
  • network-restriction

관련 Claim

  • coding-agents-need-os-enforced-sandbox-boundaries

비교 페이지

-

우리 관점

(없음)

충돌하는 주장

(없음)

열린 질문

  • 콘텐츠 수집/발행 에이전트에는 코딩 에이전트 수준의 sandbox가 어디까지 필요한가?

마지막 검토

2026-05-15