인스턴스당 최대 동시 요청 수 설정에 대해 알아보려면 개념 문서를 참조하세요.
필요한 역할
Cloud Run 서비스를 구성하고 배포하는 데 필요한 권한을 얻으려면 관리자에게 다음 IAM 역할을 부여해 달라고 요청하세요.
- 
  
  
    
      Cloud Run 서비스에 대한 Cloud Run 개발자(roles/run.developer) 역할
- 
  
  
    
      서비스 ID에 대한 서비스 계정 사용자(roles/iam.serviceAccountUser) 역할
소스 코드에서 서비스 또는 함수를 배포하는 경우 프로젝트 및 Cloud Build 서비스 계정에 추가 역할이 부여되어 있어야 합니다.
Cloud Run과 연결된 IAM 역할 및 권한 목록은 Cloud Run IAM 역할 및 Cloud Run IAM 권한을 참조하세요. Cloud Run 서비스가 Cloud 클라이언트 라이브러리와 같은Google Cloud API와 상호작용하는 경우에는 서비스 ID 구성 가이드를 참조하세요. 역할 부여에 대한 자세한 내용은 배포 권한 및 액세스 관리를 참조하세요.
인스턴스당 최대 동시 요청 수 구성
구성을 변경하면 새 버전이 생성됩니다. 이를 변경하는 명시적 업데이트가 없으면 이후 버전에도 이 구성 설정이 자동으로 적용됩니다.
Cloud Run 서비스의 경우 새 서비스를 만들거나 새 버전을 배포할 때 Google Cloud 콘솔, gcloud 명령줄 또는 .yaml 파일을 사용하여 인스턴스당 최대 동시 요청 수를 설정할 수 있습니다.
콘솔
- Google Cloud 콘솔에서 Cloud Run으로 이동합니다. 
- 메뉴에서 서비스를 선택하고 컨테이너 배포를 클릭하여 새 서비스를 구성합니다. 기존 서비스를 구성하는 경우 서비스를 클릭한 후 새 버전 수정 및 배포를 클릭합니다. 
- 새 서비스를 구성하는 경우 초기 서비스 설정 페이지를 작성한 후 컨테이너, 볼륨, 네트워킹, 보안을 클릭하여 서비스 구성 페이지를 펼칩니다. 
- 컨테이너 탭을 클릭합니다. - 컨테이너당 최대 요청 수 텍스트 상자에 인스턴스당 원하는 최대 동시 요청 수를 설정합니다.
 
- 만들기 또는 배포를 클릭합니다. 
gcloud
인스턴스당 최대 동시 요청 수를 설정하려면 다음 명령어를 사용하세요.
gcloud run services update SERVICE --concurrency CONCURRENCY
다음을 바꿉니다.
- SERVICE를 서비스 이름으로 바꿉니다.
- CONCURRENCY: 인스턴스당 최대 동시 요청 수입니다. 예를 들어 다음은 최대 1개의 동시 요청 수를 설정합니다. - gcloud run services update SERVICE --concurrency 1 
지정된 서비스의 인스턴스당 최대 동시 요청 수를 변경하면 새 버전에 이 설정이 적용됩니다.
기본 최대 동시 요청 수(80)로 되돌리려면 다음 명령어를 사용합니다.
gcloud run services update SERVICE --concurrency default
SERVICE을 구성 중인 서비스의 이름으로 바꿉니다.
YAML
- 새 서비스를 만드는 경우에는 이 단계를 건너뜁니다. 기존 서비스를 업데이트하는 경우 YAML 구성을 다운로드합니다. - gcloud run services describe SERVICE --format export > service.yaml 
- containerConcurrency속성을 업데이트합니다.- apiVersion: serving.knative.dev/v1 kind: Service metadata: name: SERVICE spec: template: metadata: name: REVISION spec: containerConcurrency: CONCURRENCY - 다음을 바꿉니다. - SERVICE: Cloud Run 서비스 이름
- IMAGE_URL: 컨테이너 이미지에 대한 참조(예: us-docker.pkg.dev/cloudrun/container/hello:latest). Artifact Registry를 사용하는 경우 저장소 REPO_NAME이 이미 생성되어 있어야 합니다. URL은LOCATION-docker.pkg.dev/PROJECT_ID/REPO_NAME/PATH:TAG형식을 따릅니다.
- CONCURRENCY: 인스턴스당 최대 동시 요청 수입니다.
- REVISION을 새 버전 이름으로 변경하거나 이미 있는 경우 삭제합니다. 새 버전 이름을 제공할 경우 다음 기준을 반드시 충족해야 합니다.- SERVICE-로 시작해야 합니다.
- 소문자, 숫자, -만 포함합니다.
- -로 끝나면 안 됩니다.
- 63자(영문 기준) 이하여야 합니다.
 
 
- 다음 명령어를 사용하여 서비스를 만들거나 업데이트합니다. - gcloud run services replace service.yaml 
Terraform
Terraform 구성을 적용하거나 삭제하는 방법은 기본 Terraform 명령어를 참조하세요.
Terraform 구성에서 다음을google_cloud_run_v2_service 리소스에 추가합니다.80을 원하는 최대 동시 요청 수로 바꿉니다.
동시 실행 설정 보기
Cloud Run 서비스의 현재 동시 실행 설정을 보려면 다음 안내를 따르세요.
콘솔
- Google Cloud 콘솔에서 Cloud Run으로 이동합니다. 
- 관심이 있는 서비스를 클릭하여 서비스 세부정보 페이지를 엽니다. 
- 버전 탭을 클릭합니다. 
- 오른쪽의 세부정보 패널에서 동시 실행 설정이 컨테이너 탭에 표시됩니다. 
gcloud
- 다음 명령어를 사용하세요. - gcloud run services describe SERVICE 
- 반환된 구성에서 동시 실행 설정을 찾습니다.