Kuota dan Batas Cloud Run

Halaman ini berisi kuota penggunaan dan batas yang berlaku saat menggunakan Cloud Run.

Jumlah resource pada Cloud Run terbatas. Kuota untuk Cloud Run mencakup batas kapasitas API, yang memengaruhi tingkat panggilan ke Cloud Run Admin API.

Tidak ada batasan langsung untuk:

  • Ukuran image container yang dapat Anda deploy.
  • Jumlah permintaan serentak yang disalurkan oleh layanan Cloud Run.

Batas resource untuk Cloud Run

Untuk melampaui batas yang dapat ditingkatkan, minta penambahan kuota. Untuk melampaui batas per project yang tidak dapat ditingkatkan, buat resource baru di project atau region Google Cloud yang berbeda.

Resource Cakupan Deskripsi Batas Dapat ditingkatkan
Layanan per project dan region Jumlah layanan maksimum 1000 Tidak
Tugas per project dan region Jumlah maksimum tugas 1000 Tidak
Pelaksanaan tugas per project dan region Jumlah maksimum eksekusi Tugas yang berjalan 1000 Tidak
Revisi per layanan Jumlah maksimum revisi per layanan. Setelah batas tercapai, revisi yang tidak ditampilkan akan otomatis dihapus berdasarkan urutan historis 1000 Tidak
Revisi per project dan region Jumlah maksimum revisi yang menampilkan traffic 4000 Tidak
Tag revisi per project dan region Jumlah maksimum tag revisi. Jika batas tag revisi terlampaui, Cloud Run akan menjalankan pembersihan tag di layanan. Untuk layanan yang tag barunya sedang dibuat, tag yang tidak memiliki persentase traffic yang ditentukan akan otomatis dihapus berdasarkan urutan historis. 2000 Tidak
Pelaksanaan tugas per tugas Batas retensi untuk eksekusi tugas yang telah selesai. Jika jumlah eksekusi yang selesai untuk sebuah tugas mencapai batas ini, eksekusi akan otomatis dihapus dalam urutan historis 1.000 Tidak
Tugas eksekusi job1 per eksekusi tugas Jumlah maksimum tugas yang dijalankan secara paralel Bergantung pada region serta konfigurasi CPU dan memori yang dipilih. Batas ini mungkin lebih besar di region dengan kapasitas tinggi atau lebih rendah di region yang baru dibuka. Ya
Tugas eksekusi job per eksekusi tugas Nilai maksimum waktu tunggu tugas 168 jam (7 hari)3 Tidak
Tugas eksekusi job per eksekusi tugas Jumlah maksimum tugas dalam satu job 10.000 Tidak
Tugas eksekusi job per eksekusi tugas Jumlah maksimum percobaan ulang tugas dalam sebuah job 10 Tidak
Variabel lingkungan per tugas atau per layanan Jumlah maksimum variabel lingkungan untuk setiap penampung 1000 Tidak
Argumen perintah per tugas atau per layanan Jumlah maksimum argumen perintah untuk setiap penampung 1000 Tidak
Instance penampung1 per revisi Jumlah maksimum instance container Bergantung pada region serta CPU dan memori yang dipilih. Batas ini mungkin lebih besar di region dengan kapasitas tinggi atau lebih rendah di region yang baru dibuka. Ya
Instance penampung1 per project dan region Jumlah maksimum instance container dari semua eksekusi tugas yang sedang berjalan Bergantung pada region serta konfigurasi CPU dan memori yang dipilih. Batas ini mungkin lebih besar di region dengan kapasitas tinggi atau lebih rendah di region yang baru dibuka. Ya
Instance penampung2 per revisi dan region Jumlah maksimum instance container yang menggunakan traffic keluar VPC Langsung 100-200, bergantung pada konfigurasi region yang dipilih. Ya
Instance container per instance container Waktu tunggu Startup, dalam menit 4 Tidak
Memori per instance container Ukuran memori maksimum, dalam GiB 32 Tidak
CPU per instance container Jumlah maksimum vCPU 8 Tidak
CPU per project dan region Total CPU maksimum, dalam milli vCPU, yang dialokasikan di semua instance selama periode 1 menit. Bergantung pada region yang dipilih. Batas ini mungkin lebih besar di region dengan kapasitas tinggi atau lebih rendah di region yang baru dibuka. Ya
Memori per project dan region Total memori maksimum, dalam byte, yang dialokasikan di semua instance selama periode 1 menit. Bergantung pada region yang dipilih. Batas ini mungkin lebih besar di region dengan kapasitas tinggi atau lebih rendah di region yang baru dibuka. Ya
Instance GPU3 per project per region Jumlah maksimum instance container dengan GPU 03 Ya
Disk per instance container Maksimumsistem file dalam memori yang dapat ditulis, dibatasi oleh memori instance, dalam GiB 32 Tidak
Variabel lingkungan per variabel Panjang variabel maksimum, dalam Kb 32 Tidak
Pemetaan domain per top domain dan per week Jumlah maksimum sertifikat SSL 50 Tidak
Pemetaan domain per top domain dan per week Jumlah maksimum sertifikat SSL duplikat 5 Tidak
Token akses per instance container per detik Jumlah maksimum token akses unik yang dibuat 50 Tidak
Token identitas per instance container per detik Jumlah maksimum token identitas unik yang dibuat 50 Tidak
File dibuka per instance container Jumlah maksimum file yang dapat dibuka secara bersamaan. Sesuai dengan
/proc/sys/fs/file-max.
25000 Tidak

1Kuota regional ini digunakan dalam beberapa kasus:

  1. Atribut ini mengontrol nilai maksimum yang dapat dipilih untuk atribut instance maksimum revisi. Setelah diberikan di region tertentu, semua revisi di region tersebut dapat mencapai batas yang diberikan.

  2. Class ini mengontrol paralelisme maksimum sebuah tugas. Setelah diberikan di wilayah tertentu, semua tugas di region tersebut dapat mencapai batas yang diberikan.

  3. Kontrol ini mengontrol total instance container untuk menjalankan eksekusi tugas di suatu region.

2Kuota regional ini digunakan dalam beberapa kasus:

  1. Atribut ini mengontrol nilai maksimum yang dapat dipilih untuk atribut instance maksimum revisi menggunakan traffic keluar VPC Langsung. Setelah diberikan di region tertentu, semua revisi di region tersebut dapat mencapai batas yang diberikan.

  2. Class ini mengontrol paralelisme maksimum tugas menggunakan Traffic keluar VPC langsung. Setelah diberikan di region tertentu, semua tugas di region tersebut dapat mencapai batas yang diberikan.

3 Untuk mengakses GPU, Anda harus meminta peningkatan kuota untuk Total Nvidia L4 GPU allocation, per project per region.

3Dukungan untuk waktu tunggu lebih dari 24 jam tersedia di Pratinjau.

Batas jaringan untuk Cloud Run

Batas permintaan untuk Cloud Run

Deskripsi Batas Catatan
Jumlah maksimum permintaan serentak per instance 1000
Jumlah maksimum streaming serentak per koneksi klien HTTP/2 100
Waktu maksimum sebelum waktu tunggu habis per permintaan 60 menit
Ukuran permintaan HTTP/1 maksimum 32 MiB jika menggunakan server HTTP/1. Tidak ada batas jika menggunakan server HTTP/2.
Ukuran respons HTTP/1 maksimum 32 MiB jika tidak menggunakan Transfer-Encoding: chunked atau mekanisme streaming
Koneksi keluar per detik per instance 700
Resolusi DNS keluar per detik per instance 1000
Permintaan masuk per detik ke port container HTTP/1 per instance 800 Tidak berlaku untuk port container HTTP/2.

Batas bandwidth untuk Cloud Run

Batas bandwidth berikut berlaku untuk instance Cloud Run:

Deskripsi Batas Catatan
Bit maksimum per instance untuk traffic keluar melalui VPC Langsung 1 Gbps Traffic keluar melalui traffic keluar VPC Langsung ke tujuan di jaringan VPC.
Bit maksimum per instance, tidak termasuk traffic keluar melalui VPC Langsung 600 Mbps Berdasarkan jumlah bit masuk dan keluar, tidak termasuk traffic keluar melalui traffic keluar VPC Langsung ke tujuan di jaringan VPC.
Total tarif paket maksimum per instance, tidak termasuk traffic keluar melalui VPC Langsung 64.000 paket per detik Berdasarkan jumlah paket masuk dan paket keluar, tidak termasuk traffic keluar melalui traffic keluar VPC Langsung ke tujuan di jaringan VPC.

Jika salah satu dari dua batas tersebut tercapai, instance Cloud Run akan memiliki bandwidth yang terbatas.

Batas kapasitas Cloud Run Admin API

Batas kapasitas berikut berlaku untuk Cloud Run Admin API. Batasan ini tidak berlaku untuk permintaan yang mencapai layanan Cloud Run yang di-deploy.

Kuota Deskripsi Batas Bisa ditingkatkan Cakupan
Permintaan baca Cloud Run Admin API Jumlah operasi baca API per 60 detik per region. Ini bukan jumlah permintaan baca ke layanan Cloud Run Anda, yang mana itu tidak terbatas. 3.000 per 60 detik Ya per project dan region
Permintaan tulis Cloud Run Admin API Jumlah operasi tulis API per 60 detik per region. Ini bukan jumlah permintaan tulis ke layanan Cloud Run Anda, yang mana itu tidak terbatas. 180 per 60 detik Ya per project dan region
Pemrosesan Tugas Frekuensi maksimum tugas dapat dijalankan per 60 detik per region. 180 per 60 detik Ya per project dan region

Cara menambah kuota

Untuk meminta nilai kuota yang lebih tinggi, ikuti langkah-langkah berikut:

  1. Buka halaman Quotas & System Limits:

    Buka Kuota & Batasan Sistem

  2. Temukan kuota yang ingin Anda tambah di kolom Kuota. Anda dapat menggunakan kotak penelusuran Filter untuk menelusuri kuota.

  3. Centang kotak di samping kuota yang ingin Anda tingkatkan.

  4. Klik Edit. Dialog Perubahan kuota akan muncul.

  5. Opsional: Jika Anda ingin meningkatkan nilai kuota melebihi jumlah yang ditunjukkan di layar, pilih Minta kuota lebih tinggi. Isi formulir, kirim, dan lewati langkah-langkah yang tersisa.

  6. Di formulir Perubahan kuota, masukkan penambahan kuota yang Anda inginkan di kolom Nilai baru. Jika kolom Request description muncul, masukkan deskripsi. Klik Done.

    Jika Anda melihat kotak dengan teks "Saya mengerti bahwa permintaan ini akan menghapus penggantian apa pun", nilai kuota Anda ditetapkan di bawah default. Menyesuaikan nilai kuota ke atau di luar default akan menghapus penggantian. Untuk melanjutkan, centang kotak. Pelajari lebih lanjut penggantian kuota.

    Jika tombol Next muncul, klik Next dan isi detail kontak Anda di layar berikutnya.

  7. Klik Submit request.

Untuk mengetahui lebih lanjut cara kerja proses penambahan kuota, lihat Tentang permintaan penambahan kuota.

Membuat batch permintaan untuk nilai kuota yang lebih tinggi

Anda dapat mengelompokkan permintaan untuk kuota yang lebih tinggi dengan mencentang kotak di samping setiap kuota yang ingin disertakan. Pengelompokan permintaan dapat meningkatkan jumlah waktu yang diperlukan Google Cloud untuk meninjau permintaan Anda. Untuk mengurangi waktu peninjauan, kelompokkan permintaan penyesuaian kuota berdasarkan produk dan area. Misalnya, jika Anda ingin meminta penyesuaian pada kuota jaringan dan VM Compute Engine, buat satu permintaan untuk kuota jaringan dan permintaan lain untuk kuota VM Compute Engine.