Halaman ini berisi kuota penggunaan dan batas yang berlaku saat menggunakan Cloud Run.
Jumlah resource pada Cloud Run terbatas. Kuota untuk Cloud Run mencakup batas kapasitas API, yang memengaruhi tingkat panggilan ke Cloud Run Admin API.
Tidak ada batasan langsung untuk:
- Ukuran image container yang dapat Anda deploy.
- Jumlah permintaan serentak yang disalurkan oleh layanan Cloud Run.
Batas resource untuk Cloud Run
Untuk melampaui batas yang dapat ditingkatkan, minta penambahan kuota. Untuk melampaui batas per project yang tidak dapat ditingkatkan, buat resource baru di project atau region Google Cloud yang berbeda.
Resource | Cakupan | Deskripsi | Batas | Dapat ditingkatkan |
---|---|---|---|---|
Layanan | per project dan region | Jumlah layanan maksimum | 1000 | Tidak |
Tugas | per project dan region | Jumlah maksimum tugas | 1000 | Tidak |
Pelaksanaan tugas | per project dan region | Jumlah maksimum eksekusi Tugas yang berjalan | 1000 | Tidak |
Revisi | per layanan | Jumlah maksimum revisi per layanan. Setelah batas tercapai, revisi yang tidak ditampilkan akan otomatis dihapus berdasarkan urutan historis | 1000 | Tidak |
Revisi | per project dan region | Jumlah maksimum revisi yang menampilkan traffic | 4000 | Tidak |
Tag revisi | per project dan region | Jumlah maksimum tag revisi. Jika batas tag revisi terlampaui, Cloud Run akan menjalankan pembersihan tag di layanan. Untuk layanan yang tag barunya sedang dibuat, tag yang tidak memiliki persentase traffic yang ditentukan akan otomatis dihapus berdasarkan urutan historis. | 2000 | Tidak |
Pelaksanaan tugas | per tugas | Batas retensi untuk eksekusi tugas yang telah selesai. Jika jumlah eksekusi yang selesai untuk sebuah tugas mencapai batas ini, eksekusi akan otomatis dihapus dalam urutan historis | 1.000 | Tidak |
Tugas eksekusi job1 | per eksekusi tugas | Jumlah maksimum tugas yang dijalankan secara paralel | Bergantung pada region serta konfigurasi CPU dan memori yang dipilih. Batas ini mungkin lebih besar di region dengan kapasitas tinggi atau lebih rendah di region yang baru dibuka. | Ya |
Tugas eksekusi job | per eksekusi tugas | Nilai maksimum waktu tunggu tugas | 168 jam (7 hari)3 | Tidak |
Tugas eksekusi job | per eksekusi tugas | Jumlah maksimum tugas dalam satu job | 10.000 | Tidak |
Tugas eksekusi job | per eksekusi tugas | Jumlah maksimum percobaan ulang tugas dalam sebuah job | 10 | Tidak |
Variabel lingkungan | per tugas atau per layanan | Jumlah maksimum variabel lingkungan untuk setiap penampung | 1000 | Tidak |
Argumen perintah | per tugas atau per layanan | Jumlah maksimum argumen perintah untuk setiap penampung | 1000 | Tidak |
Instance penampung1 | per revisi | Jumlah maksimum instance container | Bergantung pada region serta CPU dan memori yang dipilih. Batas ini mungkin lebih besar di region dengan kapasitas tinggi atau lebih rendah di region yang baru dibuka. | Ya |
Instance penampung1 | per project dan region | Jumlah maksimum instance container dari semua eksekusi tugas yang sedang berjalan | Bergantung pada region serta konfigurasi CPU dan memori yang dipilih. Batas ini mungkin lebih besar di region dengan kapasitas tinggi atau lebih rendah di region yang baru dibuka. | Ya |
Instance penampung2 | per revisi dan region | Jumlah maksimum instance container yang menggunakan traffic keluar VPC Langsung | 100-200, bergantung pada konfigurasi region yang dipilih. | Ya |
Instance container | per instance container | Waktu tunggu Startup, dalam menit | 4 | Tidak |
Memori | per instance container | Ukuran memori maksimum, dalam GiB | 32 | Tidak |
CPU | per instance container | Jumlah maksimum vCPU | 8 | Tidak |
CPU | per project dan region | Total CPU maksimum, dalam milli vCPU, yang dialokasikan di semua instance selama periode 1 menit. | Bergantung pada region yang dipilih. Batas ini mungkin lebih besar di region dengan kapasitas tinggi atau lebih rendah di region yang baru dibuka. | Ya |
Memori | per project dan region | Total memori maksimum, dalam byte, yang dialokasikan di semua instance selama periode 1 menit. | Bergantung pada region yang dipilih. Batas ini mungkin lebih besar di region dengan kapasitas tinggi atau lebih rendah di region yang baru dibuka. | Ya |
Instance GPU3 | per project per region | Jumlah maksimum instance container dengan GPU | 03 | Ya |
Disk | per instance container | Maksimumsistem file dalam memori yang dapat ditulis, dibatasi oleh memori instance, dalam GiB | 32 | Tidak |
Variabel lingkungan | per variabel | Panjang variabel maksimum, dalam Kb | 32 | Tidak |
Pemetaan domain | per top domain dan per week | Jumlah maksimum sertifikat SSL | 50 | Tidak |
Pemetaan domain | per top domain dan per week | Jumlah maksimum sertifikat SSL duplikat | 5 | Tidak |
Token akses | per instance container per detik | Jumlah maksimum token akses unik yang dibuat | 50 | Tidak |
Token identitas | per instance container per detik | Jumlah maksimum token identitas unik yang dibuat | 50 | Tidak |
File dibuka | per instance container | Jumlah maksimum file yang dapat dibuka secara bersamaan. Sesuai dengan /proc/sys/fs/file-max . |
25000 | Tidak |
1Kuota regional ini digunakan dalam beberapa kasus:
Atribut ini mengontrol nilai maksimum yang dapat dipilih untuk atribut instance maksimum revisi. Setelah diberikan di region tertentu, semua revisi di region tersebut dapat mencapai batas yang diberikan.
Class ini mengontrol paralelisme maksimum sebuah tugas. Setelah diberikan di wilayah tertentu, semua tugas di region tersebut dapat mencapai batas yang diberikan.
Kontrol ini mengontrol total instance container untuk menjalankan eksekusi tugas di suatu region.
2Kuota regional ini digunakan dalam beberapa kasus:
Atribut ini mengontrol nilai maksimum yang dapat dipilih untuk atribut instance maksimum revisi menggunakan traffic keluar VPC Langsung. Setelah diberikan di region tertentu, semua revisi di region tersebut dapat mencapai batas yang diberikan.
Class ini mengontrol paralelisme maksimum tugas menggunakan Traffic keluar VPC langsung. Setelah diberikan di region tertentu, semua tugas di region tersebut dapat mencapai batas yang diberikan.
3
Untuk mengakses GPU, Anda harus meminta peningkatan kuota untuk Total Nvidia L4 GPU allocation, per project per region
.
3Dukungan untuk waktu tunggu lebih dari 24 jam tersedia di Pratinjau.
Batas jaringan untuk Cloud Run
Batas permintaan untuk Cloud Run
Deskripsi | Batas | Catatan |
---|---|---|
Jumlah maksimum permintaan serentak per instance | 1000 | |
Jumlah maksimum streaming serentak per koneksi klien HTTP/2 | 100 | |
Waktu maksimum sebelum waktu tunggu habis per permintaan | 60 menit | |
Ukuran permintaan HTTP/1 maksimum | 32 MiB jika menggunakan server HTTP/1. Tidak ada batas jika menggunakan server HTTP/2. | |
Ukuran respons HTTP/1 maksimum | 32 MiB jika tidak menggunakan Transfer-Encoding: chunked atau mekanisme streaming |
|
Koneksi keluar per detik per instance | 700 | |
Resolusi DNS keluar per detik per instance | 1000 | |
Permintaan masuk per detik ke port container HTTP/1 per instance | 800 | Tidak berlaku untuk port container HTTP/2. |
Batas bandwidth untuk Cloud Run
Batas bandwidth berikut berlaku untuk instance Cloud Run:
Deskripsi | Batas | Catatan |
---|---|---|
Bit maksimum per instance untuk traffic keluar melalui VPC Langsung | 1 Gbps | Traffic keluar melalui traffic keluar VPC Langsung ke tujuan di jaringan VPC. |
Bit maksimum per instance, tidak termasuk traffic keluar melalui VPC Langsung | 600 Mbps | Berdasarkan jumlah bit masuk dan keluar, tidak termasuk traffic keluar melalui traffic keluar VPC Langsung ke tujuan di jaringan VPC. |
Total tarif paket maksimum per instance, tidak termasuk traffic keluar melalui VPC Langsung | 64.000 paket per detik | Berdasarkan jumlah paket masuk dan paket keluar, tidak termasuk traffic keluar melalui traffic keluar VPC Langsung ke tujuan di jaringan VPC. |
Jika salah satu dari dua batas tersebut tercapai, instance Cloud Run akan memiliki bandwidth yang terbatas.
Batas kapasitas Cloud Run Admin API
Batas kapasitas berikut berlaku untuk Cloud Run Admin API. Batasan ini tidak berlaku untuk permintaan yang mencapai layanan Cloud Run yang di-deploy.
Kuota | Deskripsi | Batas | Bisa ditingkatkan | Cakupan |
---|---|---|---|---|
Permintaan baca Cloud Run Admin API | Jumlah operasi baca API per 60 detik per region. Ini bukan jumlah permintaan baca ke layanan Cloud Run Anda, yang mana itu tidak terbatas. | 3.000 per 60 detik | Ya | per project dan region |
Permintaan tulis Cloud Run Admin API | Jumlah operasi tulis API per 60 detik per region. Ini bukan jumlah permintaan tulis ke layanan Cloud Run Anda, yang mana itu tidak terbatas. | 180 per 60 detik | Ya | per project dan region |
Pemrosesan Tugas | Frekuensi maksimum tugas dapat dijalankan per 60 detik per region. | 180 per 60 detik | Ya | per project dan region |
Cara menambah kuota
Untuk meminta nilai kuota yang lebih tinggi, ikuti langkah-langkah berikut:Buka halaman Quotas & System Limits:
Temukan kuota yang ingin Anda tambah di kolom Kuota. Anda dapat menggunakan kotak penelusuran Filter untuk menelusuri kuota.
Centang kotak di samping kuota yang ingin Anda tingkatkan.
Klik
. Dialog Perubahan kuota akan muncul. Edit Opsional: Jika Anda ingin meningkatkan nilai kuota melebihi jumlah yang ditunjukkan di layar, pilih Minta kuota lebih tinggi. Isi formulir, kirim, dan lewati langkah-langkah yang tersisa.
Di formulir Perubahan kuota, masukkan penambahan kuota yang Anda inginkan di kolom Nilai baru. Jika kolom Request description muncul, masukkan deskripsi. Klik Done.
Jika Anda melihat kotak dengan teks "Saya mengerti bahwa permintaan ini akan menghapus penggantian apa pun", nilai kuota Anda ditetapkan di bawah default. Menyesuaikan nilai kuota ke atau di luar default akan menghapus penggantian. Untuk melanjutkan, centang kotak. Pelajari lebih lanjut penggantian kuota.
Jika tombol Next muncul, klik Next dan isi detail kontak Anda di layar berikutnya.
Klik Submit request.
Untuk mengetahui lebih lanjut cara kerja proses penambahan kuota, lihat Tentang permintaan penambahan kuota.
Membuat batch permintaan untuk nilai kuota yang lebih tinggi
Anda dapat mengelompokkan permintaan untuk kuota yang lebih tinggi dengan mencentang kotak di samping setiap kuota yang ingin disertakan. Pengelompokan permintaan dapat meningkatkan jumlah waktu yang diperlukan Google Cloud untuk meninjau permintaan Anda. Untuk mengurangi waktu peninjauan, kelompokkan permintaan penyesuaian kuota berdasarkan produk dan area. Misalnya, jika Anda ingin meminta penyesuaian pada kuota jaringan dan VM Compute Engine, buat satu permintaan untuk kuota jaringan dan permintaan lain untuk kuota VM Compute Engine.