ฟีเจอร์ "ค้นหาข้อมูลเกี่ยวกับสถานที่ตั้งปัจจุบัน" พร้อมให้บริการแล้วใน Google Search ดูข้อมูลเพิ่มเติม

หน้านี้ได้รับการแปลโดย Cloud Translation API

โมเดล Gemini

1.5 Flash

โมเดลมัลติโมดัลที่สมดุลที่สุดของเราซึ่งมีประสิทธิภาพยอดเยี่ยมสำหรับงานส่วนใหญ่

ป้อนเสียง รูปภาพ วิดีโอ และข้อความ แล้วรับคำตอบที่เป็นข้อความ
สร้างโค้ด ดึงข้อมูล แก้ไขข้อความ และอื่นๆ
เหมาะสำหรับงานที่ให้ความสำคัญกับทั้งประสิทธิภาพและต้นทุน

1.5 Flash-8B

โมเดลมัลติโมดัลที่เร็วที่สุดและคุ้มค่าที่สุดของเราที่มีประสิทธิภาพยอดเยี่ยมสำหรับงานที่มีความถี่สูง

ป้อนเสียง รูปภาพ วิดีโอ และข้อความ แล้วรับคำตอบที่เป็นข้อความ
สร้างโค้ด ดึงข้อมูล แก้ไขข้อความ และอื่นๆ
เหมาะสำหรับงานที่ต้องใช้ความเชี่ยวชาญน้อยแต่มีความถี่สูง

1.5 Pro

โมเดลมัลติโมดัลที่มีประสิทธิภาพดีที่สุดของเราพร้อมฟีเจอร์สําหรับงานการหาเหตุผลที่หลากหลาย

ป้อนเสียง รูปภาพ วิดีโอ และข้อความ แล้วรับคำตอบที่เป็นข้อความ
สร้างโค้ด ดึงข้อมูล แก้ไขข้อความ และอื่นๆ
สำหรับกรณีที่คุณต้องการเพิ่มประสิทธิภาพ

ตัวแปรของโมเดล

Gemini API มีรูปแบบต่างๆ ที่เพิ่มประสิทธิภาพสำหรับกรณีการใช้งานที่เฉพาะเจาะจง ภาพรวมคร่าวๆ ของตัวแปร Gemini ที่มีให้บริการมีดังนี้

ตัวแปรของโมเดล	อินพุต	เอาต์พุต	เพิ่มประสิทธิภาพสำหรับ
Gemini 1.5 Flash `gemini-1.5-flash`	เสียง รูปภาพ วิดีโอ และข้อความ	ข้อความ	ประสิทธิภาพที่รวดเร็วและหลากหลายสำหรับงานต่างๆ
Gemini 1.5 Flash-8B `gemini-1.5-flash-8b`	เสียง รูปภาพ วิดีโอ และข้อความ	ข้อความ	งานจำนวนมากและงานที่มีระดับปัญญาต่ำ
Gemini 1.5 Pro `gemini-1.5-pro`	เสียง รูปภาพ วิดีโอ และข้อความ	ข้อความ	งานที่มีเหตุผลที่ซับซ้อนซึ่งต้องใช้ความฉลาดมากขึ้น
Gemini 1.0 Pro (เลิกใช้งานแล้วเมื่อวันที่ 15/2/2025) `gemini-1.0-pro`	ข้อความ	ข้อความ	งานภาษาธรรมชาติ แชทข้อความและโค้ดแบบหลายรอบ รวมถึงการสร้างโค้ด
การฝังข้อความ `text-embedding-004`	ข้อความ	ข้อความที่ฝัง	การวัดความเกี่ยวข้องของสตริงข้อความ
AQA `aqa`	ข้อความ	ข้อความ	การให้คำตอบที่อิงตามแหล่งข้อมูล

Gemini 1.5 Flash

Gemini 1.5 Flash เป็นโมเดลสื่อหลากรูปแบบที่รวดเร็วและอเนกประสงค์สำหรับการปรับขนาดกับงานที่หลากหลาย

ลองใช้ AI Studio

รายละเอียดรุ่น

พร็อพเพอร์ตี้	คำอธิบาย
รหัสรุ่น	`models/gemini-1.5-flash`
ประเภทข้อมูลที่รองรับ	อินพุต เสียง รูปภาพ วิดีโอ และข้อความ เอาต์พุต ข้อความ
ขีดจํากัดโทเค็น^[*]	ขีดจํากัดโทเค็นอินพุต 1,048,576 ขีดจํากัดโทเค็นเอาต์พุต 8,192
ข้อกำหนดเฉพาะด้านเสียง/ภาพ	จำนวนรูปภาพสูงสุดต่อพรอมต์ 3,600 ความยาววิดีโอสูงสุด 1 ชั่วโมง ความยาวเสียงสูงสุด ประมาณ 9.5 ชั่วโมง
Rate limits^[**]	ฟรี: 15 รอบต่อนาที TPM 1 ล้านรายการ 1,500 RPD Pay-as-you-go: 2,000 รอบต่อนาที TPM 4 ล้านรายการ
ความสามารถของ	วิธีการของระบบ สิ่งที่ทำได้ โหมด JSON สิ่งที่ทำได้ สคีมา JSON สิ่งที่ทำได้ การตั้งค่าความปลอดภัยที่ปรับได้ สิ่งที่ทำได้ การแคช สิ่งที่ทำได้ การปรับแต่ง สิ่งที่ทำได้ การเรียกฟังก์ชัน สิ่งที่ทำได้ การเรียกใช้โค้ด สิ่งที่ทำได้
Versions	อ่านรายละเอียดเพิ่มเติมในรูปแบบเวอร์ชันโมเดล ล่าสุด: `gemini-1.5-flash-latest` เวอร์ชันล่าสุดที่เสถียร: `gemini-1.5-flash` เวอร์ชันเสถียร `gemini-1.5-flash-001` `gemini-1.5-flash-002`
การอัปเดตล่าสุด	กันยายน 2024

Gemini 1.5 Flash-8B

Gemini 1.5 Flash-8B เป็นโมเดลขนาดเล็กที่ออกแบบมาสำหรับงานที่ต้องใช้ปัญญาน้อย

ลองใช้ AI Studio

รายละเอียดรุ่น

พร็อพเพอร์ตี้	คำอธิบาย
รหัสรุ่น	`models/gemini-1.5-flash-8b`
ประเภทข้อมูลที่รองรับ	อินพุต เสียง รูปภาพ วิดีโอ และข้อความ เอาต์พุต ข้อความ
ขีดจํากัดโทเค็น^[*]	ขีดจํากัดของโทเค็นอินพุต 1,048,576 ขีดจํากัดโทเค็นเอาต์พุต 8,192
ข้อกำหนดเฉพาะด้านเสียง/ภาพ	จำนวนรูปภาพสูงสุดต่อพรอมต์ 3,600 ความยาววิดีโอสูงสุด 1 ชั่วโมง ความยาวเสียงสูงสุด ประมาณ 9.5 ชั่วโมง
Rate limits^[**]	ฟรี: 15 รอบต่อนาที TPM 1 ล้านรายการ 1,500 RPD Pay-as-you-go: 4,000 รอบต่อนาที TPM 4 ล้านรายการ
ความสามารถของ	วิธีการของระบบ สิ่งที่ทำได้ โหมด JSON สิ่งที่ทำได้ สคีมา JSON สิ่งที่ทำได้ การตั้งค่าความปลอดภัยที่ปรับได้ สิ่งที่ทำได้ การแคช สิ่งที่ทำได้ การปรับแต่ง สิ่งที่ทำได้ การเรียกฟังก์ชัน สิ่งที่ทำได้ การเรียกใช้โค้ด สิ่งที่ทำได้
Versions	อ่านรายละเอียดเพิ่มเติมในรูปแบบเวอร์ชันโมเดล ล่าสุด: `gemini-1.5-flash-8b-latest` เวอร์ชันล่าสุดที่เสถียร: `gemini-1.5-flash-8b` เวอร์ชันเสถียร `gemini-1.5-flash-8b-001`
การอัปเดตล่าสุด	ตุลาคม 2024

Gemini 1.5 Pro

Gemini 1.5 Pro เป็นโมเดลสื่อหลากรูปแบบขนาดกลางที่ได้รับการเพิ่มประสิทธิภาพสำหรับงานการให้เหตุผลที่หลากหลาย 1.5 Pro สามารถประมวลผลข้อมูลจำนวนมากพร้อมกันได้ ซึ่งรวมถึงวิดีโอความยาว 2 ชั่วโมง เสียงความยาว 19 ชั่วโมง ฐานโค้ดที่มีโค้ด 60,000 บรรทัด หรือข้อความ 2,000 หน้า

ลองใช้ AI Studio

รายละเอียดรุ่น

พร็อพเพอร์ตี้	คำอธิบาย
รหัสรุ่น	`models/gemini-1.5-pro`
ประเภทข้อมูลที่รองรับ	อินพุต เสียง รูปภาพ วิดีโอ และข้อความ เอาต์พุต ข้อความ
ขีดจํากัดโทเค็น^[*]	ขีดจํากัดโทเค็นอินพุต 2,097,152 ขีดจํากัดโทเค็นเอาต์พุต 8,192
ข้อกำหนดเฉพาะด้านเสียง/ภาพ	จำนวนรูปภาพสูงสุดต่อพรอมต์ 7,200 ความยาววิดีโอสูงสุด 2 ชั่วโมง ความยาวเสียงสูงสุด ประมาณ 19 ชั่วโมง
Rate limits^[**]	ฟรี: 2 RPM 32,000 TPM 50 RPD Pay-as-you-go: 1,000 รอบต่อนาที TPM 4 ล้านรายการ
ความสามารถของ	วิธีการของระบบ สิ่งที่ทำได้ โหมด JSON สิ่งที่ทำได้ สคีมา JSON สิ่งที่ทำได้ การตั้งค่าความปลอดภัยที่ปรับได้ สิ่งที่ทำได้ การแคช สิ่งที่ทำได้ การปรับแต่ง สิ่งที่ทำไม่ได้ การเรียกฟังก์ชัน สิ่งที่ทำได้ การเรียกใช้โค้ด สิ่งที่ทำได้
Versions	อ่านรายละเอียดเพิ่มเติมในรูปแบบเวอร์ชันโมเดล ล่าสุด: `gemini-1.5-pro-latest` เวอร์ชันล่าสุดที่เสถียร: `gemini-1.5-pro` เวอร์ชันเสถียร `gemini-1.5-pro-001` `gemini-1.5-pro-002`
การอัปเดตล่าสุด	กันยายน 2024

Gemini 1.0 Pro (เลิกใช้งานแล้ว)

Gemini 1.0 Pro เป็นโมเดล NLP ที่จัดการงานต่างๆ เช่น แชทแบบหลายรอบด้วยข้อความและโค้ด รวมถึงการสร้างโค้ด

ลองใช้ AI Studio

รายละเอียดรุ่น

พร็อพเพอร์ตี้	คำอธิบาย
รหัสรุ่น	`models/gemini-1.0-pro`
ประเภทข้อมูลที่รองรับ	อินพุต ข้อความ เอาต์พุต ข้อความ
Rate limits^[**]	ฟรี: 15 รอบต่อนาที 32,000 TPM 1,500 RPD Pay-as-you-go: 360 RPM 120,000 TPM 30,000 RPD
ความสามารถของ	วิธีการของระบบ สิ่งที่ทำไม่ได้ โหมด JSON สิ่งที่ทำไม่ได้ สคีมา JSON สิ่งที่ทำไม่ได้ การตั้งค่าความปลอดภัยที่ปรับได้ สิ่งที่ทำได้ การแคช สิ่งที่ทำไม่ได้ การปรับแต่ง สิ่งที่ทำได้ การเรียกฟังก์ชัน สิ่งที่ทำได้ การกําหนดค่าการเรียกฟังก์ชัน สิ่งที่ทำไม่ได้ การเรียกใช้โค้ด สิ่งที่ทำไม่ได้
Versions	ล่าสุด: `gemini-1.0-pro-latest` เวอร์ชันล่าสุดที่เสถียร: `gemini-1.0-pro` ทำงานได้อย่างเสถียร: `gemini-1.0-pro-001`
การอัปเดตล่าสุด	กุมภาพันธ์ 2024

หมายเหตุ: gemini-pro เป็นอีเมลแทนของ gemini-1.0-pro

การฝังข้อความและการฝัง

การฝังข้อความ

การฝังข้อความใช้วัดความเกี่ยวข้องของสตริง และใช้ในแอปพลิเคชัน AI หลายรายการอย่างแพร่หลาย

text-embedding-004 มีประสิทธิภาพการดึงข้อมูลดีขึ้นและมีประสิทธิภาพมากกว่าโมเดลที่มีอยู่ ด้วยมิติข้อมูลที่เปรียบเทียบได้ ในเกณฑ์มาตรฐานการฝัง MTEB

รายละเอียดรุ่น

พร็อพเพอร์ตี้	คำอธิบาย
รหัสรุ่น	Gemini API `models/text-embedding-004`
ประเภทข้อมูลที่รองรับ	อินพุต ข้อความ เอาต์พุต ข้อความที่ฝัง
ขีดจํากัดโทเค็น^[*]	ขีดจํากัดโทเค็นอินพุต 2,048 ขนาดมิติข้อมูลเอาต์พุต 768
Rate limits^[**]	คำขอ 1,500 รายการต่อนาที
การตั้งค่าความปลอดภัยที่ปรับได้ซึ่ง	สิ่งที่ทำไม่ได้
การอัปเดตล่าสุด	เมษายน 2024

การฝัง

คุณสามารถใช้โมเดลการฝังเพื่อสร้างการฝังข้อความสําหรับข้อความอินพุต

โมเดลการฝังได้รับการเพิ่มประสิทธิภาพเพื่อสร้างการฝังที่มีมิติข้อมูล 768 รายการสําหรับข้อความที่มีโทเค็นได้สูงสุด 2,048 รายการ

รายละเอียดการฝังโมเดล

พร็อพเพอร์ตี้	คำอธิบาย
รหัสรุ่น	`models/embedding-001`
ประเภทข้อมูลที่รองรับ	อินพุต ข้อความ เอาต์พุต ข้อความที่ฝัง
ขีดจํากัดโทเค็น^[*]	ขีดจํากัดโทเค็นอินพุต 2,048 ขนาดมิติข้อมูลเอาต์พุต 768
Rate limits^[**]	คำขอ 1,500 รายการต่อนาที
การตั้งค่าความปลอดภัยที่ปรับได้ซึ่ง	สิ่งที่ทำไม่ได้
การอัปเดตล่าสุด	ธันวาคม 2023

AQA

คุณสามารถใช้โมเดล AQA เพื่อทํางานที่เกี่ยวข้องกับการตอบคําถามพร้อมระบุแหล่งที่มา (AQA) ในเอกสาร เอกสารชุด หรือชุดข้อความ โมเดล AQA จะแสดงคำตอบสำหรับคำถามที่อิงตามแหล่งข้อมูลที่ให้ไว้ พร้อมกับประมาณความน่าจะเป็นที่ตอบได้

รายละเอียดรุ่น

พร็อพเพอร์ตี้	คำอธิบาย
รหัสรุ่น	`models/aqa`
ประเภทข้อมูลที่รองรับ	อินพุต ข้อความ เอาต์พุต ข้อความ
ภาษาที่รองรับ	อังกฤษ
ขีดจํากัดโทเค็น^[*]	ขีดจํากัดโทเค็นอินพุต 7,168 ขีดจํากัดโทเค็นเอาต์พุต 1,024
Rate limits^[**]	คำขอ 1,500 รายการต่อนาที
การตั้งค่าความปลอดภัยที่ปรับได้และ	สิ่งที่ทำได้
การอัปเดตล่าสุด	ธันวาคม 2023

ดูตัวอย่างเพื่อสำรวจความสามารถของรูปแบบเหล่านี้

[*] โทเค็นจะเท่ากับประมาณ 4 อักขระสำหรับรุ่น Gemini โทเค็น 100 รายการจะเท่ากับคำภาษาอังกฤษประมาณ 60-80 คำ

[**] RPM: คำขอต่อนาที
TPM: โทเค็นต่อนาที
RPD: คำขอต่อวัน
TPD: โทเค็นต่อวัน

เราไม่รับประกันขีดจำกัดอัตราสูงสุดที่ระบุเนื่องจากข้อจำกัดด้านความสามารถ

รูปแบบชื่อเวอร์ชันโมเดล

โมเดล Gemini มีให้บริการในเวอร์ชันตัวอย่างหรือเสถียร ในโค้ด คุณสามารถใช้รูปแบบชื่อโมเดลรูปแบบใดรูปแบบหนึ่งต่อไปนี้เพื่อระบุโมเดลและเวอร์ชันที่ต้องการใช้

ล่าสุด: ชี้ไปยังเวอร์ชันล่าสุดของโมเดลสำหรับรุ่นและตัวแปรที่ระบุ โมเดลพื้นฐานจะอัปเดตเป็นประจำและอาจเป็นเวอร์ชันตัวอย่าง เฉพาะแอปและโปรโตไทป์การทดสอบเพื่อสำรวจเท่านั้นที่ควรใช้อีเมลแทนนี้

หากต้องการระบุเวอร์ชันล่าสุด ให้ใช้รูปแบบต่อไปนี้ <model>-<generation>-<variation>-latest เช่น gemini-1.0-pro-latest
เสถียรล่าสุด: ชี้ไปยังเวอร์ชันเสถียรล่าสุดที่เผยแพร่สำหรับรุ่นและรูปแบบที่ระบุ

หากต้องการระบุเวอร์ชันล่าสุดที่มีความเสถียร ให้ใช้รูปแบบต่อไปนี้ <model>-<generation>-<variation> เช่น gemini-1.0-pro
เสถียร: ชี้ไปยังรุ่นที่เสถียรที่เฉพาะเจาะจง โมเดลที่เสถียรจะไม่เปลี่ยนแปลง แอปเวอร์ชันที่ใช้งานจริงส่วนใหญ่ควรใช้รูปแบบที่เสถียรที่เฉพาะเจาะจง

หากต้องการระบุเวอร์ชันที่เสถียร ให้ใช้รูปแบบต่อไปนี้ <model>-<generation>-<variation>-<version> เช่น gemini-1.0-pro-001
ทดลอง: ชี้ไปยังรูปแบบการทดสอบที่มีให้ใช้งานในเวอร์ชันตัวอย่าง ตามที่ระบุไว้ในข้อกําหนด ซึ่งหมายความว่าไม่เหมาะสำหรับการใช้งานจริง เราเผยแพร่โมเดลเวอร์ชันทดลองเพื่อรวบรวมความคิดเห็น ช่วยให้นักพัฒนาซอฟต์แวร์ได้รับข้อมูลอัปเดตล่าสุดอย่างรวดเร็ว และเน้นย้ำถึงความเร็วในการสร้างสรรค์นวัตกรรมที่เกิดขึ้นที่ Google สิ่งที่เราได้เรียนรู้จากการเปิดตัวแบบทดลองจะเป็นข้อมูลในการพิจารณาวิธีเปิดตัวโมเดลในวงกว้างขึ้น คุณสามารถเปลี่ยนรูปแบบการทดสอบรูปแบบอื่นได้โดยไม่ต้องแจ้งให้ทราบล่วงหน้า เราไม่รับประกันว่าโมเดลทดลองจะกลายเป็นโมเดลที่เสถียรในอนาคต

หากต้องการระบุเวอร์ชันทดลอง ให้ใช้รูปแบบต่อไปนี้ <model>-<generation>-<variation>-<version> เช่น gemini-exp-1121

ภาษาที่พร้อมให้บริการ

โมเดล Gemini ได้รับการฝึกให้ทำงานร่วมกับภาษาต่อไปนี้

อาหรับ (ar)
เบงกอล (bn)
บัลแกเรีย (bg)
จีนตัวย่อและตัวเต็ม (zh)
โครเอเชีย (hr)
เช็ก (cs)
เดนมาร์ก (da)
ดัตช์ (nl)
อังกฤษ (en)
เอสโตเนีย (et)
ฟินแลนด์ (fi)
ฝรั่งเศส (fr)
เยอรมัน (de)
กรีก (el)
ฮีบรู (iw)
ฮินดี (hi)
ฮังการี (hu)
อินโดนีเซีย (id)
อิตาลี (it)
ญี่ปุ่น (ja)
เกาหลี (ko)
ลัตเวีย (lv)
ลิทัวเนีย (lt)
นอร์เวย์ (no)
โปแลนด์ (pl)
โปรตุเกส (pt)
โรมาเนีย (ro)
รัสเซีย (ru)
เซอร์เบีย (sr)
สโลวัก (sk)
สโลวีเนีย (sl)
สเปน (es)
สวาฮิลี (sw)
สวีเดน (sv)
ไทย (th)
ตุรกี (tr)
ยูเครน (uk)
เวียดนาม (vi)