1.5 Flash
โมเดลมัลติโมดัลที่สมดุลที่สุดของเราซึ่งมีประสิทธิภาพยอดเยี่ยมสำหรับงานส่วนใหญ่
- ป้อนเสียง รูปภาพ วิดีโอ และข้อความ แล้วรับคำตอบที่เป็นข้อความ
- สร้างโค้ด ดึงข้อมูล แก้ไขข้อความ และอื่นๆ
- เหมาะสำหรับงานที่ให้ความสำคัญกับทั้งประสิทธิภาพและต้นทุน
ตัวแปรของโมเดล
Gemini API มีรูปแบบต่างๆ ที่เพิ่มประสิทธิภาพสำหรับกรณีการใช้งานที่เฉพาะเจาะจง ภาพรวมคร่าวๆ ของตัวแปร Gemini ที่มีให้บริการมีดังนี้
ตัวแปรของโมเดล | อินพุต | เอาต์พุต | เพิ่มประสิทธิภาพสำหรับ |
---|---|---|---|
Gemini 1.5 Flash
gemini-1.5-flash |
เสียง รูปภาพ วิดีโอ และข้อความ | ข้อความ | ประสิทธิภาพที่รวดเร็วและหลากหลายสำหรับงานต่างๆ |
Gemini 1.5 Flash-8B
gemini-1.5-flash-8b |
เสียง รูปภาพ วิดีโอ และข้อความ | ข้อความ | งานจำนวนมากและงานที่มีระดับปัญญาต่ำ |
Gemini 1.5 Pro
gemini-1.5-pro |
เสียง รูปภาพ วิดีโอ และข้อความ | ข้อความ | งานที่มีเหตุผลที่ซับซ้อนซึ่งต้องใช้ความฉลาดมากขึ้น |
Gemini 1.0 Pro (เลิกใช้งานแล้วเมื่อวันที่ 15/2/2025)
gemini-1.0-pro |
ข้อความ | ข้อความ | งานภาษาธรรมชาติ แชทข้อความและโค้ดแบบหลายรอบ รวมถึงการสร้างโค้ด |
การฝังข้อความ
text-embedding-004 |
ข้อความ | ข้อความที่ฝัง | การวัดความเกี่ยวข้องของสตริงข้อความ |
AQA
aqa |
ข้อความ | ข้อความ | การให้คำตอบที่อิงตามแหล่งข้อมูล |
Gemini 1.5 Flash
Gemini 1.5 Flash เป็นโมเดลสื่อหลากรูปแบบที่รวดเร็วและอเนกประสงค์สำหรับการปรับขนาดกับงานที่หลากหลาย
รายละเอียดรุ่น
พร็อพเพอร์ตี้ | คำอธิบาย |
---|---|
รหัสรุ่น | models/gemini-1.5-flash |
ประเภทข้อมูลที่รองรับ |
อินพุต เสียง รูปภาพ วิดีโอ และข้อความ เอาต์พุต ข้อความ |
[*] | ขีดจํากัดโทเค็น
ขีดจํากัดโทเค็นอินพุต 1,048,576 ขีดจํากัดโทเค็นเอาต์พุต 8,192 |
ข้อกำหนดเฉพาะด้านเสียง/ภาพ |
จำนวนรูปภาพสูงสุดต่อพรอมต์ 3,600 ความยาววิดีโอสูงสุด 1 ชั่วโมง ความยาวเสียงสูงสุด ประมาณ 9.5 ชั่วโมง |
[**] | Rate limits
|
ความสามารถของ |
วิธีการของระบบ สิ่งที่ทำได้ โหมด JSON สิ่งที่ทำได้ สคีมา JSON สิ่งที่ทำได้ การตั้งค่าความปลอดภัยที่ปรับได้ สิ่งที่ทำได้ การแคช สิ่งที่ทำได้ การปรับแต่ง สิ่งที่ทำได้ การเรียกฟังก์ชัน สิ่งที่ทำได้ การเรียกใช้โค้ด สิ่งที่ทำได้ |
Versions |
|
การอัปเดตล่าสุด | กันยายน 2024 |
Gemini 1.5 Flash-8B
Gemini 1.5 Flash-8B เป็นโมเดลขนาดเล็กที่ออกแบบมาสำหรับงานที่ต้องใช้ปัญญาน้อย
รายละเอียดรุ่น
พร็อพเพอร์ตี้ | คำอธิบาย |
---|---|
รหัสรุ่น | models/gemini-1.5-flash-8b |
ประเภทข้อมูลที่รองรับ |
อินพุต เสียง รูปภาพ วิดีโอ และข้อความ เอาต์พุต ข้อความ |
[*] | ขีดจํากัดโทเค็น
ขีดจํากัดของโทเค็นอินพุต 1,048,576 ขีดจํากัดโทเค็นเอาต์พุต 8,192 |
ข้อกำหนดเฉพาะด้านเสียง/ภาพ |
จำนวนรูปภาพสูงสุดต่อพรอมต์ 3,600 ความยาววิดีโอสูงสุด 1 ชั่วโมง ความยาวเสียงสูงสุด ประมาณ 9.5 ชั่วโมง |
[**] | Rate limits
|
ความสามารถของ |
วิธีการของระบบ สิ่งที่ทำได้ โหมด JSON สิ่งที่ทำได้ สคีมา JSON สิ่งที่ทำได้ การตั้งค่าความปลอดภัยที่ปรับได้ สิ่งที่ทำได้ การแคช สิ่งที่ทำได้ การปรับแต่ง สิ่งที่ทำได้ การเรียกฟังก์ชัน สิ่งที่ทำได้ การเรียกใช้โค้ด สิ่งที่ทำได้ |
Versions |
|
การอัปเดตล่าสุด | ตุลาคม 2024 |
Gemini 1.5 Pro
Gemini 1.5 Pro เป็นโมเดลสื่อหลากรูปแบบขนาดกลางที่ได้รับการเพิ่มประสิทธิภาพสำหรับงานการให้เหตุผลที่หลากหลาย 1.5 Pro สามารถประมวลผลข้อมูลจำนวนมากพร้อมกันได้ ซึ่งรวมถึงวิดีโอความยาว 2 ชั่วโมง เสียงความยาว 19 ชั่วโมง ฐานโค้ดที่มีโค้ด 60,000 บรรทัด หรือข้อความ 2,000 หน้า
รายละเอียดรุ่น
พร็อพเพอร์ตี้ | คำอธิบาย |
---|---|
รหัสรุ่น | models/gemini-1.5-pro |
ประเภทข้อมูลที่รองรับ |
อินพุต เสียง รูปภาพ วิดีโอ และข้อความ เอาต์พุต ข้อความ |
[*] | ขีดจํากัดโทเค็น
ขีดจํากัดโทเค็นอินพุต 2,097,152 ขีดจํากัดโทเค็นเอาต์พุต 8,192 |
ข้อกำหนดเฉพาะด้านเสียง/ภาพ |
จำนวนรูปภาพสูงสุดต่อพรอมต์ 7,200 ความยาววิดีโอสูงสุด 2 ชั่วโมง ความยาวเสียงสูงสุด ประมาณ 19 ชั่วโมง |
[**] | Rate limits
|
ความสามารถของ |
วิธีการของระบบ สิ่งที่ทำได้ โหมด JSON สิ่งที่ทำได้ สคีมา JSON สิ่งที่ทำได้ การตั้งค่าความปลอดภัยที่ปรับได้ สิ่งที่ทำได้ การแคช สิ่งที่ทำได้ การปรับแต่ง สิ่งที่ทำไม่ได้ การเรียกฟังก์ชัน สิ่งที่ทำได้ การเรียกใช้โค้ด สิ่งที่ทำได้ |
Versions |
|
การอัปเดตล่าสุด | กันยายน 2024 |
Gemini 1.0 Pro (เลิกใช้งานแล้ว)
Gemini 1.0 Pro เป็นโมเดล NLP ที่จัดการงานต่างๆ เช่น แชทแบบหลายรอบด้วยข้อความและโค้ด รวมถึงการสร้างโค้ด
รายละเอียดรุ่น
พร็อพเพอร์ตี้ | คำอธิบาย |
---|---|
รหัสรุ่น | models/gemini-1.0-pro |
ประเภทข้อมูลที่รองรับ |
อินพุต ข้อความ เอาต์พุต ข้อความ |
[**] | Rate limits
|
ความสามารถของ |
วิธีการของระบบ สิ่งที่ทำไม่ได้ โหมด JSON สิ่งที่ทำไม่ได้ สคีมา JSON สิ่งที่ทำไม่ได้ การตั้งค่าความปลอดภัยที่ปรับได้ สิ่งที่ทำได้ การแคช สิ่งที่ทำไม่ได้ การปรับแต่ง สิ่งที่ทำได้ การเรียกฟังก์ชัน สิ่งที่ทำได้ การกําหนดค่าการเรียกฟังก์ชัน สิ่งที่ทำไม่ได้ การเรียกใช้โค้ด สิ่งที่ทำไม่ได้ |
Versions |
|
การอัปเดตล่าสุด | กุมภาพันธ์ 2024 |
การฝังข้อความและการฝัง
การฝังข้อความ
การฝังข้อความใช้วัดความเกี่ยวข้องของสตริง และใช้ในแอปพลิเคชัน AI หลายรายการอย่างแพร่หลาย
text-embedding-004
มีประสิทธิภาพการดึงข้อมูลดีขึ้นและมีประสิทธิภาพมากกว่าโมเดลที่มีอยู่
ด้วยมิติข้อมูลที่เปรียบเทียบได้ ในเกณฑ์มาตรฐานการฝัง MTEB
รายละเอียดรุ่น
พร็อพเพอร์ตี้ | คำอธิบาย |
---|---|
รหัสรุ่น |
Gemini API
|
ประเภทข้อมูลที่รองรับ |
อินพุต ข้อความ เอาต์พุต ข้อความที่ฝัง |
[*] | ขีดจํากัดโทเค็น
ขีดจํากัดโทเค็นอินพุต 2,048 ขนาดมิติข้อมูลเอาต์พุต 768 |
[**] | Rate limitsคำขอ 1,500 รายการต่อนาที |
การตั้งค่าความปลอดภัยที่ปรับได้ซึ่ง | สิ่งที่ทำไม่ได้ |
การอัปเดตล่าสุด | เมษายน 2024 |
การฝัง
คุณสามารถใช้โมเดลการฝังเพื่อสร้างการฝังข้อความสําหรับข้อความอินพุต
โมเดลการฝังได้รับการเพิ่มประสิทธิภาพเพื่อสร้างการฝังที่มีมิติข้อมูล 768 รายการสําหรับข้อความที่มีโทเค็นได้สูงสุด 2,048 รายการ
รายละเอียดการฝังโมเดล
พร็อพเพอร์ตี้ | คำอธิบาย |
---|---|
รหัสรุ่น |
models/embedding-001
|
ประเภทข้อมูลที่รองรับ |
อินพุต ข้อความ เอาต์พุต ข้อความที่ฝัง |
[*] | ขีดจํากัดโทเค็น
ขีดจํากัดโทเค็นอินพุต 2,048 ขนาดมิติข้อมูลเอาต์พุต 768 |
[**] | Rate limitsคำขอ 1,500 รายการต่อนาที |
การตั้งค่าความปลอดภัยที่ปรับได้ซึ่ง | สิ่งที่ทำไม่ได้ |
การอัปเดตล่าสุด | ธันวาคม 2023 |
AQA
คุณสามารถใช้โมเดล AQA เพื่อทํางานที่เกี่ยวข้องกับการตอบคําถามพร้อมระบุแหล่งที่มา (AQA) ในเอกสาร เอกสารชุด หรือชุดข้อความ โมเดล AQA จะแสดงคำตอบสำหรับคำถามที่อิงตามแหล่งข้อมูลที่ให้ไว้ พร้อมกับประมาณความน่าจะเป็นที่ตอบได้
รายละเอียดรุ่น
พร็อพเพอร์ตี้ | คำอธิบาย |
---|---|
รหัสรุ่น | models/aqa |
ประเภทข้อมูลที่รองรับ |
อินพุต ข้อความ เอาต์พุต ข้อความ |
ภาษาที่รองรับ | อังกฤษ |
[*] | ขีดจํากัดโทเค็น
ขีดจํากัดโทเค็นอินพุต 7,168 ขีดจํากัดโทเค็นเอาต์พุต 1,024 |
[**] | Rate limitsคำขอ 1,500 รายการต่อนาที |
การตั้งค่าความปลอดภัยที่ปรับได้และ | สิ่งที่ทำได้ |
การอัปเดตล่าสุด | ธันวาคม 2023 |
ดูตัวอย่างเพื่อสำรวจความสามารถของรูปแบบเหล่านี้
[*] โทเค็นจะเท่ากับประมาณ 4 อักขระสำหรับรุ่น Gemini โทเค็น 100 รายการจะเท่ากับคำภาษาอังกฤษประมาณ 60-80 คำ
[**] RPM: คำขอต่อนาที
TPM: โทเค็นต่อนาที
RPD: คำขอต่อวัน
TPD: โทเค็นต่อวัน
เราไม่รับประกันขีดจำกัดอัตราสูงสุดที่ระบุเนื่องจากข้อจำกัดด้านความสามารถ
รูปแบบชื่อเวอร์ชันโมเดล
โมเดล Gemini มีให้บริการในเวอร์ชันตัวอย่างหรือเสถียร ในโค้ด คุณสามารถใช้รูปแบบชื่อโมเดลรูปแบบใดรูปแบบหนึ่งต่อไปนี้เพื่อระบุโมเดลและเวอร์ชันที่ต้องการใช้
ล่าสุด: ชี้ไปยังเวอร์ชันล่าสุดของโมเดลสำหรับรุ่นและตัวแปรที่ระบุ โมเดลพื้นฐานจะอัปเดตเป็นประจำและอาจเป็นเวอร์ชันตัวอย่าง เฉพาะแอปและโปรโตไทป์การทดสอบเพื่อสำรวจเท่านั้นที่ควรใช้อีเมลแทนนี้
หากต้องการระบุเวอร์ชันล่าสุด ให้ใช้รูปแบบต่อไปนี้
<model>-<generation>-<variation>-latest
เช่นgemini-1.0-pro-latest
เสถียรล่าสุด: ชี้ไปยังเวอร์ชันเสถียรล่าสุดที่เผยแพร่สำหรับรุ่นและรูปแบบที่ระบุ
หากต้องการระบุเวอร์ชันล่าสุดที่มีความเสถียร ให้ใช้รูปแบบต่อไปนี้
<model>-<generation>-<variation>
เช่นgemini-1.0-pro
เสถียร: ชี้ไปยังรุ่นที่เสถียรที่เฉพาะเจาะจง โมเดลที่เสถียรจะไม่เปลี่ยนแปลง แอปเวอร์ชันที่ใช้งานจริงส่วนใหญ่ควรใช้รูปแบบที่เสถียรที่เฉพาะเจาะจง
หากต้องการระบุเวอร์ชันที่เสถียร ให้ใช้รูปแบบต่อไปนี้
<model>-<generation>-<variation>-<version>
เช่นgemini-1.0-pro-001
ทดลอง: ชี้ไปยังรูปแบบการทดสอบที่มีให้ใช้งานในเวอร์ชันตัวอย่าง ตามที่ระบุไว้ในข้อกําหนด ซึ่งหมายความว่าไม่เหมาะสำหรับการใช้งานจริง เราเผยแพร่โมเดลเวอร์ชันทดลองเพื่อรวบรวมความคิดเห็น ช่วยให้นักพัฒนาซอฟต์แวร์ได้รับข้อมูลอัปเดตล่าสุดอย่างรวดเร็ว และเน้นย้ำถึงความเร็วในการสร้างสรรค์นวัตกรรมที่เกิดขึ้นที่ Google สิ่งที่เราได้เรียนรู้จากการเปิดตัวแบบทดลองจะเป็นข้อมูลในการพิจารณาวิธีเปิดตัวโมเดลในวงกว้างขึ้น คุณสามารถเปลี่ยนรูปแบบการทดสอบรูปแบบอื่นได้โดยไม่ต้องแจ้งให้ทราบล่วงหน้า เราไม่รับประกันว่าโมเดลทดลองจะกลายเป็นโมเดลที่เสถียรในอนาคต
หากต้องการระบุเวอร์ชันทดลอง ให้ใช้รูปแบบต่อไปนี้
<model>-<generation>-<variation>-<version>
เช่นgemini-exp-1121
ภาษาที่พร้อมให้บริการ
โมเดล Gemini ได้รับการฝึกให้ทำงานร่วมกับภาษาต่อไปนี้
- อาหรับ (
ar
) - เบงกอล (
bn
) - บัลแกเรีย (
bg
) - จีนตัวย่อและตัวเต็ม (
zh
) - โครเอเชีย (
hr
) - เช็ก (
cs
) - เดนมาร์ก (
da
) - ดัตช์ (
nl
) - อังกฤษ (
en
) - เอสโตเนีย (
et
) - ฟินแลนด์ (
fi
) - ฝรั่งเศส (
fr
) - เยอรมัน (
de
) - กรีก (
el
) - ฮีบรู (
iw
) - ฮินดี (
hi
) - ฮังการี (
hu
) - อินโดนีเซีย (
id
) - อิตาลี (
it
) - ญี่ปุ่น (
ja
) - เกาหลี (
ko
) - ลัตเวีย (
lv
) - ลิทัวเนีย (
lt
) - นอร์เวย์ (
no
) - โปแลนด์ (
pl
) - โปรตุเกส (
pt
) - โรมาเนีย (
ro
) - รัสเซีย (
ru
) - เซอร์เบีย (
sr
) - สโลวัก (
sk
) - สโลวีเนีย (
sl
) - สเปน (
es
) - สวาฮิลี (
sw
) - สวีเดน (
sv
) - ไทย (
th
) - ตุรกี (
tr
) - ยูเครน (
uk
) - เวียดนาม (
vi
)