2.0
flashModeli ynë më i ri multimodal, me karakteristika të gjeneratës së ardhshme dhe aftësi të përmirësuara
- Futni audio, imazhe, video dhe tekst — merrni përgjigje teksti, imazhi dhe audio
- Paraqet ndërveprime bisedore me vonesë të ulët me API-në tonë Multimodal Live
Variantet e modelit
Gemini API ofron modele të ndryshme që janë optimizuar për raste të veçanta përdorimi. Këtu është një përmbledhje e shkurtër e varianteve të Binjakëve që janë në dispozicion:
Varianti i modelit | Të dhëna hyrëse | Prodhimi | Optimizuar për |
---|---|---|---|
Binjakët 2.0 Flashgemini-2.0-flash-exp | Audio, imazhe, video dhe tekst | Tekst, imazhe (së shpejti) dhe audio (së shpejti) | Karakteristikat e gjeneratës së ardhshme, shpejtësia dhe gjenerimi multimodal për një larmi detyrash |
Binjakët 1.5 Flashgemini-1.5-flash | Audio, imazhe, video dhe tekst | Teksti | Performancë e shpejtë dhe e gjithanshme në një sërë detyrash të ndryshme |
Binjakët 1.5 Flash-8Bgemini-1.5-flash-8b | Audio, imazhe, video dhe tekst | Teksti | Detyra me volum të lartë dhe inteligjencë më të ulët |
Gemini 1.5 Progemini-1.5-pro | Audio, imazhe, video dhe tekst | Teksti | Detyra komplekse të arsyetimit që kërkojnë më shumë inteligjencë |
Gemini 1.0 Progemini-1.0-pro (Përdorur më 15.2.2025) | Teksti | Teksti | Detyrat e gjuhës natyrore, biseda me tekst dhe kode me shumë kthesa dhe gjenerimi i kodeve |
Përfshirja e tekstittext-embedding-004 | Teksti | Përfshirjet e tekstit | Matja e lidhjes së vargjeve të tekstit |
AQAaqa | Teksti | Teksti | Sigurimi i përgjigjeve të bazuara në burim për pyetjet |
Gemini 2.0 Flash (eksperimental)
Gemini 2.0 Flash ofron veçori të gjeneratës së ardhshme dhe aftësi të përmirësuara, duke përfshirë shpejtësinë superiore, përdorimin e mjeteve vendase, gjenerimin multimodal dhe një dritare të kontekstit të tokenit 1M. Mësoni më shumë rreth Gemini 2.0 Flash në faqen tonë të përmbledhjes .
Detajet e modelit
Pronës | Përshkrimi |
---|---|
i modelit | models/gemini-2.0-flash-exp |
llojet e të dhënave të mbështetura | Inputet Audio, imazhe, video dhe tekst Prodhimi Audio (së shpejti), imazhe (së shpejti) dhe tekst |
[*] | Kufijtë e tokenitKufiri i shenjës së hyrjes 1,048,576 Kufiri i shenjës së daljes 8192 |
[**] | Kufijtë e normës
|
Aftësitë | Rezultatet e strukturuara Mbështetur Caching Nuk mbështetet Akordim Nuk mbështetet Thirrja e funksionit Mbështetur Ekzekutimi i kodit Mbështetur Kërko Mbështetur Gjenerimi i imazhit Mbështetur Përdorimi i mjetit vendas Mbështetur Gjenerimi i audios Mbështetur API Multimodal Live Mbështetur |
versione |
|
Përditësimi i fundit | dhjetor 2024 |
Ndërprerja e njohurive | gusht 2024 |
Binjakët 1.5 Flash
Gemini 1.5 Flash është një model multimodal i shpejtë dhe i gjithanshëm për shkallëzimin e detyrave të ndryshme.
Detajet e modelit
Pronës | Përshkrimi |
---|---|
i modelit | models/gemini-1.5-flash |
llojet e të dhënave të mbështetura | Inputet Audio, imazhe, video dhe tekst Prodhimi Teksti |
[*] | Kufijtë e tokenitKufiri i shenjës së hyrjes 1,048,576 Kufiri i shenjës së daljes 8192 |
Karakteristikat audio/vizuale | Numri maksimal i imazheve për kërkesë 3600 Gjatësia maksimale e videos 1 orë Gjatësia maksimale e audios Përafërsisht 9.5 orë |
[**] | Kufijtë e normës
|
Aftësitë | Udhëzimet e sistemit Mbështetur Modaliteti JSON Mbështetur Skema JSON Mbështetur Cilësimet e rregullueshme të sigurisë Mbështetur Caching Mbështetur Akordim Mbështetur Thirrja e funksionit Mbështetur Ekzekutimi i kodit Mbështetur Transmetim i dyanshëm Nuk mbështetet |
versione |
|
Përditësimi i fundit | shtator 2024 |
Binjakët 1.5 Flash-8B
Gemini 1.5 Flash-8B është një model i vogël i krijuar për detyra me inteligjencë më të ulët.
Detajet e modelit
Pronës | Përshkrimi |
---|---|
i modelit | models/gemini-1.5-flash-8b |
llojet e të dhënave të mbështetura | Inputet Audio, imazhe, video dhe tekst Prodhimi Teksti |
[*] | Kufijtë e tokenitKufiri i kodit të hyrjes 1,048,576 Kufiri i shenjës së daljes 8192 |
Karakteristikat audio/vizuale | Numri maksimal i imazheve për kërkesë 3600 Gjatësia maksimale e videos 1 orë Gjatësia maksimale e audios Përafërsisht 9.5 orë |
[**] | Kufijtë e normës
|
Aftësitë | Udhëzimet e sistemit Mbështetur Modaliteti JSON Mbështetur Skema JSON Mbështetur Cilësimet e rregullueshme të sigurisë Mbështetur Caching Mbështetur Akordim Mbështetur Thirrja e funksionit Mbështetur Ekzekutimi i kodit Mbështetur Transmetim i dyanshëm Nuk mbështetet |
versione |
|
Përditësimi i fundit | tetor 2024 |
Gemini 1.5 Pro
Gemini 1.5 Pro është një model multimodal i madhësisë së mesme që është optimizuar për një gamë të gjerë detyrash arsyetimi. 1.5 Pro mund të përpunojë sasi të mëdha të dhënash menjëherë, duke përfshirë 2 orë video, 19 orë audio, baza kodesh me 60,000 rreshta kodi ose 2,000 faqe tekst.
Detajet e modelit
Pronës | Përshkrimi |
---|---|
i modelit | models/gemini-1.5-pro |
llojet e të dhënave të mbështetura | Inputet Audio, imazhe, video dhe tekst Prodhimi Teksti |
[*] | Kufijtë e tokenitKufiri i kodit të hyrjes 2,097,152 Kufiri i shenjës së daljes 8192 |
Karakteristikat audio/vizuale | Numri maksimal i imazheve për kërkesë 7200 Gjatësia maksimale e videos 2 orë Gjatësia maksimale e audios Përafërsisht 19 orë |
[**] | Kufijtë e normës
|
Aftësitë | Udhëzimet e sistemit Mbështetur Modaliteti JSON Mbështetur Skema JSON Mbështetur Cilësimet e rregullueshme të sigurisë Mbështetur Caching Mbështetur Akordim Nuk mbështetet Thirrja e funksionit Mbështetur Ekzekutimi i kodit Mbështetur Transmetim i dyanshëm Nuk mbështetet |
versione |
|
Përditësimi i fundit | shtator 2024 |
Gemini 1.0 Pro (i vjetëruar)
Gemini 1.0 Pro është një model NLP që trajton detyra si biseda me tekst dhe kode me shumë kthesa, si dhe gjenerimi i kodeve.
Detajet e modelit
Pronës | Përshkrimi |
---|---|
i modelit | models/gemini-1.0-pro |
llojet e të dhënave të mbështetura | Input Teksti Prodhimi Teksti |
[**] | Kufijtë e normës
|
Aftësitë | Udhëzimet e sistemit Nuk mbështetet Modaliteti JSON Nuk mbështetet Skema JSON Nuk mbështetet Cilësimet e rregullueshme të sigurisë Mbështetur Caching Nuk mbështetet Akordim Mbështetur Thirrja e funksionit Mbështetur Konfigurimi i thirrjes së funksionit Nuk mbështetet Ekzekutimi i kodit Nuk mbështetet Transmetim i dyanshëm Nuk mbështetet |
versione |
|
Përditësimi i fundit | shkurt 2024 |
Embedding dhe Embedding tekst
Përfshirja e tekstit
Përfshirjet e tekstit përdoren për të matur lidhjen e vargjeve dhe përdoren gjerësisht në shumë aplikacione të AI.
text-embedding-004
arrin një performancë më të fortë rikthimi dhe tejkalon modelet ekzistuese me dimensione të krahasueshme, në standardet standarde të ngulitjes MTEB.
Detajet e modelit
Pronës | Përshkrimi |
---|---|
i modelit | Binjakët API |
llojet e të dhënave të mbështetura | Input Teksti Prodhimi Përfshirjet e tekstit |
[*] | Kufijtë e tokenitKufiri i kodit të hyrjes 2048 Madhësia e dimensionit të daljes 768 |
[**] | Kufijtë e normës1500 kërkesa në minutë |
Cilësimet e rregullueshme të sigurisë | Nuk mbështetet |
Përditësimi i fundit | Prill 2024 |
Embedding
Mund të përdorni modelin Embedding për të gjeneruar ngulitje teksti për tekstin hyrës.
Modeli Embedding është optimizuar për krijimin e ngulitjeve me 768 dimensione për tekst deri në 2048 token.
Përfshirja e detajeve të modelit
Pronës | Përshkrimi |
---|---|
i modelit | models/embedding-001 |
llojet e të dhënave të mbështetura | Input Teksti Prodhimi Përfshirjet e tekstit |
[*] | Kufijtë e tokenitKufiri i kodit të hyrjes 2048 Madhësia e dimensionit të daljes 768 |
[**] | Kufijtë e normës1500 kërkesa në minutë |
Cilësimet e rregullueshme të sigurisë | Nuk mbështetet |
Përditësimi i fundit | dhjetor 2023 |
AQA
Ju mund të përdorni modelin AQA për të kryer detyra të lidhura me pyetje-përgjigje (AQA) mbi një dokument, korpus ose një grup pasazhesh. Modeli AQA kthen përgjigje për pyetjet që janë të bazuara në burimet e ofruara, së bashku me vlerësimin e probabilitetit të përgjigjes.
Detajet e modelit
Pronës | Përshkrimi |
---|---|
i modelit | models/aqa |
llojet e të dhënave të mbështetura | Input Teksti Prodhimi Teksti |
e mbështetur | anglisht |
[*] | Kufijtë e tokenitKufiri i kodit të hyrjes 7168 Kufiri i shenjës së daljes 1024 |
[**] | Kufijtë e normës1500 kërkesa në minutë |
Cilësimet e rregullueshme të sigurisë | Mbështetur |
Përditësimi i fundit | dhjetor 2023 |
Shihni shembujt për të eksploruar aftësitë e këtyre variacioneve të modelit.
[*] Një shenjë është e barabartë me rreth 4 karaktere për modelet Gemini. 100 shenja janë rreth 60-80 fjalë angleze.
[**] RPM: Kërkesa për minutë
TPM: Shenja për minutë
RPD: Kërkesa në ditë
TPD: Shenjat në ditë
Për shkak të kufizimeve të kapacitetit, kufijtë e specifikuar të tarifave maksimale nuk janë të garantuara.
Modelet e emrave të versionit të modelit
Modelet e Binjakëve janë në dispozicion në versione paraprake ose të qëndrueshme . Në kodin tuaj, mund të përdorni një nga formatet e mëposhtme të emrit të modelit për të specifikuar modelin dhe versionin që dëshironi të përdorni.
Më e fundit: Tregon versionin më të fundit të modelit për një gjenerim dhe variacion të caktuar. Modeli themelor përditësohet rregullisht dhe mund të jetë një version paraprak. Vetëm aplikacionet dhe prototipet e testimit eksplorues duhet ta përdorin këtë pseudonim.
Për të specifikuar versionin më të fundit, përdorni modelin e mëposhtëm:
<model>-<generation>-<variation>-latest
. Për shembull,gemini-1.0-pro-latest
.Stabiliteti më i fundit: Tregon në versionin më të fundit të qëndrueshëm të lëshuar për gjenerimin dhe variantin e modelit të specifikuar.
Për të specifikuar versionin më të fundit të qëndrueshëm, përdorni modelin e mëposhtëm:
<model>-<generation>-<variation>
. Për shembull,gemini-1.0-pro
.E qëndrueshme: tregon për një model specifik të qëndrueshëm. Modelet e qëndrueshme nuk ndryshojnë. Shumica e aplikacioneve të prodhimit duhet të përdorin një model specifik të qëndrueshëm.
Për të specifikuar një version të qëndrueshëm, përdorni modelin e mëposhtëm:
<model>-<generation>-<variation>-<version>
. Për shembull,gemini-1.0-pro-001
.Eksperimentale: Tregon në një model eksperimental të disponueshëm në Parapamje, siç përcaktohet në Kushtet , që do të thotë se nuk është për përdorim prodhimi. Ne lëshojmë modele eksperimentale për të mbledhur komente, për të marrë përditësimet tona më të fundit në duart e zhvilluesve shpejt dhe për të theksuar ritmin e inovacionit që ndodh në Google. Ajo që mësojmë nga lançimet eksperimentale informon se si i lëshojmë modelet më gjerësisht. Një model eksperimental mund të ndërrohet me një tjetër pa njoftim paraprak. Ne nuk garantojmë që një model eksperimental do të bëhet një model i qëndrueshëm në të ardhmen.
Për të specifikuar një version eksperimental, përdorni modelin e mëposhtëm:
<model>-<generation>-<variation>-<version>
. Për shembull,gemini-exp-1121
.
Gjuhët e disponueshme
Modelet e Binjakëve janë trajnuar për të punuar me gjuhët e mëposhtme:
- Arabisht (
ar
) - Bengalisht (
bn
) - bullgarisht (
bg
) - Kineze e thjeshtuar dhe tradicionale (
zh
) - kroatisht (
hr
) - çekisht (
cs
) - daneze (
da
) - holandisht (
nl
) - anglisht (
en
) - Estonisht (
et
) - Finlandisht (
fi
) - frëngjisht (
fr
) - gjermanisht (
de
) - greqisht (
el
) - Hebraisht (
iw
) - Hindi (
hi
) - hungareze (
hu
) - indonezisht (
id
) - italisht (
it
) - japoneze (
ja
) - Koreane (
ko
) - Letonisht (
lv
) - Lituanisht (
lt
) - Norvegjisht (
no
) - polake (
pl
) - Portugeze (
pt
) - rumanisht (
ro
) - Rusisht (
ru
) - serb (
sr
) - Sllovake (
sk
) - slloven (
sl
) - spanjisht (
es
) - Suahili (
sw
) - suedisht (
sv
) - Thai (
th
) - turqisht (
tr
) - ukrainas (
uk
) - vietnameze (
vi
)