Gemini 2.0 Flash Experimental is now available! Learn more

This page was translated by the Cloud Translation API.

Modelet e Binjakëve

2.0 flash

Modeli ynë më i ri multimodal, me karakteristika të gjeneratës së ardhshme dhe aftësi të përmirësuara

Futni audio, imazhe, video dhe tekst — merrni përgjigje teksti, imazhi dhe audio
Paraqet ndërveprime bisedore me vonesë të ulët me API-në tonë Multimodal Live

1.5 e ndezjes

Modeli ynë multimodal më i balancuar me performancë të shkëlqyer për shumicën e detyrave

Futni audio, imazhe, video dhe tekst, merrni përgjigje me tekst
Gjeneroni kod, nxirrni të dhëna, modifikoni tekstin dhe më shumë
Më e mira për detyra që balancojnë performancën dhe koston

1.5 Pro

Modeli ynë multimodal me performancën më të mirë me veçori për një shumëllojshmëri të gjerë detyrash arsyetimi

Futni audio, imazhe, video dhe tekst, merrni përgjigje me tekst
Gjeneroni kod, nxirrni të dhëna, modifikoni tekstin dhe më shumë
Për kur keni nevojë për një rritje të performancës

Variantet e modelit

Gemini API ofron modele të ndryshme që janë optimizuar për raste të veçanta përdorimi. Këtu është një përmbledhje e shkurtër e varianteve të Binjakëve që janë në dispozicion:

Varianti i modelit	Të dhëna hyrëse	Prodhimi	Optimizuar për
Binjakët 2.0 Flash `gemini-2.0-flash-exp`	Audio, imazhe, video dhe tekst	Tekst, imazhe (së shpejti) dhe audio (së shpejti)	Karakteristikat e gjeneratës së ardhshme, shpejtësia dhe gjenerimi multimodal për një larmi detyrash
Binjakët 1.5 Flash `gemini-1.5-flash`	Audio, imazhe, video dhe tekst	Teksti	Performancë e shpejtë dhe e gjithanshme në një sërë detyrash të ndryshme
Binjakët 1.5 Flash-8B `gemini-1.5-flash-8b`	Audio, imazhe, video dhe tekst	Teksti	Detyra me volum të lartë dhe inteligjencë më të ulët
Gemini 1.5 Pro `gemini-1.5-pro`	Audio, imazhe, video dhe tekst	Teksti	Detyra komplekse të arsyetimit që kërkojnë më shumë inteligjencë
Gemini 1.0 Pro `gemini-1.0-pro` (Përdorur më 15.2.2025)	Teksti	Teksti	Detyrat e gjuhës natyrore, biseda me tekst dhe kode me shumë kthesa dhe gjenerimi i kodeve
Përfshirja e tekstit `text-embedding-004`	Teksti	Përfshirjet e tekstit	Matja e lidhjes së vargjeve të tekstit
AQA `aqa`	Teksti	Teksti	Sigurimi i përgjigjeve të bazuara në burim për pyetjet

Gemini 2.0 Flash (eksperimental)

Gemini 2.0 Flash ofron veçori të gjeneratës së ardhshme dhe aftësi të përmirësuara, duke përfshirë shpejtësinë superiore, përdorimin e mjeteve vendase, gjenerimin multimodal dhe një dritare të kontekstit të tokenit 1M. Mësoni më shumë rreth Gemini 2.0 Flash në faqen tonë të përmbledhjes .

Provo në Google AI Studio

Detajet e modelit

Pronës	Përshkrimi
i modelit	`models/gemini-2.0-flash-exp`
llojet e të dhënave të mbështetura	Inputet Audio, imazhe, video dhe tekst Prodhimi Audio (së shpejti), imazhe (së shpejti) dhe tekst
Kufijtë e tokenit ^[*]	Kufiri i shenjës së hyrjes 1,048,576 Kufiri i shenjës së daljes 8192
Kufijtë e normës ^[**]	10 rpm 4 milionë TPM 1500 RPD
Aftësitë	Rezultatet e strukturuara Mbështetur Caching Nuk mbështetet Akordim Nuk mbështetet Thirrja e funksionit Mbështetur Ekzekutimi i kodit Mbështetur Kërko Mbështetur Gjenerimi i imazhit Mbështetur Përdorimi i mjetit vendas Mbështetur Gjenerimi i audios Mbështetur API Multimodal Live Mbështetur
versione	Lexoni modelet e versionit të modelit për më shumë detaje. Më e fundit: `gemini-2.0-flash-exp`
Përditësimi i fundit	dhjetor 2024
Ndërprerja e njohurive	gusht 2024

Binjakët 1.5 Flash

Gemini 1.5 Flash është një model multimodal i shpejtë dhe i gjithanshëm për shkallëzimin e detyrave të ndryshme.

Provo në Google AI Studio

Detajet e modelit

Pronës	Përshkrimi
i modelit	`models/gemini-1.5-flash`
llojet e të dhënave të mbështetura	Inputet Audio, imazhe, video dhe tekst Prodhimi Teksti
Kufijtë e tokenit ^[*]	Kufiri i shenjës së hyrjes 1,048,576 Kufiri i shenjës së daljes 8192
Karakteristikat audio/vizuale	Numri maksimal i imazheve për kërkesë 3600 Gjatësia maksimale e videos 1 orë Gjatësia maksimale e audios Përafërsisht 9.5 orë
Kufijtë e normës ^[**]	Falas: 15 rpm 1 milion TPM 1500 RPD Pay-as-you-go: 2000 rpm 4 milionë TPM
Aftësitë	Udhëzimet e sistemit Mbështetur Modaliteti JSON Mbështetur Skema JSON Mbështetur Cilësimet e rregullueshme të sigurisë Mbështetur Caching Mbështetur Akordim Mbështetur Thirrja e funksionit Mbështetur Ekzekutimi i kodit Mbështetur Transmetim i dyanshëm Nuk mbështetet
versione	Lexoni modelet e versionit të modelit për më shumë detaje. Më e fundit: `gemini-1.5-flash-latest` Stabili i fundit: `gemini-1.5-flash` E qëndrueshme: `gemini-1.5-flash-001` `gemini-1.5-flash-002`
Përditësimi i fundit	shtator 2024

Binjakët 1.5 Flash-8B

Gemini 1.5 Flash-8B është një model i vogël i krijuar për detyra me inteligjencë më të ulët.

Provo në Google AI Studio

Detajet e modelit

Pronës	Përshkrimi
i modelit	`models/gemini-1.5-flash-8b`
llojet e të dhënave të mbështetura	Inputet Audio, imazhe, video dhe tekst Prodhimi Teksti
Kufijtë e tokenit ^[*]	Kufiri i kodit të hyrjes 1,048,576 Kufiri i shenjës së daljes 8192
Karakteristikat audio/vizuale	Numri maksimal i imazheve për kërkesë 3600 Gjatësia maksimale e videos 1 orë Gjatësia maksimale e audios Përafërsisht 9.5 orë
Kufijtë e normës ^[**]	Falas: 15 rpm 1 milion TPM 1500 RPD Pay-as-you-go: 4000 rpm 4 milionë TPM
Aftësitë	Udhëzimet e sistemit Mbështetur Modaliteti JSON Mbështetur Skema JSON Mbështetur Cilësimet e rregullueshme të sigurisë Mbështetur Caching Mbështetur Akordim Mbështetur Thirrja e funksionit Mbështetur Ekzekutimi i kodit Mbështetur Transmetim i dyanshëm Nuk mbështetet
versione	Lexoni modelet e versionit të modelit për më shumë detaje. Më e fundit: `gemini-1.5-flash-8b-latest` Stalla e fundit: `gemini-1.5-flash-8b` E qëndrueshme: `gemini-1.5-flash-8b-001`
Përditësimi i fundit	tetor 2024

Gemini 1.5 Pro

Gemini 1.5 Pro është një model multimodal i madhësisë së mesme që është optimizuar për një gamë të gjerë detyrash arsyetimi. 1.5 Pro mund të përpunojë sasi të mëdha të dhënash menjëherë, duke përfshirë 2 orë video, 19 orë audio, baza kodesh me 60,000 rreshta kodi ose 2,000 faqe tekst.

Provo në Google AI Studio

Detajet e modelit

Pronës	Përshkrimi
i modelit	`models/gemini-1.5-pro`
llojet e të dhënave të mbështetura	Inputet Audio, imazhe, video dhe tekst Prodhimi Teksti
Kufijtë e tokenit ^[*]	Kufiri i kodit të hyrjes 2,097,152 Kufiri i shenjës së daljes 8192
Karakteristikat audio/vizuale	Numri maksimal i imazheve për kërkesë 7200 Gjatësia maksimale e videos 2 orë Gjatësia maksimale e audios Përafërsisht 19 orë
Kufijtë e normës ^[**]	Falas: 2 RPM 32,000 TPM 50 RPD Pay-as-you-go: 1000 rpm 4 milionë TPM
Aftësitë	Udhëzimet e sistemit Mbështetur Modaliteti JSON Mbështetur Skema JSON Mbështetur Cilësimet e rregullueshme të sigurisë Mbështetur Caching Mbështetur Akordim Nuk mbështetet Thirrja e funksionit Mbështetur Ekzekutimi i kodit Mbështetur Transmetim i dyanshëm Nuk mbështetet
versione	Lexoni modelet e versionit të modelit për më shumë detaje. E fundit: `gemini-1.5-pro-latest` Stabili më i fundit: `gemini-1.5-pro` E qëndrueshme: `gemini-1.5-pro-001` `gemini-1.5-pro-002`
Përditësimi i fundit	shtator 2024

Gemini 1.0 Pro (i vjetëruar)

Gemini 1.0 Pro është një model NLP që trajton detyra si biseda me tekst dhe kode me shumë kthesa, si dhe gjenerimi i kodeve.

Provo në Google AI Studio

Detajet e modelit

Pronës	Përshkrimi
i modelit	`models/gemini-1.0-pro`
llojet e të dhënave të mbështetura	Input Teksti Prodhimi Teksti
Kufijtë e normës ^[**]	Falas: 15 rpm 32,000 TPM 1500 RPD Pay-as-you-go: 360 rpm 120,000 TPM 30,000 RPD
Aftësitë	Udhëzimet e sistemit Nuk mbështetet Modaliteti JSON Nuk mbështetet Skema JSON Nuk mbështetet Cilësimet e rregullueshme të sigurisë Mbështetur Caching Nuk mbështetet Akordim Mbështetur Thirrja e funksionit Mbështetur Konfigurimi i thirrjes së funksionit Nuk mbështetet Ekzekutimi i kodit Nuk mbështetet Transmetim i dyanshëm Nuk mbështetet
versione	Më të fundit: `gemini-1.0-pro-latest` Stabili më i fundit: `gemini-1.0-pro` E qëndrueshme: `gemini-1.0-pro-001`
Përditësimi i fundit	shkurt 2024

Shënim: gemini-pro është një pseudonim për gemini-1.0-pro .

Embedding dhe Embedding tekst

Përfshirja e tekstit

Përfshirjet e tekstit përdoren për të matur lidhjen e vargjeve dhe përdoren gjerësisht në shumë aplikacione të AI.

text-embedding-004 arrin një performancë më të fortë rikthimi dhe tejkalon modelet ekzistuese me dimensione të krahasueshme, në standardet standarde të ngulitjes MTEB.

Detajet e modelit

Pronës	Përshkrimi
i modelit	Binjakët API `models/text-embedding-004`
llojet e të dhënave të mbështetura	Input Teksti Prodhimi Përfshirjet e tekstit
Kufijtë e tokenit ^[*]	Kufiri i kodit të hyrjes 2048 Madhësia e dimensionit të daljes 768
Kufijtë e normës ^[**]	1500 kërkesa në minutë
Cilësimet e rregullueshme të sigurisë	Nuk mbështetet
Përditësimi i fundit	Prill 2024

Embedding

Mund të përdorni modelin Embedding për të gjeneruar ngulitje teksti për tekstin hyrës.

Modeli Embedding është optimizuar për krijimin e ngulitjeve me 768 dimensione për tekst deri në 2048 token.

Përfshirja e detajeve të modelit

Pronës	Përshkrimi
i modelit	`models/embedding-001`
llojet e të dhënave të mbështetura	Input Teksti Prodhimi Përfshirjet e tekstit
Kufijtë e tokenit ^[*]	Kufiri i kodit të hyrjes 2048 Madhësia e dimensionit të daljes 768
Kufijtë e normës ^[**]	1500 kërkesa në minutë
Cilësimet e rregullueshme të sigurisë	Nuk mbështetet
Përditësimi i fundit	dhjetor 2023

AQA

Ju mund të përdorni modelin AQA për të kryer detyra të lidhura me pyetje-përgjigje (AQA) mbi një dokument, korpus ose një grup pasazhesh. Modeli AQA kthen përgjigje për pyetjet që janë të bazuara në burimet e ofruara, së bashku me vlerësimin e probabilitetit të përgjigjes.

Detajet e modelit

Pronës	Përshkrimi
i modelit	`models/aqa`
llojet e të dhënave të mbështetura	Input Teksti Prodhimi Teksti
e mbështetur	anglisht
Kufijtë e tokenit ^[*]	Kufiri i kodit të hyrjes 7168 Kufiri i shenjës së daljes 1024
Kufijtë e normës ^[**]	1500 kërkesa në minutë
Cilësimet e rregullueshme të sigurisë	Mbështetur
Përditësimi i fundit	dhjetor 2023

Shihni shembujt për të eksploruar aftësitë e këtyre variacioneve të modelit.

[*] Një shenjë është e barabartë me rreth 4 karaktere për modelet Gemini. 100 shenja janë rreth 60-80 fjalë angleze.

[**] RPM: Kërkesa për minutë
TPM: Shenja për minutë
RPD: Kërkesa në ditë
TPD: Shenjat në ditë

Për shkak të kufizimeve të kapacitetit, kufijtë e specifikuar të tarifave maksimale nuk janë të garantuara.

Modelet e emrave të versionit të modelit

Modelet e Binjakëve janë në dispozicion në versione paraprake ose të qëndrueshme . Në kodin tuaj, mund të përdorni një nga formatet e mëposhtme të emrit të modelit për të specifikuar modelin dhe versionin që dëshironi të përdorni.

Më e fundit: Tregon versionin më të fundit të modelit për një gjenerim dhe variacion të caktuar. Modeli themelor përditësohet rregullisht dhe mund të jetë një version paraprak. Vetëm aplikacionet dhe prototipet e testimit eksplorues duhet ta përdorin këtë pseudonim.
Për të specifikuar versionin më të fundit, përdorni modelin e mëposhtëm: <model>-<generation>-<variation>-latest . Për shembull, gemini-1.0-pro-latest .
Stabiliteti më i fundit: Tregon në versionin më të fundit të qëndrueshëm të lëshuar për gjenerimin dhe variantin e modelit të specifikuar.
Për të specifikuar versionin më të fundit të qëndrueshëm, përdorni modelin e mëposhtëm: <model>-<generation>-<variation> . Për shembull, gemini-1.0-pro .
E qëndrueshme: tregon për një model specifik të qëndrueshëm. Modelet e qëndrueshme nuk ndryshojnë. Shumica e aplikacioneve të prodhimit duhet të përdorin një model specifik të qëndrueshëm.
Për të specifikuar një version të qëndrueshëm, përdorni modelin e mëposhtëm: <model>-<generation>-<variation>-<version> . Për shembull, gemini-1.0-pro-001 .
Eksperimentale: Tregon në një model eksperimental të disponueshëm në Parapamje, siç përcaktohet në Kushtet , që do të thotë se nuk është për përdorim prodhimi. Ne lëshojmë modele eksperimentale për të mbledhur komente, për të marrë përditësimet tona më të fundit në duart e zhvilluesve shpejt dhe për të theksuar ritmin e inovacionit që ndodh në Google. Ajo që mësojmë nga lançimet eksperimentale informon se si i lëshojmë modelet më gjerësisht. Një model eksperimental mund të ndërrohet me një tjetër pa njoftim paraprak. Ne nuk garantojmë që një model eksperimental do të bëhet një model i qëndrueshëm në të ardhmen.
Për të specifikuar një version eksperimental, përdorni modelin e mëposhtëm: <model>-<generation>-<variation>-<version> . Për shembull, gemini-exp-1121 .

Gjuhët e disponueshme

Modelet e Binjakëve janë trajnuar për të punuar me gjuhët e mëposhtme:

Arabisht ( ar )
Bengalisht ( bn )
bullgarisht ( bg )
Kineze e thjeshtuar dhe tradicionale ( zh )
kroatisht ( hr )
çekisht ( cs )
daneze ( da )
holandisht ( nl )
anglisht ( en )
Estonisht ( et )
Finlandisht ( fi )
frëngjisht ( fr )
gjermanisht ( de )
greqisht ( el )
Hebraisht ( iw )
Hindi ( hi )
hungareze ( hu )
indonezisht ( id )
italisht ( it )
japoneze ( ja )
Koreane ( ko )
Letonisht ( lv )
Lituanisht ( lt )
Norvegjisht ( no )
polake ( pl )
Portugeze ( pt )
rumanisht ( ro )
Rusisht ( ru )
serb ( sr )
Sllovake ( sk )
slloven ( sl )
spanjisht ( es )
Suahili ( sw )
suedisht ( sv )
Thai ( th )
turqisht ( tr )
ukrainas ( uk )
vietnameze ( vi )