Google Gemini-Exp-1114 depășește în teste GPT-4o de la OpenAI

AI News

Google a lansat recent modelul experimental Gemini-Exp-1114, care a depășit GPT-4o de la OpenAI în testele de referință, marcând o schimbare semnificativă în peisajul competitiv al inteligenței artificiale.

Performanță de Top

Dezvoltat de divizia DeepMind a Google, Gemini-Exp-1114 a obținut primul loc în evaluările recente de pe platforma Chatbot Arena, care utilizează teste comunitare anonime pentru a măsura capacitățile AI. Cu peste 6.000 de voturi din partea utilizatorilor, Gemini-Exp-1114 a atins un scor de 1344, depășind iterațiile anterioare și egalând scorurile modelului GPT-4o de la OpenAI, care a condus clasamentele din septembrie 2024.

Disponibilitate Limitată

În ciuda acestei realizări, modelul Gemini-Exp-1114 este accesibil doar prin Google AI Studio, o platformă destinată dezvoltatorilor care experimentează cu tehnologii emergente. Această disponibilitate limitată subliniază strategia Google de actualizări iterative menite să îmbunătățească performanța înainte de o lansare mai largă.

Provocările OpenAI

În contrast cu progresul recent al Google, modelul Orion de la OpenAI a întâmpinat dificultăți. Spre deosebire de avansările anterioare observate în tranziția de la GPT-3 la GPT-4, îmbunătățirile aduse modelului Orion au fost incrementale. CEO-ul OpenAI, Sam Altman, a menționat limitările resurselor de calcul ca fiind o provocare critică care a întârziat lansarea noilor modele.

Date Sintetice și Optimizare Post-Antrenament

Un obstacol semnificativ în dezvoltarea noilor modele de limbaj de mari dimensiuni este disponibilitatea redusă a datelor de înaltă calitate. În acest context, OpenAI a adoptat date sintetice ca soluție alternativă. Datele sintetice constau în seturi de date generate de mașini care imită proprietățile textului din lumea reală, suplimentând datele naturale limitate.

Pentru a aborda aceste limitări, OpenAI a utilizat și tehnici de optimizare post-antrenament, care rafinează modelele după faza principală de antrenament, îmbunătățindu-le capacitățile fără a necesita seturi noi de date vaste.

Sisteme AI Specializate și Eficiente

Pe măsură ce competiția se intensifică, companiile își concentrează atenția asupra sistemelor specializate care răspund nevoilor specifice. De exemplu, cadrul „Strawberry” care susține modelul o1-preview de la OpenAI este un exemplu al acestei abordări. Aceste modele mai mici și specifice pot oferi performanțe robuste cu resurse mai puține comparativ cu omologii lor mai mari.

Mai multe informații și sursa.

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *