Anthropic rămâne în fruntea inovației cu lansarea recentă a modelelor Claude 3.5 Sonnet și Claude 3.5 Haiku. Aceste modele reprezintă un salt semnificativ în ceea ce privește capabilitățile AI, oferind îmbunătățiri notabile în domeniul codării și utilizării instrumentelor, precum și introducerea unei noi funcționalități revoluționare: utilizarea computerului.
Claude 3.5 Sonnet, modelul îmbunătățit, se distinge prin performanțe superioare în comparație cu predecesorul său, în special în codare, un domeniu în care deja excela. În plus, Claude 3.5 Haiku se aliniază performanțelor modelului anterior, Claude 3 Opus, în multe evaluări, menținând costurile și viteza similare cu generația anterioară de Haiku.
Noua capacitate de utilizare a computerului, disponibilă în versiune beta publică, permite dezvoltatorilor să direcționeze modelul Claude să folosească computere în mod similar cu oamenii: privind ecranul, mișcând cursorul, apăsând butoane și tastând text. Această funcționalitate este încă experimentală și poate fi uneori greoaie și predispusă la erori, dar Anthropic a lansat această capacitate în stadiu incipient pentru a colecta feedback de la dezvoltatori, anticipând îmbunătățiri rapide în timp.
Companii precum Asana, Canva, Cognition, DoorDash, Replit și The Browser Company au început deja să exploreze aceste posibilități, efectuând sarcini care necesită zeci sau chiar sute de pași pentru a fi completate. De exemplu, Replit utilizează capabilitățile lui Claude 3.5 Sonnet cu utilizarea computerului și navigarea UI pentru a dezvolta o caracteristică cheie care evaluează aplicațiile în timp ce sunt construite pentru produsul lor Replit Agent.
Claude 3.5 Sonnet demonstrează îmbunătățiri pe scară largă în benchmark-urile industriei, cu câștiguri puternice în codarea agentică și sarcinile de utilizare a instrumentelor. În codare, modelul își îmbunătățește performanța pe SWE-bench Verified de la 33.4% la 49.0%, depășind toate modelele public disponibile, inclusiv modelele de raționament precum OpenAI o1-preview și sistemele specializate pentru codare agentică.
Feedback-ul timpuriu de la clienți sugerează că Claude 3.5 Sonnet îmbunătățit reprezintă un salt semnificativ pentru codarea asistată de AI. GitLab, care a testat modelul pentru sarcini DevSecOps, a constatat că acesta oferă un raționament mai puternic (până la 10% în cazuri de utilizare) fără latență adăugată, făcându-l o alegere ideală pentru procese de dezvoltare software multi-pas.
Cu aceste avansuri, Claude 3.5 Sonnet și Claude 3.5 Haiku marchează o nouă eră în inteligența artificială, deschizând calea pentru aplicații mai sofisticate și mai integrate în fluxurile de lucru ale dezvoltatorilor și companiilor. Pe măsură ce aceste modele continuă să evolueze și să se rafineze, potențialul lor de a transforma industria software și de a îmbunătăți interacțiunea dintre om și computer devine din ce în ce mai evident. Cu siguranță, vom urmări cu interes progresul lui Claude 3.5 și impactul său asupra viitorului tehnologiei.