Wikipedia testează o modalitate de a ține roboții de antrenament AI departe

Știri
Spread the love

Wikipedia, unul dintre cele mai populare și accesibile repozitorii de cunoștințe online, se confruntă cu o provocare importantă odată cu ascensiunea inteligenței artificiale generative. O multitudine de roboți AI răzuiesc paginile Wikipedia pentru a colecta date de antrenament pentru modelele lingvistice, iar acest proces a început să afecteze funcționarea platformei.

Problema suprasolicitării serverelor

Potrivit Wikimedia Foundation, roboții AI care accesează conținutul Wikipedia au consumat aproape 50% din lățimea de bandă a platformei. Aceasta a dus la o încărcare excesivă a infrastructurii tehnice și a ridicat preocupări legate de sustenabilitatea accesului deschis la informație.

Soluția: Parteneriatul cu Kaggle

Pentru a reduce presiunea asupra serverelor, Wikipedia a inițiat un parteneriat cu Kaggle, o companie deținută de Google, și a lansat un set de date structurat, disponibil pentru dezvoltatorii AI. Setul de date conține articole Wikipedia pre-analizate, ușor accesibile pentru utilizare în antrenarea modelelor lingvistice.

Această abordare ar putea fi un pas înainte spre o gestionare mai etică și legală a procesului de colectare a datelor. Spre deosebire de alte surse de informații care protejează conținutul sub drepturi de autor, Wikipedia operează sub licența Creative Commons Attribution-ShareAlike, ceea ce permite utilizarea materialelor sale atâta timp cât sunt atribuite corespunzător.

Impactul asupra viitorului AI

Această mișcare ar putea influența întreaga industrie AI, determinând companiile de inteligență artificială să caute metode mai transparente și sustenabile de a obține date pentru antrenarea modelelor. În plus, ar putea încuraja platformele digitale să adopte soluții similare pentru protejarea infrastructurii lor.

Wikipedia a fost întotdeauna un exemplu de acces liber la cunoștințe, iar această nouă strategie arată cum se adaptează la provocările tehnologice ale erei digitale.

Tagged

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *