Tot mai multe publicaţii jurnalistice au cerut oprirea accesului Internet Archive la conţinutul lor.
Printre ele se numără The New York Times, USA Today, Financial Times şi The Guardian.
Editorii şi-au exprimat susţinerea iniţiativei de arhivare, însă ei se tem că accesul nerestricţionat poate expune jurnalismul în faţa boţilor care adună datele mai multor website-uri pentru a îmbunătăţi limbajul sistemelor de inteligenţă artificială
De asemenea, din cauza şi persoanelor care intenţionează să evite paywall-urile (o metodă de restricţionare a accesului la conţinut şi oferit doar în schimbul unei achiziţii sau unui abonament plătit).
Jurnaliştii refuză inclusiv vânzarea conţinutului lor către companiile tehnologice care strâng mai multe date. Materialele lor media, cărţile, precum şi arhivele de ştiri sunt esenţiale pentru antrenarea şi îmbunătăţirea sistemelor AI.
La începutul anilor 1990, fondatorii World Wide Web au intenţionat să ofere un spaţiu liber pentru colaborare şi schimb de informaţii între utilizatori. Totuşi, odată cu dezvoltarea sistemelor de inteligenţă artificială, visul unui internet liber şi deschis se restrânge.
Internetul liber în lumea modelelor AI
Încă din anul 1996, Internet Archive arhivează întreaga istorie a internetului şi poate fi accesată public prin WayBack Machine, însă în prezent, tot mai multe instituţii de presă blochează accesul arhivei la paginile lor.
Sistemele de intenligenţă artificială generativă precum Gemini, ChatGPT, Copilot sau GitHub se dezvoltă tot mai mult prin arhivele mari de conţinut la care au acces (artă, materiale media, cărţi şi cercetare academică), cu care se antrenează pentru a da răspunsuri cât mai precise la solicitările utilizatorilor.
Editorii precizează că marile companii tehnologice au utilizat majoritatea conţinutului fără să plătească şi fără acordul deţinătorilor de drepturi de autor. O parte dintre aceştia au dat în judecată firmele de tech, susţinând că le-au furat proprietatea intelectuală.
Printre cele mai notabile cazuri se numără procesul iniţiat de The New York Times împotriva OpenAI, compania din spatele ChatGPT, precum şi procesul redacţiei News Corp împotriva Perplexity AI.
Cum se adaptează companiile tehnologice la aceste schimbări?
O parte dintre firmele de tech şi-au exprimat acordul pentru plătirea accesului la conţinutul editorilor. Spre exemplu, contractul News Corp cu OpenAI ar valora peste 250 de milioane de dolari americani pe parcursul a 5 ani. Astfel de acorduri au fost întocmite şi între editorii academici şi companiile tehnologice.
Edituri precum Elsevier şi Taylor & Francis au fost criticate în trecut pentru blocarea studiilor finanţate din fonduri publice în spatele unor paywall-uri comerciale. În prezent, Taylor & Francis a semnat un acord neexclusiv în valoare de 10 milioane de dolari cu Microsoft, prin care aceştia oferă companiei acces la peste 3.000 de reviste.
Totodată, editorii utilizează tehnologii pentru a bloca accesul boţilor AI neautorizaţi la conţinitul lor, printre care şi crawler-ele folosite de Internet Archive pentru a arhiva istoria internetului.
Unele redacţii jurnalistice au descris Internet Archive drept o „uşă din spate” către cataloagele lor, oferind firmelor de tech o alternativă de a continua extragerea conţinutului.
Cum au evitat utilizatorii plata pentru ştiri?
Wayback Machine a fost utilizat şi de public pentru a trece de paywall-urile ziarelor, cu toate că redacţiile jurnalistice intenţionează ca cititorii să plătească pentru ştiri.
Aceste articole reprezintă o afacere, iar modelul lor bazat pe venituri din publicitate a fost supus unei presiuni tot mai mari din partea aceloraşi companii tech care utilizează conţinutul jurnalistic pentru îmbunătăţirea şi antrenarea AI.
Publicul s-a obişnuit să citească ediţiile digitale fără să plătească, însă odată cu modificările aduse în modelele de afaceri, mai multe redacţii şi companii de ştiri mici şi mijlocii au întâmpinat probleme în finanţarea operaţiunilor.
Nici metoda plasării tuturor ştirilor comerciale în spatele paywall-urilor nu este ferită de dezavantaje.
Cu cât editorii optează pentru modele bazate exclusiv pe abonamente, cititorii trebuie fie să plătească mai multe abonamente costisitoare pentru mai multe publicaţii, fie să îşi limiteze consumul de ştiri. În caz contrar, publicul alege conţinutul online care mai este gratuit sau ştirile distribuite de algoritmii reţelelor sociale.
Organizaţia Internet Archive a mai fost implicată într-o controversă, fiind anterior dată în judecată şi găsită vinovată de încălcarea drepturilor de autor prin proiectul său Open Library.
Urmările măsurilor luate de redacţiile jurnalistice
Wayback Machine a servit drept un registru public al internetului de mai bine de 30 de ani, fiind folosit de cercetători, jurnalişti şi educatori.
Măsurile luate de redacţii vor duce la goluri majore în arhiva publică a webului. În prezent, Wayback Machine poate fi utilizat pentru a vedea prima pagină a The New York Times din iunie 1997: prima dată când Internet Archive a arhivat site-ul ziarului.
Chiar dacă Internet Archive va mai exista, utilizatorii şi cercetătorii nu vor mai avea acces la prima pagină din prezent, ceea ce se va întâmpla şi în cazul altor redacţii jurnalistice care au optat pentru aceleaşi măsuri.
Autor: Stefan Necoara stefan.necoarapaginademedia.ro