Gara për të udhëhequr AI është bërë një gjueti e dëshpëruar për të dhënat dixhitale të nevojshme për të avancuar teknologjinë. Për të marrë këto të dhëna, kompanitë e teknologjisë, përfshirë OpenAI, Google dhe Meta, kanë ndërprerë, kanë injoruar politikat e korporatave dhe kanë debatuar për ndryshimin e ligjit, sipas një ekzaminimi nga The New York Times.
Në Meta, e cila zotëron Facebook dhe Instagram, menaxherët, avokatët dhe inxhinierët diskutuan vitin e kaluar blerjen e shtëpisë botuese Simon & Schuster për të blerë vepra të gjata, sipas regjistrimeve të takimeve të brendshme të siguruara nga The Times. Ata gjithashtu këshilluan mbledhjen e të dhënave të mbrojtura nga e drejta e autorit nga i gjithë interneti, edhe nëse kjo nënkuptonte përballjen me padi. Negocimi i licencave me botuesit, artistët, muzikantët dhe industrinë e lajmeve do të zgjaste shumë, thanë ata.
Ashtu si OpenAI, Google transkriptoi videot e YouTube për të mbledhur tekstin për modelet e tij të AI, thanë pesë njerëz me njohuri për praktikat e kompanisë. Kjo ka shkelur potencialisht të drejtat e autorit për videot, të cilat i përkasin krijuesve të tyre.
Vitin e kaluar, Google gjithashtu zgjeroi kushtet e tij të shërbimit. Një motivim për ndryshimin, sipas anëtarëve të ekipit të privatësisë së kompanisë dhe një mesazhi të brendshëm të parë nga The Times, ishte që të lejonte Google që të ishte në gjendje të prekte Google Docs të disponueshme publikisht, rishikimet e restoranteve në Google Maps dhe materiale të tjera në internet për më shumë nga Produktet e AI.
Veprimet e kompanive ilustrojnë sesi informacioni në internet – lajme, vepra fiktive, postime në tabelën e mesazheve, artikuj të Wikipedia, programe kompjuterike, foto, podkaste dhe klipe filmash – është bërë gjithnjë e më shumë burimi jetësor i industrisë së lulëzuar të AI. Krijimi i sistemeve novatore varet nga disponimi i të dhënave të mjaftueshme për të mësuar teknologjitë që të prodhojnë menjëherë tekst, imazhe, tinguj dhe video që i ngjajnë asaj që krijon njeriu.