ChatGPT-ontwikkelaar OpenAI zei dat het de onderhandelingen met tientallen uitgevers versnelt om overeenkomsten te bereiken om hun exclusieve inhoud of artikelen te licentiëren voor training op OpenAI-gegevens. Dit is een bredere licentie-inspanning dan voorheen bekend wasDe AI-startup is op zoek naar meer inhoud om zijn kunstmatige-intelligentiemodellen te trainen, en bereidt zich voor op zijn ‘AppStore-moment’ – een aangepaste GPT-app store ‘GPTStore’ gebaseerd op zijn tekstgenererende AI-modellen zoals GPT-4, die volgende week wordt gelanceerd.
"We zijn met een aantal uitgeverijen in onderhandeling en overleg. Ze zijn heel actief, ze zijn heel proactief en het lijkt mij dat het goed gaat." Tom Rubin, OpenAI's directeur intellectueel eigendom en inhoud, zei in een interview met de media. "Je hebt gezien dat deze deals zijn aangekondigd en er zullen er nog meer volgen."
Een persoon die bekend was met de zaak vertelde eerder aan de media dat OpenAI onlangs een meerjarige licentieovereenkomst heeft getekend met Axel Springer SE, het moederbedrijf van Politico, ter waarde van tientallen miljoenen dollars. In juli 2023 kondigde OpenAI een belangrijke overeenkomst aan met The Associated Press (The Associated Press), maar maakte het specifieke bedrag van de overeenkomst niet bekend. De deals zijn van cruciaal belang voor de toekomst van OpenAI, omdat het bedrijf de behoefte aan bijgewerkte, nauwkeurige gegevens om modellen te bouwen in evenwicht houdt met een steeds strenger onderzoek naar gegevensbronnen.
Maar vorige week heeft The New York Times, een van de media die met OpenAI had onderhandeld, OpenAI en OpenAI’s meerderheidsaandeelhouder Microsoft aangeklaagd wegens het zonder toestemming gebruiken van het artikel van het tijdschrift.
De rechtszaak werpt kritische uitdagingen op voor verschillende bedrijven van OpenAI. Als The New York Times de overhand krijgt, zou OpenAI niet alleen miljarden dollars schuldig kunnen zijn, maar zou het ook gedwongen kunnen worden al zijn trainingsgegevens te vernietigen, inclusief alle gegevens met betrekking tot de inhoud van The New York Times, een dure en complexe taak. Meer direct bemoeilijkt de rechtszaak echter de pogingen van OpenAI om samenwerkingsovereenkomsten met de media-industrie te sluiten.
Maar Rubin zei: "De huidige situatie is heel anders dan waar uitgevers in het verleden mee te maken hebben gehad op zoekmachines en sociale media. Hier wordt inhoud gebruikt om modellen te trainen, en niet om inhoud te kopiëren, noch om originele inhoud te vervangen."
De New York Times is het echter niet eens met het standpunt van OpenAI en is van mening dat ChatGPT plagiaat pleegde op het werk van zijn verslaggevers zonder daarvoor te betalen. In de rechtszaak liet de uitgever voorbeelden zien van ChatGPT die hele passages uit de New York Times bijna woordelijk overnam – en sommige verslaggevers wezen er zelfs op dat ChatGPT er in sommige gevallen specifiek toe werd aangezet inhoud uit de New York Times te kopiëren. De uitgever denkt dat dit bewijst dat OpenAI illegaal data uit The New York Times heeft gebruikt.
"Als Microsoft en OpenAI onze resultaten voor commerciële doeleinden willen gebruiken, zijn ze wettelijk verplicht om eerst onze toestemming te verkrijgen", aldus de New York Times in een verklaring. "Dat hebben ze echter niet gedaan."
Als OpenAI er niet in slaagt een samenwerkingsovereenkomst te bereiken met de New York Times en meer uitgevers van nieuwsinhoud, zal het niet alleen te maken krijgen met enorme compensaties, maar ook met aanzienlijk inhoudsverlies als gevolg van datatraining, wat grote obstakels zal vormen voor de vele bedrijven, vooral de aankomende “GPT-winkel” van het bedrijf. Met de zogenaamde GPTStore kunnen gebruikers deelnemen aan de ontwikkeling van op maat gemaakte applicaties vergelijkbaar met ChatGPT en deze delen en promoten. Wanneer anderen het product gebruiken, kan er winst worden gerealiseerd, wat gelijkwaardig is aan de "AppStore" gebaseerd op OpenAI-grootmodeltechnologie.
Volgens berichten in de media is OpenAI van plan om ergens in de komende week de GPT Store (GPTStore) te lanceren, een aangepaste GPT-applicatiewinkel gebaseerd op het AI-model voor het genereren van tekst (zoals GPT-4). Het kan worden beschouwd als de "APPStore" gelanceerd door OpenAI in combinatie met het grote GPT-model. GPTStore is ontworpen om alle gebruikers in staat te stellen GPT-applicaties te delen en te verkopen, zoals chatbots die zijn aangepast voor verschillende doeleinden en gebaseerd op het grote GPT-model.
Voor het lanceren van een GPT-applicatie in de GPT-winkel is niet eens programmeerervaring vereist, dus gewone deelnemers kunnen net als professionele ontwikkelaars ook applicaties ontwikkelen. Ontwikkelaars voeren eenvoudigweg in eenvoudige taal de functies in die zij willen dat hun GPT-applicatie biedt, en OpenAI's GPT-applicatiebouwtool GPTBuilder zal proberen een AI-aangedreven chatbot te creëren om die functies uit te voeren.
Tijdens het bouwen van GPT-applicaties hoeven ontwikkelaars alleen eenvoudige dialooginstructies en aanvullende kennisgegevens in te dienen en vervolgens te kiezen of ze multimodale functies nodig hebben, zoals netwerkzoeken, gegevensanalyse en het genereren van afbeeldingen. Ze kunnen snel vergelijkbare ChatGPT-applicaties ontwikkelen op specifieke gebieden zoals recht, geneeskunde en bouw.
Door bijvoorbeeld enkele eenvoudige voorbereidende handelingen uit te voeren, kan een GPT-applicatie worden getraind op een receptenset, zodat deze vragen over specifieke receptingrediënten kan beantwoorden, en is een GPT-applicatie gericht op het receptenveld geboren. Als alternatief zou GPT de eigen codebasis van een specifiek bedrijf kunnen overnemen, zodat meer gespecialiseerde ontwikkelaars hun applicatiestijlen kunnen inspecteren of code kunnen genereren op basis van best practices.
OpenAI zei dat ontwikkelaars die GPT-applicaties bouwen het bijgewerkte gebruiksbeleid en de GPT-merkrichtlijnen van het bedrijf moeten beoordelen om er zeker van te zijn dat hun GPT-compatibel is voordat ze in aanmerking komen voor publieke lancering in de GPT-winkel. Ze moeten ook hun gebruikersprofiel verifiëren en ervoor zorgen dat hun GPT-publicatie een "openbaar" karakter heeft.