Gracenote, een bedrijf voor metadata- en contentidentificatiediensten dat eigendom is van Nielsen, heeft een rechtszaak aangespannen tegen OpenAI bij de Amerikaanse federale rechtbank voor het zuidelijke district van New York, waarbij het bedrijf op het gebied van kunstmatige intelligentie wordt beschuldigd van het op grote schaal doorzoeken en gebruiken van zijn mediametagegevensdatabase en uniek dataassociatieframework zonder toestemming en zonder enige vergoeding te betalen, voor het trainen van grote taalmodellen die commerciële producten zoals ChatGPT ondersteunen, wat een ernstige inbreuk op het auteursrecht vormt en zijn kernactiviteiten in gevaar brengt.

Gracenote verklaarde in de klacht dat het in de loop der jaren op honderden redacteuren heeft vertrouwd voor het handmatig bewerken en annoteren van film-, televisie-, muziek- en sportinhoud over de hele wereld, en dat het een ‘programmadatabase’ heeft opgezet met programma-introducties, beschrijvingen van videofuncties, unieke inhoudsidentificatoren en complexe relatiegrafieken, en dat het de registratie bij het US Copyright Office heeft voltooid. Het bedrijf is van mening dat deze database niet alleen specifieke tekstinhoud bevat, maar ook een eigen structureel ontwerp bevat om verschillende werken te classificeren, associëren en organiseren. Dit ‘relatieraamwerk’ is een belangrijke bron van waarde voor haar dienstverlening aan zakelijke klanten zoals streaming mediaplatforms en smart tv-fabrikanten.
De klacht stelt dat OpenAI de bovenstaande gegevens zonder toestemming heeft gecrawld en geassimileerd, en dat wanneer gebruikers via ChatGPT vragen stelden, het een beschrijving opleverde die zeer vergelijkbaar of zelfs volledig consistent was met de introductie van het Gracenote-programma, bijna woordelijk. Voorbeelden van Gracenote zijn onder meer wanneer een gebruiker ChatGPT vroeg om de populaire tv-serie Game of Thrones te beschrijven, en het model met bijna identieke inhoud kwam als de versie geschreven door de redacteuren van Gracenote. Het bedrijf zei ook dat meerdere versies van ChatGPT grote hoeveelheden programmabeschrijvingen in de database konden reciteren met heel weinig prompte woorden, wat aangeeft dat de relevante tekst en de onderliggende organisatiestructuur rechtstreeks waren gekopieerd en in het model waren ingebed.
Gracenote stelde voor dat OpenAI's ongeoorloofde gebruik van zijn metadata en relationele raamwerk niet alleen inbreuk maakte op auteursrechtelijk beschermde tekst en databasestructuren, maar ook distributeurs van media-inhoud en apparatuurfabrikanten de mogelijkheid bood om alternatieve metadatadiensten te bouwen op basis van 'gratis gecrawlde gegevens', waardoor de marktconcurrentiepositie van soortgelijke producten van Gracenote direct werd verzwakt. De klacht waarschuwt dat als dergelijk gedrag niet kan worden gestopt en verholpen, terminalfabrikanten zoals smart-tv's kunnen vertrouwen op gegevens die "omgekeerd zijn afgeleid" van AI-modellen om hun eigen metadataplatforms te bouwen die concurreren met Gracenote, zonder licentiekosten te hoeven betalen.
Wat claims betreft, vertrouwt Gracenote op het feit dat haar database is geregistreerd bij het Amerikaanse Copyright Office, en naast het eisen van compensatie voor daadwerkelijke verliezen, vordert het ook wettelijke schadevergoeding om om te gaan met wat volgens haar een aanhoudende en grootschalige inbreuk is. De zogenaamde wettelijke schadevergoeding heeft betrekking op een vast of bepaald bedrag dat vooraf door de wet is vastgesteld voor specifieke soorten inbreuk op het auteursrecht, terwijl feitelijke schadevergoeding wordt gebruikt om de houder van het recht te compenseren voor de daadwerkelijke economische verliezen die als gevolg van de inbreuk zijn geleden.
In reactie op een interview met Axios zei een woordvoerder van OpenAI dat zijn modellen "innovatie mogelijk maken" en zijn getraind op "openbaar beschikbare gegevens" en worden ondersteund door "redelijk gebruik". Veel AI-bedrijven, waaronder OpenAI, hebben consequent betoogd dat trainingsmodellen door het crawlen van openbare internetinhoud consistent zijn met de bepaling van redelijk gebruik onder de huidige Amerikaanse auteursrechtwetgeving, op grond van het feit dat deze gegevens gebruikers nieuwe en nuttige diensten en informatie kunnen bieden nadat ze door het model zijn getransformeerd.
Een andere reden waarom de rechtszaak van Gracenote de aandacht trekt, is dat het bedrijf altijd open heeft gestaan voor samenwerking met AI-bedrijven en meerdere AI-gerelateerde datalicentieovereenkomsten heeft gesloten met Samsung, Google en andere bedrijven. Gracenote verklaarde in de klacht dat het vele malen contact had opgenomen met OpenAI om licentiekwesties te bespreken, maar dat het "herhaaldelijk werd afgewezen of lange tijd genegeerd" en daarom zijn toevlucht moest nemen tot rechtszaken om zijn rechten en belangen te beschermen. CEO van het bedrijf, Jared Grusd, benadrukte in een verklaring dat “het ondersteunen van de ontwikkeling van AI en het tegengaan van diefstal niet inconsistent zijn. Ze zijn de enige weg naar duurzame ontwikkeling van de industrie”, en zei dat de rechtszaak tot doel heeft deze toekomst te beschermen.
Juridische professionals zijn van mening dat, nu meerdere auteursrechtgeschillen tussen media- en informatiebedrijven en AI-bedrijven in afwachting zijn van gerechtelijke uitspraken, deze zaak waarschijnlijk een belangrijk referentiepunt zal worden voor rechters om te onderzoeken of ‘niet-traditionele werken’, zoals databasestructuren en metadata-associatiekaarten, auteursrechtelijke bescherming kunnen verkrijgen en hoe de ‘grens van eerlijk gebruik van grote modellen’ kan worden bepaald. Gracenote benadrukte in haar klacht dat een groot deel van de inhoud die door OpenAI wordt geproduceerd "bijna identiek" is aan de metadata die het aan zijn klanten in licentie heeft gegeven. Daarom ontleent het geen nieuwe informatie, maar is het een substantiële kopie van bestaande inhoud. Dit zal een van de belangrijkste geschilpunten worden die deze zaak onderscheidt van andere AI-auteursrechtzaken.