ByteDance wordt blootgesteld aan geheim gebruik van OpenAI-technologie en het account 'suspended

Op 16 december, Peking-tijd, meldden buitenlandse media dat ByteDance, dat achterloopt in de generatieve AI-competitie, "de bochten wil bezuinigen". Het bedrijf heeft in het geheim de technologie van OpenAI gebruikt om zijn eigen grote taalmodel te ontwikkelen, wat in strijd is met de servicevoorwaarden van OpenAI. Momenteel is het account van ByteDance opgeschort door OpenAI.

Buitenlandse media zeiden dat het gedrag van ByteDance op het gebied van AI doorgaans wordt beschouwd als ‘onbeleefd’ gedrag en een directe schending van de servicevoorwaarden van OpenAI.In de servicevoorwaarden van OpenAI staat dat modellen die door het bedrijf worden geëxporteerd, niet kunnen worden gebruikt “om AI-modellen te ontwikkelen die concurreren met onze producten en diensten.” ByteDance kocht de toegang tot OpenAI via Microsoft, maar ook Microsoft formuleerde hetzelfde beleid als OpenAI.

De interne documenten van ByteDance, verkregen door buitenlandse media, bevestigen dat ByteDance in bijna elke ontwikkelingsfase vertrouwt op OpenAI’s application programming interface (API) om zijn basismodel voor grote talen met de codenaam ‘Project Seed’ te ontwikkelen, inclusief trainings- en evaluatiemodellen. Medewerkers die betrokken zijn bij Project Seed zijn zich terdege bewust van de negatieve gevolgen van deze praktijk. Volgens chatgegevens van ByteDance-medewerkers op Lark, de overzeese versie van Feishu, een intern communicatieplatform, bespraken ze hoe ze bewijsmateriaal konden vergoelijken door middel van ‘data-desensibilisatie’.Buitenlandse media zeiden dat medewerkers van ByteDance de technologie van OpenAI op grote schaal gebruikten, zozeer zelfs dat medewerkers van het ‘Seed Project’ vaak de maximale toegangslimiet van de OpenAI API bereikten.

Uit interne documenten blijkt dat ByteDance de technologie van OpenAI meer gebruikt in de vroege stadia van het ‘zaaiplan’. Een paar maanden geleden gaf het bedrijf het team opdracht om te stoppen met het gebruik van door GPT gegenereerde tekst "in elk stadium van de modelontwikkeling". Rond deze tijd kreeg het bedrijf goedkeuring om zijn eigen grote AI-model "Beanbao" uit te brengen, waarmee het "Seed Project" online kwam. ByteDance blijft de API echter gebruiken op manieren die in strijd zijn met de servicevoorwaarden van OpenAI en Microsoft, inclusief het evalueren van de prestaties van de modellen achter Doubao. Eén persoon met kennis uit de eerste hand van de interne aangelegenheden van ByteDance merkte op:"Ze zeggen dat ze er zeker van willen zijn dat alles legaal is, maar ze willen eigenlijk gewoon niet gepakt worden."

ByteDance-woordvoerder Jodi Seth antwoordde dat de door GPT gegenereerde gegevens werden gebruikt om het model te annoteren in de vroege ontwikkeling van het "Seed Project" en rond midden dit jaar uit de trainingsgegevens van ByteDance werden verwijderd. "ByteDance heeft toestemming gekregen van Microsoft om de GPT API te gebruiken. We gebruiken GPT om producten en functies in niet-Chinese markten aan te sturen, maar gebruiken ons zelfontwikkelde model om Doubao aan te sturen. Doubao is alleen beschikbaar in China", zei Seth in de verklaring.

OpenAI-woordvoerder Niko Felix heeft een verklaring afgegeven waarin hij bevestigt dat het account van ByteDance is opgeschort."Alle API-klanten moeten ons gebruiksbeleid naleven om ervoor te zorgen dat onze technologie voorgoed wordt gebruikt. Hoewel ByteDance zelden onze API's gebruikt, hebben we tijdens verder onderzoek hun accounts opgeschort. Als we constateren dat hun gebruik niet in overeenstemming is met het bedrijfsbeleid, zullen we van hen eisen dat ze de nodige wijzigingen aanbrengen of hun accounts beëindigen." zei Felix.

"Microsoft AI-oplossingen zoals de Azure Open AI-service maken deel uit van ons beperkte toegangsframework, wat betekent dat alle klanten toegang moeten aanvragen en goedkeuring van Microsoft moeten krijgen", zei Microsoft-woordvoerder Frank Shaw in een verklaring. "We stellen ook normen en bieden middelen om onze klanten te helpen deze technologieën op een verantwoorde manier te gebruiken en te voldoen aan onze servicevoorwaarden. We hebben ook processen geïmplementeerd om misbruik op te sporen en de toegang te stoppen wanneer bedrijven onze Gedragscode schenden."