Op 1 juli, Beijing-tijd, lanceerde de Amerikaanse hoofdmodelfabrikant Anthropic een nieuwe generatie middenklasse hoofdmodel Claude Sonnet 5. Tegelijkertijd bevestigde de functionaris dat het een kennisgeving heeft ontvangen van het Amerikaanse ministerie van Handel om de beperkingen op de topmodellen van het bedrijf, Claude Fable 5 en Mythos 5, officieel op te heffen, en vanaf morgen de wereldwijde toegang volledig zal herstellen.
Anthropic heeft echter niet direct gereageerd op de vraag van internetgebruikers of het nieuwe model voor iedereen toegankelijk is of alleen voor geauthenticeerde gebruikers/burgers. Eerder onthulden functionarissen dat Anthropic nauw heeft samengewerkt met de Amerikaanse overheid en Mythos5 op 27 juni heeft ingezet bij enkele Amerikaanse operaties en defensie-kritische infrastructuurorganisaties.
De lancering van Sonnet 5 markeert de voltooiing van Anthropic’s modelsysteem van de vijfde generatie. In de productserie bevindt Sonnet 5 zich tussen de lichtgewicht Haiku 5 en het high-end vlaggenschip Opus 4.8 (en Fable 5). Uit testgegevens blijkt dat Sonnet 5 op het gebied van de kernprogrammeringsmogelijkheden van Agent een score van 63,2% noteerde, 5,1 procentpunten hoger dan de Sonnet 4.6 van de vorige generatie (58,1%), en dat de kloof met het vlaggenschip Opus 4.8 (69,2%) kleiner werd tot minder dan 6%.

In de officiële lay-out voor technologische positionering richt het Sonnet 5 longboard zich op het genereren van complexe code, diepgaande analyse van lange documenten, meerstapsautomatisering en de sterke implementatie van "computerbesturing" (inclusief onafhankelijke overname van browsers, terminals en GUI's). Het nieuwe model heeft de mogelijkheid om onafhankelijk langetermijnplannen te formuleren en oproepen tussen verschillende tools te coördineren. Het kan lange tijd zelfstandig draaien zonder handmatige tussenkomst en voldoet aan de behoeften van de huidige ontwikkelaarsgemeenschap voor het uitvoeren van langetermijntaken.
Agent- en landingsapplicatiemogelijkheden vormen ook de focus van Anthropic's belangrijkste concurrentie met OpenAI. Om te kunnen concurreren met de commerciële gegevens en inkomstenredline van OpenAI voordat deze openbaar worden, heeft Anthropic een nieuwe woordsegmenter (Tokenizer) in Sonnet 5 geadopteerd, die de onderliggende nauwkeurigheid verbetert en ervoor zorgt dat dezelfde tekstinvoer 1,0 tot 1,35 keer meer tokens verbruikt dan voorheen.
Om zich in te dekken tegen het herstel van de totale gebruikerskosten (TCO) veroorzaakt door de reconstructie van de tokenizer, heeft Anthropic een gefaseerde prijspromotie gelanceerd: tijdens de promotieperiode vóór 31 augustus wordt de basisprijs per miljoen tokens van de API verlaagd tot US$2 voor input en US$10 voor output; maar vanaf 1 september keert het terug naar de standaardfacturering (3 dollar voor input en 15 dollar voor output). De ontwikkelaarsgroep is van mening dat als gevolg van de uitbreiding van de werkelijke tokenconsumptiebasis, de werkelijke belrekening na de promotieperiode onvermijdelijk hoger zal zijn dan de historische versie.
Achter deze zakelijke beslissing schuilt de financiële druk van vóór de beursintroductie waarmee Anthropic te maken kreeg. Wanneer Wall Street geavanceerde AI-laboratoria evalueert, kijkt het niet langer alleen naar het aantal gebruikers (MAU), maar zal het zich richten op het controleren van de ARPU (gemiddelde omzet per gebruiker) en de brutowinstmarge. Vergeleken met het topvlaggenschip Opus, dat duur is en een beperkt belvolume heeft, heeft de low-end Haiku magere winsten. Het middenklasse Sonnet-systeem kan de meeste complexe diensten aan, waardoor de doorstroom van de kernactiviteiten van het bedrijf wordt vergroot.
Het is vermeldenswaard dat in de tijd dat Fable 5 en Mythos 5 voorheen beperkt waren, de vensterperiode op de mondiale AI-markt versnelde richting Chinese fabrikanten. Gedurende deze periode veroorzaakte de GLM-5.2, gelanceerd door Zhipu, een groot Chinees modelbedrijf, wijdverbreide discussies in overzeese open source- en ontwikkelaarsgemeenschappen vanwege de kosteneffectieve redenering. Buitenlandse ontwikkelaars laten een trend zien waarin ze vertrouwen op gediversifieerde technologiepakketten, en Chinese grote modellen hebben een sterkere vervangingsflexibiliteit laten zien in de wereldwijde golf van Agent-evolutie.