Sinds DeepSeek over de hele wereld populair werd, is iedereen in de AI-cirkel versneld alsof hij op de knop voor vooruitspoelen drukt. Om nog maar te zwijgen: alleen al deze week zijn er onder meer Musk's Grok3, Anthropic's Claude3.7Sonnet, Alibaba's QwQ-Max-Preview, Tencent's TurboS, Dark Side of the Moon's Kimi-1.6-IoI-High, Google's GeminiCodeAssist en nog veel meer. Er is ook DeepSeek Open Source Week.Ze zijn gewoon onsterfelijk.
En gisteravond nog werd Hui Hui eruit gehaald en geslagen. OpenAI, dat beweerde elke keer terughoudend te zijn, kwam eindelijk uit en haalde de nieuwste versie van de GPT-serie tevoorschijn, GPT-4.5.
Volgens Ultraman is GPT-4.5 dit keer een ander soort intelligentie, met prachtige eigenschappen die hij nog nooit eerder heeft ervaren. Dit zal de eerste zijn die je het gevoel geeft dat je dat bentpraat met een nadenkend persoonmodel.
Maar sinds twee maanden achtervolgt mijn broer hen al meer dan tien dagen op rij om 02.00 uur voor saaie persconferenties. Eerlijk gezegd heeft Ultraman het hart van mijn broer een beetje pijn gedaan.
We hadden dus eigenlijk niet veel verwachtingen van deze GPT-4.5. Zelfs de Ultraman-mensen kwamen niet naar de persconferentie. Ze zeiden dat ze naar huis gingen om voor de baby te zorgen. Ja, het was de baby die hij en zijn man hadden.
Hoe dan ook, kijkend naar het totaalbeeld, kan ik alleen maar zeggen dat deze golf van GPT-4.5 kan worden beschouwd als het "Tang Tang"-debuut.
Dit is geen schande. De meeste andere internetgebruikers hebben hierover dezelfde mening. Er is zelfs een discussie op internet over de vraag of GPT-4.5 onzin is, want zelfs rednecks zijn niet optimistisch over GPT en hebben op Musk's xAI gestemd.
Dus, wat is de tekenmethode van dit ding? Laten we, zonder in de details te treden, tot de conclusie komen: de prestaties van GPT-4.5 zijn niet goed en de prijs is hoog.
Hetzelfde werd gisteravond vrijgegeven, maar hij en su7u zijn volledig het tegenovergestelde.
Laten we het eerst over de prestaties hebben. In een benchmarktest die officieel door OpenAI is gegeven, is GPT-4.5 niet zo goed als de o3-mini die vorig jaar werd uitgebracht op het gebied van wetenschap, wiskunde en codeermogelijkheden. De benchmarktest is slechts 5% beter dan 4o.
Met andere woorden, GPT-4.5 is niet genoeg vergeleken met zijn eigen o3-mini in moeilijke academische benchmarktests zoals AIME en GPQA, laat staan een monsterkamer met DeepSeek-R1 en Claude3.7Sonnet.
Als we de gegevens van de officiële website buiten beschouwing laten en kijken naar daadwerkelijke metingen van netizens, is GPT-4.5 behoorlijk anders dan Claude 3.7, die ook deze week werd uitgebracht.
In termen van denken, begrijpen en het genereren van kaarten kan Claude het bijvoorbeeld bijna naar ppt verplaatsen om illustraties te maken, maar de afbeeldingen getekend door GPT-4.5 zijn net als het huiswerk in de computerklas van mijn basisschool...
Wat nog schandaliger is, is dat dit ding heel langzaam werkt...
Maar dat is niet het meest schandalige.Wat hem echt onderscheidt, is de prijs.
Volgens hun officiële gegevens bedraagt de prijs van GPT-4,5 per miljoen tokens US$75, wat een volledige stijging is van 30 keer vergeleken met 4o, om nog maar te zwijgen van de prijs van DeepSeek, die direct 280 keer kan bereiken...
Als je de korting van DeepSeek meetelt, kan het verschil zelfs meer dan 1.000 keer bedragen!
Maar wat grappig is, is dat in het officiële websiteartikel van OpenAI ook GPT-4.5 staat “kan niet volledig worden vervangenGPT-4o".
OpenAI-functionarissen geven hier echter niet veel om. Ze denken dat de echte kracht van GPT-4.5 in de taalmogelijkheden ligt.
Ze zeiden in de blog op hun officiële website dat GPT-4.5 menselijke emotionele behoeften in gesprekken kan analyseren en het beste is in het bieden van emotionele waarde.
“Het combineert een diep begrip van de wereld met betere samenwerking, wat resulteert in een model dat op natuurlijke wijze ideeën integreert in gepassioneerde en intuïtieve gesprekken die beter geschikt zijn voor menselijke samenwerking.GPT-4.5 is in staat om de menselijke betekenis beter te begrijpen en subtiele signalen of impliciete verwachtingen te interpreteren met meer genuanceerde ‘emotionele intelligentie’."
Als je het examen bijvoorbeeld niet goed hebt gedaan, zal hij je eerst troosten als je het hem vertelt, maar 4o is heel eerlijk en geeft je een heleboel plannen.
Maar wat kan ik zeggen? Dit lijkt wel menselijker, maar het trainen van een AI met emotionele intelligentie lijkt niet te bewijzen dat deze ook echt beter is dan anderen.
Neem de zitzak van Byte als voorbeeld. Als je hem deze zin stuurt, zal hij heel menselijk reageren en zelfs bellen.
Niet alleen wij, maar ook externe internetgebruikers hebben over OpenAI getweet en vergeleken met DeepSeekr1 en Grok, waarbij ze openlijk yin en yang tot uitdrukking brachten.
Eerlijk gezegd is dit begrijpelijk.Arbeid en kapitaal hebben het duurste geld op de markt uitgegeven, maar uiteindelijk zijn algoritmen nodig die emotionele intelligentie hebben, redeneringen om emotionele intelligentie te hebben, en toepassingen om emotionele intelligentie te hebben...
Voormalig OpenAI-medewerker, bekende buitenlandse AI-analistAndrejKarpathyHeeft een artikel geplaatst waarin staat dat de trainingskosten van GPT-4.5 tien keer hoger zijn dan die van de vorige generatie, maar dat het IQ niet zo goed is als het gevolgtrekkingsmodel, maar de nadruk ligt op de emotionele intelligentie van AI.
Hoewel Andrej behoorlijk tevreden is met de emotionele intelligentie van GPT-4.5, zegt hij dat dit een verbetering is van GPT-3.5 naar 4.0; hij heeft daar ook op gewezenGPT-4.5 is geen inferentiemodel en is mogelijk de laatste generatie van OpenAI's niet-inferentiemodel.
Op deze manier wordt verwacht dat OpenAI betere prestaties zal leveren wanneer het het volgende generatie inferentiemodel ontwikkelt op basis van 4.5.
Vanuit dit gezichtspunt kan de richting van de meeste AI in de toekomst echter volledig verschuiven naar redeneren.
Aan de ene kant kan het uiterlijk van GPT-4.5 eigenlijk in zekere zin worden gezegd:Traditioneel kunnen wonderen alleen worden bereikt door hard te werken, en ScalingLaw (de wet van schaal), die over een waanzinnige hoeveelheid rekenkracht beschikt, begint te vertragen.
Aan de andere kant is het open source-modelkamp al op weg in deze richting.
Als er niets anders is, deze dagen van DeepSeek Open Source Week,Elke dag wordt de kernapparatuur die wordt gebruikt bij het trainings- en redeneerproces van onze eigen V3 en R1 vrijgegeven zodat iedereen deze gratis kan gebruiken.
De FlashMLA-architectuur op de eerste dag staat bijvoorbeeld gelijk aan het leren hoe u de NVIDIA GPU kunt afstemmen, en u stap voor stap leert hoe u de rekenkracht van de H800 kunt benutten;
In de daaropvolgende dagen werden geleidelijk een aantal databases en algoritmen zoals DeepEP, DeepGEMM, DualPipe en EPLB geopend; Ten slotte werd een raamwerk voor gegevensverwerking van 3FS en Smallpond geïntroduceerd om de prestaties van solid-state drives te beperken.
In communities als GitHub zijn ontwikkelaars op AI-gebied tegenwoordig erg blij. Open source-gegevens zoals DeepSeek staan bijna elke dag bovenaan de GitHub-hotlist. Men kan zeggen dat deze golf de nieuwe ‘brongod’ is.
Hoewel de prestaties van GPT-4.5 middelmatig zijn, heeft DeepSeek ervoor gezorgd dat iedereen een wapen heeft. Als gevolg hiervan wordt geschat dat het moeilijk zal zijn om traditionele rekenkrachtcompetities te zien in toekomstige AI-trainingen, en er wordt verwacht dat meer kosteneffectieve training koning zal worden.