Kun je Feng Shui lezen en mij prijzen omdat ik interessant ben? Is Kimi nu zo wild?

Iets nieuws gevonden. Geef de AI een foto en hij kan de persoonlijkheid van een persoon voor je raden. Alleen al door op de afspeellijst te vertrouwen, kunt u een schatting maken van de recente mentale toestand van een persoon. En deze zijn allemaal van KimiHet nieuwste K1-model voor visueel denkenhand.

Nee, het is nog maar een maand geleden dat het laatste wiskundige model k0-math werd gelanceerd en op de ranglijst van o1 stond, en k1 heeft snel zijn debuut gemaakt.

Natuurlijk is deze K1 niet zo eenvoudig als het begin, alleen maar naar foto's kijken en de persoonlijkheid analyseren.

Toen we de vorige keer k0-wiskunde testten, hadden we het vermogen van een "probleemmeester" al ervaren, en het denkproces om het probleem op te lossen was verbazingwekkend voor de recensenten. Het is jammer dat sommige wiskundevragen en meetkundevragen die rond logica draaien iets minder interessant zijn.

Maar deze keer heeft K1 iets te zeggen:Beschikken over zowel redeneer- als visuele vaardigheden, wat betekent dat je direct foto's kunt maken en deze kunt uploaden om problemen op te lossen, en er wordt ook beweerd dat het de O1 van OpenAI in wiskunde, natuurkunde en scheikunde kan evenaren of zelfs overtreffen.

Als we zo vergelijken, zullen we erg enthousiast zijn. Toevallig hoeft het nieuwe k1-model nu niet te wachten op interne tests. Het kan zowel in de app als in de webversie worden gebruikt. Zonder verder oponthoud starten we het hele proces direct.

Toen ik ter sprake kwam, gooide ik een K1-meetkundevraag van het toelatingsexamen voor de universiteit van dit jaar.

Allereerst interpreteert k1 de vraag voldoende zorgvuldig en weet hij wat zijn doel is.

Er wordt ook rekening gehouden met de cosinusstelling die mogelijk betrokken is bij de voorwaarden die in de vraag worden gegeven. Het is vergelijkbaar met ons denken bij het oplossen van het probleem. Als we a²+b²−c²=2ab zien, denken we meteen aan de cosinusformule c²=a²+b²-2ab·cosC.

Ga vervolgens verder met afleiden volgens de formule en voorwaarden, en je kunt snel de hoek B = 60° vinden.

Veeg omhoog om meer te zien

Vraag (2) is een beetje moeilijk, maar de recensent heeft het probleemoplossingsproces van k1 zorgvuldig gecontroleerd en vastgesteld dat de ideeën en oplossingen allemaal correct zijn. Het uiteindelijke antwoord van zijdelengte c=2√2 is ook correct. (Omdat het denkproces van vraag k1 te lang duurt, wordt de schermafbeelding niet getoond.)

Dezelfde vraag werd gesteld aan o1. Allereerst verloor o1 qua redeneersnelheid al in 58 seconden.

In termen van nauwkeurigheid zijn o1 en k1 gelijk, ze hadden allebei gelijk.

Het verschil is dat o1 het idee van het beantwoorden van de vraag verbergt en geen compleet denkproces geeft zoals k1.

Eén ding moet echter gezegd worden: de recensent is niet bijzonder verrast door de manier waarop het k1-model het menselijk denken imiteert. Omdat het k0-wiskundemodel me de vorige keer schokte. Het leek erop dat het zich bewust was van zijn fouten en herhaalde verificaties zou uitvoeren.Het lijkt erop dat ik mijn hersenen pijnig als ik wiskundige problemen opschrijf.

Dit keer is K1 daarentegen beter in het compenseren van de tekortkomingen. Ik heb de meetkundevraag van de middelbare school op k0-wiskunde de vorige keer opnieuw geprobeerd met k1, en nu kan ik het goed doen. Zelfs de moeilijkheidsgraad van het toelatingsexamen voor de universiteit is niet intimiderend.

En ik ontdekte ook dat k1 niet alleen goed is in wiskundeproblemen, maar ook in natuurkundeproblemen.

Veeg omhoog om meer te zien

Vervolgens pakte ik nog een logische valstrikvraag met een enigszins ingewikkelde logica en probeerde deze:Een watermeloen werd gekocht voor 50 yuan en verkocht voor 70 yuan. De baas ontving 100 yuan aan vals geld. Hoeveel geld heeft hij uiteindelijk verloren?

Deze vraag lijkt op het eerste gezicht eenvoudig, maar de antwoorden die internetgebruikers op deze vraag geven zijn gevarieerd. Sommigen zeggen dat ze 150 verloren hebben, sommigen zeggen 180, en sommigen zeggen 100...

Laten we eens kijken naar een vraag die zelfs veel mensen niet kunnen achterhalen, en kijken of k1 de valkuil daarin kan ontdekken.

Bovendien heb ik deze vraag opzettelijk slordig met de hand geschreven, en trouwens ook getest of de visuele vaardigheden van K1 zo goed zijn als geadverteerd.

Vertel het me niet, vertel het me niet, de "ogen" van dit model zijn inderdaad niet slecht.

Wat de juistheid van de vraag betreft, kwam de analyse in de eerste helft van k1 eerst met het antwoord van een verlies van 100 yuan, maar deze ontkende zichzelf al snel.

doorgaan metVals geld, wisselgeld en kostenwinstRekening houdend met deze complexe factoren, kwamen we er uiteindelijk achter dat de baas 80 yuan verloor. (Het juiste antwoord is 80 yuan)

Veeg omhoog om meer te zien

Dit logische vermogen is inderdaad een beetje sterk.

Inclusief heb ik k1 verschillende analoge redeneervragen gegeven voor de test. Hoewel het logische analysepad verschilde van het referentieantwoord, waren de uiteindelijke antwoorden allemaal correct.

Veeg omhoog om meer te zien

Hoe dan ook, na deze test ontdekte de recensent dat K1 logisch kan denken, goede ogen heeft en een hoog IQ heeft. Kimi is"Een vragenschrijver zijn"Zijn naam wordt eindelijk bevestigd.

Maar naast het doen van de vragen, heb ik deze keer ook meer leuke manieren bedacht om te spelen.

Het heeft geen zin om gegevens te analyseren en naar rapporten te kijken. Maakt het k1-model geen conclusies op basis van afbeeldingen? Dan moet het goed zijn in het identificeren van oude munten, toch?

Speciaal op internet vond ik een afbeelding van zilveren munten uit de periode van de Republiek China. Twee zilveren munten waren nep aan de bovenkant en echt aan de onderkant. Ik heb het naar k1 gestuurd voor een snelle beoordeling."AI-versie van luisteren naar de lente om schatten te identificeren" .

Bron afbeelding Xiaohongshu-gebruiker @古古金来 (becommentarieerd door openbare blogagent)

K1 wist niet alleen dat de munt uit de periode van de Republiek China stamde, maar gaf ook alle details van de munt weer. Uiteindelijk zag hij daadwerkelijk dat de munt hierboven nep was.

Laten we gewoon een foto van de kamer sturen en k1 een kijkje laten nemen naar de “feng shui”.

Hoe zit het met "ventilatieopeningen", symmetrische indeling, energiebalans... Hij vertelde er helder en duidelijk over en gaf ons zelfs suggesties, zoals het veranderen van de positie van het bed, het regelmatig snoeien van de planten en het overstappen op een eenvoudigere kroonluchter.

Veeg omhoog om meer te zien

Maak een foto van k1 tijdens het eten, dan wordt duidelijk hoeveel calorieën je tijdens de maaltijd hebt verbruikt.

Veeg omhoog om meer te zien

Maar wat mij het meest verbaast is k1Raad de film door naar de afbeeldingen te kijkenvaardigheid.

Ik gaf het een screenshot uit de film "Seven Deadly Sins". Er zijn geen lijnen, alleen afbeeldingen. Voor veel mensen die de film nog nooit hebben gezien, is het moeilijk te raden.

Toen ik de analyse van k1 voor het eerst las, dacht ik dat deze waarschijnlijk slecht zou zijn. Maar de volgende seconde zei ik: "De opnamehoek en toon deden me denken aan de films van David Fincher." Ik heb ook afgeleid dat de scène in de schermafbeelding een scène was uit 'The Seven Deadly Sins'.

Het is echt te sterk...

Zelfs als je wat obscure memes naar k1 gooit, kan het het grappige punt nog steeds op een serieuze manier uitleggen.

Hoewel het een beetje overdreven wordt geïnterpreteerd, wordt de algemene betekenis in principe begrepen.

Laten we het zo zeggen: op basis van de visuele en redeneervaardigheden van k1 is het beantwoorden van vragen eenvoudig. Zolang je brein groot genoeg is, kun je meer manieren ontgrendelen om te spelen.

Dit vermogen van k1 is grotendeels te danken aan een gebelde persoonCOT (Chain of Thought) denkketentechnologie.

De algemene betekenis is dat voordat het model het antwoord geeft,Imiteer de manier waarop het menselijk brein denkt, breek complexe taken af en los ze vervolgens stap voor stap op.Deze technologie kan het IQ van het model hoger maken.

Aan de andere kant leert het model, met behulp van versterkende leertechnologie, ook evolueren in het proces van voortdurend vallen en opstaan om optimale resultaten te bereiken.Net als het trainen van een hond.

Wat betreft de reden waarom Kimi het voortouw nam bij het kiezen van wiskunde als uitgangspunt voor het redeneermodel, denk ik dat dit dezelfde reden is als wij mensen om wiskunde goed te leren en ons denken te oefenen.

Op basis van het ‘goed leren van wiskunde’ in het model kunnen we dit logische redeneervermogen vervolgens toepassen op de natuurkunde, scheikunde en zelfs alle aspecten van ons dagelijks leven, totdat we de wereld eindelijk echt begrijpen.

En uiteraard,Generalisatievermogen van het Kimi-inferentiemodelHet begint al zichtbaar te worden.

In de veronderstelling dat de gegevens hun hoogtepunt hebben bereikt, kan dit pad, gebaseerd op versterkende leertechnologie, ervoor zorgen dat het model betere resultaten kan behalen.

Maar welke technologieën worden uiteindelijk in het model gebruikt en hoe hoog is de papieren score?In feite maakt iedereen zich meer zorgen over de vraag of het model gemakkelijk te gebruiken en praktisch is.

Kimi, die altijd goed is geweest in lange teksten, richt zich nu op zowel lange teksten als versterkend leren, wat ook een uiting is van het aanpassen van de gereedschapskenmerken om langzaam dichter bij de behoeften van de gebruiker te komen.

Wanneer technologie niet langer superieur is en mensen kan helpen praktische problemen op te lossen, zal zij haar missie pas echt voltooien.