Microsoft zei dinsdag dat zijn kunstmatige-intelligentiemodel Phi-2 beter presteert dan concurrerende producten van andere bedrijven zoals Meta (MTEA) en op apparaten kan draaien. Microsoft zei in een blog: "Het Phi-2-model heeft slechts 2,7 miljard parameters, maar in verschillende uitgebreide benchmarktests overtreffen de prestaties die van het grote taalmodel (LLM) Mistral7B van de Europese AI-startup Mistral, dat 7 miljard parameters heeft, en het AI-model Llama2 uitgebracht door Meta met 13 miljard parameters."
“Met name presteerde het Phi-2-model beter dan de Llama2 met 70 miljard parameters op het gebied van meerstapsinferentietaken (dat wil zeggen coderen en wiskunde) (de Llama2-modelfamilie omvat drie parametervarianten van 7 miljard, 13 miljard en 70 miljard parameters).”
Microsoft voegde hieraan toe: "Bovendien zijn de prestaties van het Phi-2-model vergelijkbaar of beter dan de onlangs uitgebrachte Google Gemini Nano2, ondanks de kleinere modelgrootte." Microsoft zei dat het Phi-2-model in Azure Studio zal worden gelanceerd.
Naar verluidt heeft Microsoft in juni van dit jaar het Phi-1-model met slechts 1,3 miljard parameters uitgebracht, wat geschikt is voor scenario's zoals QA Q&A, chatformaat en code. Het model is volledig getraind op gegevens van hoge kwaliteit en presteert tot wel tien keer beter dan vergelijkbare modellen in benchmarktests.
Microsoft heeft in september van dit jaar de Phi-1.5-versie bijgewerkt en uitgebracht, die ook 1,3 miljard parameters heeft en gedichten, e-mails en verhalen kan schrijven en tekst kan samenvatten. Op het gebied van gezond verstand, taalbegrip en redeneren kon het model op sommige gebieden modellen met wel 10 miljard parameters bijhouden.
Hoewel de omvang van Phi-2, die Microsoft in november in een update uitbracht, is verdubbeld ten opzichte van de vorige versie, is deze nog steeds veel kleiner dan die van andere reguliere taalmodellen. Microsoft zegt dat Phi-2 aanzienlijke verbeteringen laat zien op het gebied van logisch redeneren en beveiliging, en met de juiste afstemming en aanpassing zijn kleine taalmodellen krachtige hulpmiddelen voor cloud- en edge-applicaties.