De ontwikkelaars van het FFmpeg-project bereikten opnieuw aanzienlijke prestatieverbeteringen door middel van handgeschreven assemblagecode. De ontwikkelaars zeiden:"Handgeschreven assemblagecode maakt FFmpeg 100 keer sneller, wat waarschijnlijk de grootste snelheidstoename is die ik tot nu toe heb gezien."Het maakte echter al snel duidelijk dat deze 100x verbetering alleen van toepassing is op een specifieke functie, en niet op de gehele FFmpeg-applicatie.

Met de nieuwste handgeschreven montagepatch zijn de prestaties van "rangedetect8_avx512" in de applicatie met 100,73% verbeterd. Zelfs als de processor van de gebruiker AVX512 niet ondersteunt, kan een prestatieverbetering van 65,63% worden bereikt bij gebruik van het codepad rangedetect8_avx2.

De ontwikkelaars gaven in een vervolgtweet toe: "Dit is een enkele functie die nu 100x sneller is, in plaats van de hele FFmpeg."Ze legden verder uit dat deze functie, die een snelheidsverhoging van 100% kan genieten, een "minder populair filter" is.

Vanwege de impopulariteit van deze functie kregen ontwikkelaars er tot nu toe geen prioriteit aan en werd de filtercode herschreven om SIMD-verwerkingsconcepten (Single Instruction Multiple Data) over te nemen, waardoor een enorm verbeterde parallelle verwerking mogelijk werd.

Blijkbaar kan de compiler nog steeds niet concurreren met handgeschreven assemblage, of zoals FFmpeg het zegt: "De registerallocator van de compiler is waardeloos."

FFmpeg is een van de weinige projecten die nog steeds aandringt op het gebruik van handgeschreven assemblagecode-optimalisatie, en het team heeft zelfs een "school" om de vaardigheden van handgeschreven assemblagecode te onderwijzen.

FFmepg is een complete oplossing voor video en audio en biedt een reeks functies zoals videodecodering, codering en nabewerking, en biedt perfecte ondersteuning voor allerlei vreemde video- en audiocoderingen ter wereld.