Op 9 april lanceerde ByteDance Seeduplex, een grootschalig native full-duplex stemmodel, dat nu volledig is gelanceerd op de Doubao-app. Dit model is gebaseerd op een nieuw raamwerkontwerp van "luister en spreek tegelijkertijd". Vergeleken met het half-duplex end-to-end spraakmodel van de vorige generatie bereikt het real-time interactie van gelijktijdig luisteren en spreken, en verbetert het gespreksritme, de natuurlijkheid en het anti-interferentievermogen.

Volgens de officiële introductie heeft Seeduplex technische uitdagingen zoals vertraging en stabiliteit onder hoge gelijktijdigheid overwonnen door middel van modelarchitectuurinnovatie en trainingsoptimalisatie. In termen van precieze anti-interferentie heeft het model de mogelijkheid om continu te "luisteren", de akoestische omgeving waarin de gebruiker zich bevindt te begrijpen en achtergrondgeluiden en irrelevante gesprekken nauwkeurig te negeren. In complexe scenario's wordt het percentage valse antwoorden en valse onderbrekingen met 50% verlaagd in vergelijking met het half-duplexmodel. In termen van dynamische besluitvorming combineert het model spraak- en semantische kenmerken om de intentie van de gebruiker volledig te bepalen. Het kan geduldig luisteren als de gebruiker aarzelt en snel reageren nadat de gebruiker klaar is met spreken. Het aandeel preventieve oproepen is met 40% verminderd in vergelijking met het half-duplexmodel, en de besluitvormingsprestaties zijn met 8% verbeterd.

Uit multidimensionale evaluatie blijkt dat Seeduplex aanzienlijk beter is dan de traditionele half-duplex-oplossing en de spraakoproepfunctie van reguliere apps in de branche in termen van vloeiendheid en ritme van gesprekken. Dit model is het eerste in de sector dat een grootschalige implementatie heeft gerealiseerd en kan honderden miljoenen gebruikers een continue real-time spraakinteractie-ervaring van hoge kwaliteit bieden.