Vi pratade med tv-spelkaraktärer tack vare Nvidias AI, potentialen är enorm

Nvidia har för avsikt att återigen revolutionera världen av tv-spel med ACE. Den här tekniken syftar till att använda artificiell intelligens för att levandegöra karaktärerna du möter i dina virtuella äventyr, och på så sätt låta dig konversera flytande med dem. Vi kunde prova demot.

Nvidia Nvidia

Tänka. Du kopplar av framför det senaste stora tv-spelet. Om du faller in i en stor öppen värld är du lite vilsen. Ditt nuvarande uppdrag ber dig att döda en varelse, men du har ingen aning om var den gömmer sig. Reflexen är därför att gå och fråga de lokala byborna. Du stöter på den första bonden på din rutt och du börjar en konversation. Istället för att ha en klassisk dialogruta som öppnas på din skärm, pratar du till den direkt via din mikrofon och den svarar dig naturligt tack vare AI… Det här är den typen av scenario som ACE vill erbjuda (Avatar Cloud Engine) från Nvidia, dess nya teknik som gör det möjligt för tv-spelkaraktärer att komma till liv med artificiell intelligens.

Vi kunde prova demot och vi blev imponerade. Men vi har fortfarande många osäkerheter och frågor.

ACE, hur fungerar det?

För att skapa detta system förlitar sig Nvidia på NPU:erna som ingår i dess RTX-kort (oavsett generation), men också på molnet. Den amerikanska firman samarbetade med Convai, ett företag som ansvarade för att skapa karaktärer för olika förlag, som Ubisoft, MiHoYo eller Tencent. Hon designar NPC:er för spel och föreställer sig ett förutbestämt utseende, berättelse, repliker, röster och beteenden.

NvidiaNvidia

Med ACE, när spelaren närmar sig en karaktär, han måste använda sin mikrofon för att prata med henne. Hans röst transkriberas till skrift av GPU:n, sedan skickas texten till Nvidias servrar. ACE utvecklar sedan ett komplext svar med hjälp av AI. Den omvandlas till röst och skickas till din PC. Ansikts- och animationshantering (Audio2Face) hanteras av GeForce RTX-kortet. Till sist svarar karaktären med en syntetisk men trovärdig röst.

NvidiaNvidia

Vi hotade en bartender, han tog det ganska bra

Vi kunde prova ACE i en timme genom en demo skapad med Unreal Engine 5. Vi gick in i en ramen-bar belägen i en dystopisk stad, en av de som finns i Cyberpunk 2077. Två karaktärer var där: chefen och en klient, en expert på cybersäkerhet.

NvidiaNvidia

Genom att peka markören mot ett av tecknen, det var möjligt för oss att tala till honom med vår egen röst i mikrofonen. Vi vände oss därför till experten. Låt oss erkänna det, vi saknade lite inspiration till de första raderna. De var begränsade till “ Hej vad heter du ? Vad arbetar du med ? Var bor du ? ». Men svaren strömmade ut; den unga kvinnan talade konsekvent till oss. Mer avslappnade efter de första hjärtliga utbytena tog vi upplevelsen lite längre och frågade henne vad hennes favoritfilm var, om hon ville åka till Disneyland med oss ​​eller om hon gillade att läsa Phonandroid. Återigen var svaren konsekventa, till och med underhållande, även om de ibland var vaga. Grädden på moset var att vi pratade franska, med Nvidias AI som automatiskt översatte från sin fjärrserver.

NvidiaNvidia

Vi pratade sedan med bartendern (på engelska), och återigen var svaren konsekventa. Dessutom, han reagerade korrekt på sin omgivning. Vi bad honom till exempel snällt att släcka barlampan, han gjorde det. Vi beställde honom en ramen, han förberedde den åt oss. Vi frågade honom om han serverade hamburgare, han berättade att det inte fanns på menyn. Vi var intresserade av den fluorescerande vattenkannan på baren, han visste vad det var…

Artificiell intelligens har fortfarande sina gränser

Det är dock med honom det vi kunde se gränserna för denna teknik. Vi bestämde oss för att hota honom med en “Jag har en pistol, ge mig pengarna från registret”och han svarade oss i en sorgsen ton “Jag gillar inte våld, sluta”istället för att få panik. På denna punkt specificerar Nvidia att varje NPC inte reagerar på samma sätt, eftersom de alla har en väldefinierad karaktär och de bryter aldrig ut ur denna tvångströja. Inför en absurd situation improviserar de inte.

Läs också – DLSS: förstå allt om Nvidia-tekniken som revolutionerar videospel

Likaså, Det bör noteras att samtalen fortfarande är mycket mekaniska. I mikrofonen måste vi tala mjukt, artikulera väl. Sedan måste du vänta en sekund på att karaktären ska svara. Allt detta hjälper inte med en smidig konversation, men låt oss komma ihåg att vi är i en demo av en fortfarande ny teknik. På samma sätt, under samtalets gång, förstår vi mycket snabbt strukturen hos vår samtalspartner, vad vi kan be dem om att få ett exakt svar snarare än ett vagt svar. Sista punkten att förbättra: rösten från NPC:erna är förvisso trovärdig, men monoton och alltid på samma rytm. När vi försökte reta upp dem förblev de lugna, även om deras dialog förmedlade irritation över våra upptåg. Spöket från den oroande dalen är mycket närvarande.

Kommer AI att revolutionera videospel?

Med den här demon dyker många frågor upp. Hur skulle den här tekniken kunna användas i ett riktigt videospel? Att prata med en NPC är roligt just nu, men är det hållbart i ett 100-timmars äventyr i Witcher-stil? Ännu mer, vad betyder detta för dialogförfattare, skådespelare, manusförfattare? Till exempel är det otänkbart att se en AI svara på oss i en GTA, där varje handskriven rad är utformad till det yttersta. Vi kommer att kunna bedöma mycket snart. ACE är inte en avlägsen dröm, eftersom utvecklare redan arbetar med att integrera det i sitt spel. Den första som tar steget blir STALKER 2, som kommer ut nästa september.

Faktum är att vi testade råteknologi, men det blir sedan upp till utvecklarna att använda det med uppsåt. Vi kan föreställa oss en hel massa applikationer. Till exempel, det som gör världarna levande i Elder Scrolls (Oblivion, Skyrim) är rutinerna för NPC:erna, som lever sina liv när du inte interagerar med dem. En skriptad teknik, men som kan användas briljant med artificiell intelligens. På samma sätt kan vi föreställa oss denna process tillämpad på miljön i ett virtuellt universum, som förändras dynamiskt i enlighet med dina handlingar. Alla användningsområden är möjliga.

ACE är därför en lovande teknik och vi hade väldigt roligt på demot, trots dess uppenbara begränsningar. Nu återstår att se hur den kommer att användas i framtiden.

Leave a Reply

Your email address will not be published. Required fields are marked *