Actualités / Jeux

J'ai parlé à un PNJ Nvidia AI, et il voulait surtout me faire uriner

Si le but d'une démo technique est de provoquer un éclair de réflexion « Hé, c'est sympa », alors je mentirais si je disais que le protocole secret de Nvidia – une vitrine jouable pour leur outil AI NPC, Avatar Cloud Engine (ACE) – n'avait pas été utilisé. ça n'a pas marché sur moi. Si, d'un autre côté, il s'agit de développer cette pensée en “Hé, je veux ça dans les jeux en ce moment”, il faudra plus qu'une conversation légèrement guinchée avec un aspirant barman.

ACE, si vous n'avez pas vu ses précédentes présentations sur le circuit des salons de technologie/jeux, est une « fonderie » tout-en-un d'outils de création de personnages basés sur l'IA – modèles de langage, parole, synthèse vocale, robots automatisés. battements de bouche, etc. – que Nvidia présente comme l'avenir de l'interaction avec les PNJ. Branché sur le moteur tiers Inworld, qui semble gérer l'essentiel de la génération actuelle d'IA, ACE vise à remplacer les dialogues de personnages pré-écrits et enregistrés par des lignes plus dynamiques capables de répondre avec précision à toutes les questions ou déclarations que vous pouvez murmurer dans un message. microphone.

Regarder sur YouTube

Covert Protocol résume tout cela dans un court jeu d'enquête sociale, vous chargeant, en tant que détective privé, de bavarder/mentir dans les suites privées d'un hôtel chic. Le premier à participer à un interrogatoire assisté par l'IA était le joyeux chasseur Tae Hyun, et il s'est avéré que le premier parmi un rassemblement de journalistes à prendre le micro était moi.

La conversation a commencé, comme la plupart des miens, de manière maladroite. Une fois que je suis passé en mode protagoniste d'Obsidian RPG en demandant quels étaient les potins autour de l'hôtel, Tae a dévié avec un gag à propos de l'arrivée d'extraterrestres. pourrait recommande le bar de l'hôtel, j'ai donc demandé à mon tour quel était leur meilleur cocktail. C'était une erreur. Il se trouve que Tae avait l'intention de reprendre lui-même le bar et était si fier de son propre zoo de Baltimore (avec une touche coréenne) qu'il a réussi à y travailler à plusieurs reprises.

C'était étrange. Mais ça aussi… a marché ? En tant qu’interaction ludique, notre session de questions et réponses s’est déroulée de manière parfaitement logique. Les réponses générées par l'IA étaient spécifiques à la question, non couvertes, et il n'y avait pas de « Pourriez-vous répéter cela ? » ou “Je ne suis pas sûr de ce que tu veux dire” le hoquet. Si quelqu'un était arrivé sans aucune connaissance de l'aspect de l'apprentissage automatique, il aurait très bien pu penser qu'ACE alimentait des lignes prédéfinies en réponse à des requêtes pré-planifiées. Alors oui, c'était chouette. De nombreuses réponses semblaient même prendre en compte les réponses précédentes, les utilisant comme contexte pour éviter les répétitions.

Surtout, en tout cas. Cet homme était consommé avec fierté du zoo de Baltimore, glissant des approbations aux réponses sur ses opinions politiques ou sa relation avec sa mère comme s'il faisait un morceau de SNL. En toute honnêteté, les enchaînements étaient ringards, mais pas entièrement absurdes, étant donné que j'avais abordé le sujet des boissons pour commencer. Il est également possible qu'il s'agisse davantage d'un tic de caractère intentionnel, provoqué par l'IA, que d'un problème dans la matrice.

Ce type ne semble aimer rien, à part être un con. | Crédit image : Fusil de chasse en papier de roche

Toujours. J'ai ri à ce moment-là, mais avec le recul, il y avait quelque chose d'étrange dans la facilité avec laquelle ce type revenait exactement au même sujet de sa boisson signature. S'il s'agissait d'une blague décalée, son ton était décalé par rapport à la présentation soignée du roman policier, et si ce n'était pas le cas, cela trahissait sûrement à quel point ces « performances » sont littéralement artificielles. Comme si ACE s'accrochait à ce détail du personnage comme à une couverture de sécurité, craignant de s'écarter quand il sait qu'il a maîtrisé le cocktail, même si cela donne l'impression que tout est plus robotique – pas moins.

Non que la mascarade ait été particulièrement bien entretenue ailleurs. Les voix de l'IA d'ACE étaient plus naturalistes que celles de la démo du magasin de ramen de l'année dernière, mais elles étaient toujours raides, monotones et parsemées de pauses et de prononciations étranges. En gros, tout ce que raconte la synthèse vocale classique. Tae a parlé de sa famille qui avait quitté la Corée « pour une raison », sous-entendue une agression nord-coréenne, avec la même gravité que lorsqu'il a lancé la blague idiote sur les extraterrestres. Un autre PNJ bavardable de Covert Protocol, un orateur principal à qui nous devions extraire un numéro de chambre, a réagi avec la même non-surprise à la fois à un salut amical et à l'annonce de l'annulation de son discours.

Certaines réponses ne sont également venues qu'après une pause prolongée, qu'un gestionnaire de Nvidia a rapidement attribuée à la lenteur du Wi-Fi du site. Ainsi, même si l'ensemble de ce système en faisait un jeu de vente au détail fini, il s'agirait probablement d'une affaire toujours en ligne, en s'appuyant sur votre possession d'une connexion de haute qualité pour effectuer toutes ces requêtes à distance vers Inworld.

ACE a fait ses débuts l'année dernière, avec ce modèle en bois représentant un vendeur de nouilles. Regardez sur YouTube

Ensuite, il y a l'écriture. Rien de ce que j'ai entendu ne m'a fait courber les orteils comme le dialogue puant de la démo NEO NPC d'Ubisoft (même si, ce qui est inquiétant, c'est aussi basé sur une combinaison de technologie Inworld et Nvidia), mais c'était aussi en quelque sorte juste . Pas d'éclat, pas de côté ludique, pas de véritable poids dans les mots. J'ai ri du battage médiatique incessant de Tae, mais seulement de son ridicule absolu, pas de l'humour le plus intentionnel de la machine. Et sa tentative de voix off privée grisonnante équivalait à un tragiquement fade “Un bar. Je pourrais opter pour un Old Fashioned à ce moment-là. Mais concentre-toi, Marcus, concentre-toi.” Personne ne veut mourir, ce n'est pas le cas.

Je suis toujours véritablement impressionné par la réactivité des questions et réponses, mais dans l'ensemble, ACE se sent à au moins quelques années du point où il pourrait propulser un jeu qui pourrait passer pour un auteur humain. Le fait est que les développeurs de jeux n’aiment apparemment pas attendre. Outre Ubisoft, on m'a dit que plusieurs sociétés ont déjà contacté Nvidia pour utiliser ACE pour créer leurs castings de PNJ. Cela ne veut pas dire que nous allons tous bavarder avec des robots avant Noël, mais je crains que la précipitation pour saisir les avantages de l'IA – idéalement du type « jeu social proprement non linéaire » et non du « maintenant nous ne le faisons pas » il faut payer la variété des écrivains – se terminera par une sélection de jeux tout aussi médiocres.

Je ne dis pas cela non plus parce que certains n’aiment pas l’IA. En dehors de l’IA générative, Nvidia lui-même a créé de nombreux outils utiles et éthiquement sans problème qui utilisent l’apprentissage automatique pour aider les joueurs et les développeurs. Upscaling chéri DLSS, pour donner l'exemple évident, ou les améliorations visuelles instantanées de Ray Reconstruction. Malgré la production de mods de qualité variable, RTX Remix a également été un bon résultat jusqu'à présent. Cela utilise en fait une touche d'IA générative pour aider à produire des modèles et des textures à plus haute résolution, mais je n'ai jamais eu de problème avec ces parties, par exemple, de Portal avec RTX. À une pièce éloignée de la démo de Covert Protocol, j'ai également eu un aperçu plutôt prometteur de Half-Life 2 RTX en action, présentant un mélange de modèles fabriqués à la main et d'améliorations d'éclairage ainsi que des remplacements de textures générés par l'IA (mais de bon goût).

Half-Life 2 et Half-Life 2 RTX fonctionnant sur deux moniteurs adjacents, à titre de comparaison.

Half-Life 2 RTX donne à un vieux classique le traitement remasterisé complet (bien que non officiel), | Crédit image : Fusil de chasse en papier de roche

Pourtant, il y a clairement un écart énorme entre demander à l'IA d'effectuer un anti-aliasing ou de retoucher certains maçonneries et de se lancer dans l'IA générative pour recréer le comportement d'un être humain entier en temps réel. ACE a fait des progrès depuis la visite douteuse du magasin de ramen, mais je ne suis toujours pas convaincu qu'il soit encore prêt à franchir ce gouffre.

Et même lorsque cela se produira, suffisamment de joueurs voudront-ils réellement entendre ce que les voix de l’IA ont à dire ? Malgré toute la nouveauté du dialogue dynamique, le désir d'histoires émouvantes, émouvantes, drôles, effrayantes, attristantes et surprenantes ne va nulle part, et si Covert Protocol est une indication, les meilleures seront toujours filées de mains humaines.

Même les rouages ​​et les engrenages d'ACE ne suggèrent pas le contraire. L'humeur et le discours de Tae Hyun peuvent être générés par l'IA, mais ils doivent être générés depuis quelque chose. Dans ce cas, il s'agit d'un profil de personnage qu'Inworld Engine conserve pour lui, tous les autres PNJ ayant le même : une histoire personnelle en pot de leur vie, de leurs amours, de leurs rêves et de leurs peurs. C'est la source de tout ce qui rend Tae intéressant, ou à tout le moins, capable de donner des réponses plus intéressantes qu'un chatbot de soutien de British Gas, qu'il s'agisse de la fuite de sa famille face aux tensions politiques ou de la formation d'une obsession de barman qu'il peut désormais ” Je ne me tais pas. Et tout cela a été conçu à partir de zéro – non pas par l’IA, mais par un écrivain humain. Je dis juste.