Actualités / Jeux

Protéger l’art de l’IA générative est vital, aujourd’hui et pour demain

L'IA générative est présente partout dans l'industrie du divertissement à l'heure actuelle, et de nombreux acteurs du jeu vidéo s'enthousiasment pour trouver de nouvelles façons de l'intégrer dans leurs produits, des développeurs et éditeurs de jeux tels qu'Ubisoft et Square Enix aux détenteurs de plates-formes et aux entreprises de matériel informatique telles que comme Epic et Nvidia. Cette nouvelle obsession de l'industrie est encore en train de prendre forme, et de nombreuses questions restent sans réponse sur combien cela pourrait coûter à l'avenir, qui y aura accès et à quoi cela servira réellement, sans parler des craintes concernant l'emploi. pertes et autres préjudices. Mais derrière tout cela se cache une question plus importante qui menace de faire éclater la bulle bancale de l’IA générative : l’ensemble du boom repose-t-il sur du travail volé ?

La création et la formation de systèmes d’apprentissage automatique nécessitent souvent des données – beaucoup de données. Parfois, nous avons de la chance et nous pouvons créer nos propres données. Lorsqu'OpenAI a entraîné un bot à jouer des matchs 1v1 Mid dans Dota 2, ils l'ont fait via un processus appelé apprentissage par renforcement, en faisant jouer le bot contre lui-même encore et encore, le seul retour étant qui a gagné et qui a perdu. Ce feedback, parfois appelé « récompense », aide un système d'apprentissage automatique à jouer à une sorte de jeu « chaud et froid », en modifiant son câblage interne pour essayer d'obtenir une meilleure récompense la prochaine fois qu'il exécutera la tâche. Si vous êtes assez vieux pour vous souvenir du jeu Black & White (ou, Dieu nous en préserve, Creatures), alors ces jeux fonctionnaient sur un principe similaire. Si votre petit animal a fait une bonne chose, vous lui donnez une friandise, et s'il vient de jeter plusieurs villageois dans un lac, vous le grondez (ou lui donnez une friandise, si cela vous plaît).

Parfois, nous ne pouvons pas créer nos propres données. Si nous voulons former une IA pour qu'elle devienne un artiste, nous ne pouvons pas lui faire simplement gribouiller et apprendre des résultats, car nous ne pouvons pas facilement définir ce que devrait être le feedback. Dans le 1v1 Mid de DOTA 2, si vous mourez, la partie est terminée, et il existe des objectifs similaires pour Chess, Go, Starcraft et bien d'autres jeux auxquels l'IA a essayé de jouer. En art, définir les gagnants et les perdants est considérablement plus difficile. Nous devons donc trouver des données qui existent déjà, un ensemble de données artistiques qui ressemble déjà au genre de choses que nous aimerions que notre système d'apprentissage automatique soit capable de faire. Mais où trouve-t-on cela ? Où nous trouvons la réponse à tous les problèmes de la vie : sur des sites Web aléatoires.

Dota 2 est l'un des nombreux jeux qui ont été utilisés pour former des outils d'IA sur la façon de gagner des matchs. | Crédit image : Soupape

Il y a de fortes chances que si vous avez entendu parler d'un système d'apprentissage automatique qui génère de l'art – Midjourney, Stable Diffusion, DALL-E – il s'est formé sur des millions ou des milliards d'images récupérées directement sur Internet. La plupart de ces ensembles de données ne sont pas filtrés et sont collectés à partir de pages disséminées sur le Web, en particulier de sites dont le contenu est facilement accessible, comme Flickr, Reddit ou des bases de données d'images. Ils sont également massifs, avec un ensemble de données populaire, LAION-5b, contenant plus de cinq milliard images. Ces images sont toutes collectées automatiquement, avec très peu de tentatives pour filtrer le contenu. En conséquence, les ensembles de données utilisés pour entraîner ces modèles d’IA regorgent de contenu protégé par le droit d’auteur, de matériel illégal et d’informations personnelles. Et tout cela est intégré dans des produits d’IA à but lucratif qu’une grande partie d’entre nous utilisent quotidiennement – ​​y compris les développeurs de jeux, les journalistes et les joueurs eux-mêmes.

C’est la principale raison pour laquelle vous verrez tant de personnes publier en ligne sur le « vol » de contenu par l’IA. L'un des effets les plus connus de ces ensembles de données obscurs et juridiquement discutables est que vous pouvez demander à une IA d'imiter le style d'un artiste particulier, comme Greg Rutkowski qui a illustré pour des jeux comme la série Anno et des jeux de cartes comme Magic. : Le rassemblement. Le travail de Rutkowski est apprécié, largement partagé en ligne et clairement étiqueté avec son nom, ce qui signifie qu'une IA verra de nombreux exemples de son travail, comme il l'a découvert un jour. Mais il existe de nombreux autres exemples dont vous n’entendrez peut-être jamais parler ou qui ne seront peut-être jamais révélés. Par exemple, AI Dungeon – qui utilisait le GPT-2 d'OpenAI pour générer des histoires de RPG – a pris et utilisé des milliers d'histoires de votre propre aventure provenant d'une communauté en ligne sans autorisation, ce qui a entraîné beaucoup de déception de la part des auteurs originaux (notez que presque tous les fils de discussion sur ce lien, c'est plutôt beurk, mais c'est là pour votre contexte de toute façon).

Le vol est parfois simple et parfois compliqué. Quand je me promène dans un combat de boss à Valheim pour lequel mes amis ont passé des heures à se préparer et que j'aspire tout le butin comme un Roomba fantastique et affamé, ce n'est clairement pas du vol – c'est juste un partage de la richesse. Dans le monde réel, où les tribunaux et les systèmes juridiques sont impliqués, le vol est beaucoup plus gris. Les jeux sont souvent critiqués pour avoir « volé » des choses dans d'autres jeux ou médias – qu'il s'agisse d'apparitions de créatures dans Palworld, de danses dans Fortnite ou de jeux entiers, comme ce fut le cas pour Ridiculous Fishing de Vlambeer et Threes d'Asher Volmer. Mais nous ne sommes pas toujours d’accord sur ce qu’est le vol, surtout dans les salles d’audience. Les poursuites contre Fortnite ont toutes été rejetées, mais dans le cas de petits développeurs indépendants dont le travail avait été cloné, ils n'avaient pratiquement aucun recours juridique. Décider de ce qui constitue un vol est malheureusement souvent plus une question de pouvoir que de justice.

À l’heure actuelle, plusieurs poursuites sont en cours dans le monde contre différents modèles d’IA, entreprises et ensembles de données pour violation de toutes sortes de lois et réglementations différentes. Il a été démontré que certains modèles mémorisent des informations personnelles et les divulguent plus tard, tandis que d'autres ont été formés aux contenus préjudiciables ou reproduisent des œuvres protégées par le droit d'auteur. Des arguments juridiques plus techniques approfondissent les détails de ces systèmes – selon lesquels le simple fait de former sur du matériel protégé par le droit d’auteur constitue une violation du droit d’auteur, par exemple. On ne sait pas lequel de ces arguments, le cas échéant, sera retenu devant les tribunaux. Les entreprises affirment que tout cela relève de l’usage loyal, que le contenu préjudiciable est une faille temporaire du système qui peut être corrigée ultérieurement et que les accords de licence contribueront à offrir un répit aux artistes à l’avenir.

Mais souvent, il ne s'agit pas nécessairement de ce qui est légal. aujourd'hui, mais sur la façon dont nous voulons que le monde fonctionne à l'avenir. Il existe de très nombreux exemples au cours du siècle dernier où nous réglementons la technologie non pas parce qu’elle enfreint les lois existantes, mais parce qu’elle permet aux gens de contourner ces lois d’une manière à laquelle personne n’aurait pu s’attendre. Cependant, les arguments qui défendent cette exploitation à grande échelle du travail créatif passent à côté du problème. Ce n’est pas une question de légalité, mais une question d’humanité. Il est logique de protéger le travail créatif et les personnes qui travaillent dur pour le réaliser, car il joue un rôle très important dans la société.

Image Palworld d'un copain Fuddler

Palworld a récemment suscité de nombreuses critiques sur la conception de ses monstres Pal.Crédit image : Fusil de chasse/Paire de poche Rock Paper

Ce sont ces dommages à long terme que craignent le plus de nombreux créatifs et chercheurs en IA. Tout comme les récents licenciements dans l’industrie du jeu vidéo, les effets des grands changements dans l’industrie mettent du temps à se faire sentir pleinement. Tous les jeux qui devaient sortir au cours d'une année donnée sortiront probablement, et beaucoup d'entre eux seront amusants, et peut-être vous demanderez-vous si ces licenciements ont vraiment affecté quelque chose ? Mais l’impact d’une telle perturbation peut prendre des années avant d’être remarqué, et des décennies avant d’être inversé. La raison pour laquelle ces systèmes d’IA générative ont pu être construits aujourd’hui est qu’ils disposaient de décennies, voire de siècles, de créativité humaine à observer sur Internet. S’ils jouent un rôle dans la dévalorisation ou la déstabilisation des emplois qui ont aidé ces gens à créer cet art, de quelle culture y aura-t-il des leçons à tirer à la fin de ce siècle ? Même si vous êtes un accélérateur inconditionnel de l’IA, beaucoup craignent que nous ayons infecté Internet de manière permanente avec tellement de contenu généré par l’IA qu’il pourrait être impossible de former à nouveau un système d’IA sur du contenu créé par des humains.

Notre industrie du jeu vidéo est étonnamment fragile, même si, à certains égards, elle semble devenir de plus en plus géante au fil des décennies. Bon nombre des idées les plus brillantes de son histoire, bon nombre des créateurs les plus célèbres ou des jeux les plus appréciés, sont nés des marges de l’industrie ou d’autres médias, souvent de personnes en situation économique vulnérable. De petits changements qui semblent inoffensifs sur le moment ont souvent des effets de grande envergure – et il existe déjà des preuves que l'IA générative a affecté la qualité et la quantité du travail créatif indépendant. Que vous pensiez que l’IA générative est bonne ou mauvaise, il semble irrespectueux d’ignorer les préoccupations et les plaintes de personnes qui ont travaillé si dur, pour peu de récompense, pour créer la communauté riche et belle dont est issu notre passe-temps. Quoi qu’en disent les tribunaux, quelle que soit la réglementation adoptée, quelle que soit l’apparence de ces entreprises une fois la poussière retombée, de nombreux dégâts ont peut-être déjà été causés.