Actualités / Jeux

Google annonce Imagen, un générateur d’images basé sur l’IA avec des revendications de “photoréalisme sans précédent”

Google announces Imagen, an AI-based image generator with claims of “unprecedented photorealism”

Google Imagen est le nouveau générateur de texte en image AI là-bas. Il n’a pas été publié dans le domaine public. Mais, tout en annonçant le nouveau modèle d’IA, la société a partagé le document de recherche, un outil d’analyse comparative appelé Drawbench pour établir des comparaisons objectives avec les concurrents d’Imagen, et quelques images loufoques pour votre plaisir subjectif. Cela met également en lumière les dommages potentiels de cette technologie.

Google Imagen : Voici comment fonctionne un modèle de texte en image

L’idée est que vous dites simplement ce que vous voulez que le générateur d’images AI évoque et il fait exactement cela.

Les images présentées par Google sont probablement les meilleures du lot et comme l’outil d’IA n’est pas accessible au grand public, nous vous suggérons de prendre les résultats et les affirmations avec un grain de sel.

Quoi qu’il en soit, Google est fier des performances d’Imagen et peut-être de la raison pour laquelle il a publié une référence pour les modèles texte-image de l’IA appelée DrawBench. Pour ce que ça vaut, les graphiques de Google révèlent l’avance d’Imagen sur les alternatives comme Dall-E 2 d’OpenAI.

Banc de tirage

Or, tout comme la solution d’Open AI ou d’ailleurs, toutes les applications similaires ont des défauts intrinsèques, c’est-à-dire qu’elles sont susceptibles de résultats déconcertants.

Tout comme le «biais de confirmation» chez les humains, qui est notre tendance à voir ce que nous croyons et à croire ce que nous voyons, les modèles d’IA qui filtrent de grandes quantités de données peuvent également tomber dans ces biais. Il s’est avéré maintes et maintes fois que c’est un problème avec les générateurs de texte en image. Alors, Imagen de Google sera-t-il différent ?

Selon les propres mots de Google, ces modèles d’IA encodent “plusieurs préjugés et stéréotypes sociaux, y compris un biais général vers la génération d’images de personnes à la peau plus claire et une tendance pour les images représentant différentes professions à s’aligner sur les stéréotypes de genre occidentaux”.

La société Alphabet pourrait toujours filtrer certains mots ou expressions et alimenter de bons ensembles de données. Mais avec l’échelle des données sur lesquelles ces machines fonctionnent, tout ne peut pas être passé au crible, ou tous les problèmes ne peuvent pas être résolus. Google l’admet en disant que “[T]Les besoins en données à grande échelle des modèles texte-image […] ont conduit les chercheurs à s’appuyer fortement sur de vastes ensembles de données, pour la plupart non conservés et récupérés sur le Web […] Les audits des ensembles de données ont révélé que ces ensembles de données ont tendance à refléter des stéréotypes sociaux, des points de vue oppressifs et des associations désobligeantes, ou autrement nuisibles, à des groupes identitaires marginalisés.

Ainsi, comme le dit Google, Imagen “n’est pas adapté à un usage public pour le moment”. Si et quand il est disponible, essayons de lui dire : « Hey Google Imagen, il n’y a pas de paradis. C’est facile si vous essayez. Pas d’enfer en dessous de nous. Au-dessus de nous, rien que du ciel ».

En ce qui concerne les autres nouvelles, critiques, reportages, guides d’achat et tout ce qui concerne la technologie, continuez à lire Digit.in.