23 juin 2026
ia

VASA-1 : Microsoft fait parler une photo et préfère la garder au labo

Microsoft vient de présenter VASA-1, une intelligence artificielle qui transforme une simple photo en vidéo parlante. Vous lui donnez une image d’un visage et un fichier audio, et le système produit une séquence où la personne semble réellement prononcer les mots. Le résultat est troublant de réalisme.

Dans le détail, VASA-1 génère des vidéos en 512 par 512 pixels, à une cadence pouvant grimper jusqu’à 40 images par seconde. Ce qui impressionne, c’est la synchronisation : les lèvres collent à l’audio, les expressions du visage paraissent naturelles, et même les petits mouvements de tête sont là. De quoi gommer ce côté figé qui trahissait jusqu’ici les visages générés par ordinateur.

Sur le papier, les usages possibles ne manquent pas. On pense aux assistants virtuels dotés d’un vrai visage, à des contenus pédagogiques, à des outils pour rendre certains services plus accessibles, ou encore au divertissement. Bref, tout ce qui gagne à mettre un visage humain sur une voix.

Sauf que la même technologie ouvre grand la porte aux dérives. Faire dire n’importe quoi à n’importe qui, à partir d’une seule photo récupérée sur internet, c’est le scénario rêvé pour la désinformation et les deepfakes. Une vidéo truquée d’un responsable politique ou d’un patron, et la rumeur part toute seule.

La face cachée de l'intelligence artificielle

Pour creuser ce que l’IA est déjà capable de faire :

La face cachée de l’intelligence artificielle → voir sur Amazon

Lien affilié Amazon. En tant que Partenaire Amazon, je réalise un bénéfice sur les achats remplissant les conditions requises.

Microsoft en est parfaitement conscient. L’entreprise insiste : VASA-1 reste une démonstration de recherche, point. Aucun produit commercial, aucune interface ouverte au public ne sont prévus à ce stade. La firme préfère verrouiller son outil plutôt que de le lâcher dans la nature, et dit avoir mis en place des garde-fous pour limiter les abus.

C’est une position prudente, et on la comprend. Le problème, c’est qu’une fois qu’une telle technologie existe et qu’on en montre les résultats, l’idée est dans la nature. D’autres équipes, moins regardantes, finiront par proposer l’équivalent sans les mêmes scrupules.

VASA-1 résume bien le dilemme de l’IA générative : la prouesse technique est réelle, les applications utiles aussi, mais le potentiel de nuisance est tout aussi évident. En gardant son outil au laboratoire, Microsoft botte un peu en touche. La vraie question, celle de savoir comment on vérifiera demain qu’une vidéo est authentique, reste entière.

Crédit photo : DR

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *