Découvrez l’innovation de Tencent : transformer une image en un monde 3D interactif

Avec son nouveau modèle d’IA, Tencent redéfinit notre perception du virtuel en permettant de créer des mondes 3D à partir d’une simple image. Plongez dans cette révolution technologique qui promet de bouleverser de nombreux secteurs.

L’info résumée en 3 points

  • Tencent a dévoilé le modèle d’IA HunyuanWorld-Voyager pour transformer une image fixe en un monde virtuel 3D.
  • Le modèle utilise des vidéos RVB et de profondeur pour créer des environnements cohérents sans processus de reconstruction traditionnelle.
  • Malgré son potentiel, le modèle est soumis à des restrictions de licence, excluant certains pays et imposant des conditions pour les grandes applications commerciales.

Le modèle d’IA HunyuanWorld-Voyager

Tencent a récemment présenté HunyuanWorld-Voyager, un modèle d’intelligence artificielle capable de transformer une seule image en un environnement 3D interactif. Contrairement aux méthodes classiques de reconstruction 3D, Voyager ne nécessite pas de processus complexes et volumineux. Grâce à son approche innovante, une simple image fixe peut donner naissance à un monde virtuel où l’utilisateur peut se déplacer.

Fonctionnement du modèle et ses caractéristiques

Pour entraîner HunyuanWorld-Voyager, Tencent a utilisé plus de 100 000 extraits vidéo issus de divers ensembles de données. Le modèle génère des séries de vidéos en RVB et en profondeur à partir d’une image, intégrant des informations visuelles et géométriques pour construire un monde virtuel fluide. Bien que la sortie ne soit pas techniquement de la « vraie » 3D, elle imite l’illusion d’un environnement tridimensionnel grâce à une série de cadres 2D.

Une des particularités de ce modèle réside dans sa capacité à produire simultanément des images RVB et de profondeur. Cela élimine le besoin de processus distincts, permettant aux développeurs de créer directement des contenus 3D utilisables dans des simulations ou des présentations numériques.

Applications potentielles et restrictions de licence

Le modèle Voyager trouve ses applications dans divers domaines comme le transfert de style 3D, l’estimation de la profondeur vidéo ou la création de simulations pour la formation. Tencent annonce que son modèle obtient des scores élevés en termes de contrôle de la caméra et de cohérence spatiale, selon les benchmarks.

Malgré ces avancées, l’utilisation du modèle n’est pas sans contraintes. Les restrictions de licence de Tencent interdisent son utilisation dans l’Union européenne, le Royaume-Uni et la Corée du Sud, et imposent des conditions supplémentaires pour les applications atteignant un large public.

Comparaison avec Google Genie 3

Le modèle de Tencent rappelle Google Genie 3, récemment présenté par Google. Ce dernier crée également des mondes virtuels en temps réel et peut mémoriser les déplacements précédents de l’utilisateur. Ces innovations illustrent la course effrénée entre les géants de la technologie pour dominer le secteur de la réalité virtuelle.

Tencent, fondée en 1998, est l’une des plus grandes entreprises technologiques au monde, connue pour ses avancées en intelligence artificielle, jeux vidéo et services internet. En parallèle, Google, depuis sa création en 1998, s’est imposé comme un leader dans l’innovation technologique, notamment grâce à ses recherches avancées en intelligence artificielle et en réalité augmentée.

[Nouveau] 4 ebooks sur le digital marketing à télécharger gratuitement

Cet article vous a plu ? Recevez nos prochains articles par mail

Inscrivez-vous à notre newsletter, et vous recevrez un mail tous les jeudis avec les derniers articles d’experts publiés.

D’autres articles sur le même thème :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *