Volver arriba
martes, 21 de mayo de 2024
casaInternetEmpresaDeepfakes: ¡Microsoft crea "caras parlantes" hiperrealistas a partir de imágenes fijas!

Deepfakes: ¡Microsoft crea "caras parlantes" hiperrealistas a partir de imágenes fijas!

Η Research αναστατώνει τον κόσμο της τεχνητής νοημοσύνης με το νέο της πειραματικό εργαλείο VASA-1. Πρόκειται για μια que puede convertir una imagen estática de un rostro (incluso un dibujo) en un vídeo parlante realista, ¡en tiempo real! VASA-1 crea expresiones y movimientos de cabeza que están perfectamente sincronizados con un archivo de audio existente, ya sea habla o canto. En la página del proyecto hay muchos ejemplos, tan bien hechos que podrían engañar incluso a un espectador observador.

Aunque tras una observación minuciosa los movimientos de los labios y la cabeza en los ejemplos pueden parecer un poco robóticos y fuera de sincronización, el potencial de abuso de Está claro. Con VASA-1, se podrían crear deepfakes de personas reales de forma fácil y rápida. Los investigadores de Microsoft reconocen este riesgo y actualmente no tienen intención de publicar una “demostración en línea, API, producto comercial, detalles de implementación adicionales o cualquier servicio relacionado” hasta que estén seguros de que su tecnología “se utilizará de manera responsable y de acuerdo con las regulaciones”. Sin embargo, no se dijo si planean implementar restricciones específicas para evitar el uso malicioso, como la creación de pornografía profunda o noticias falsas.

A pesar de las preocupaciones, los investigadores creen que VASA-1 tiene un enorme potencial para aplicaciones positivas. Puede contribuir a la igualdad de acceso a la educación y mejorarla. para personas con discapacidad, quizás dándoles un avatar que hable por ellos. Además, podría brindar compañía y apoyo terapéutico a las personas que lo necesiten, allanando el camino para programas con personajes de IA con los que los usuarios puedan chatear.

Según el artículo de investigación publicado con el anuncio, VASA-1 fue entrenado en el conjunto de datos VoxCeleb2, que contiene "más de 1 millón de frases de 6.112 celebridades" extraídas de videos de . Aunque la herramienta fue entrenada en rostros reales, también funciona en fotografías artísticas, como la Mona Lisa. Los investigadores, con humor, lo combinaron con una grabación de la interpretación viral de Anne Hathaway de la canción Paparazzi de Lil Wayne. El resultado es delicioso y vale la pena verlo, incluso si se cuestiona la utilidad de dicha tecnología.

Marizas Dimitris
Marizas Dimitrishttps://www.techwar.gr
Dimitris, fanático de los teléfonos móviles Samsung, ha desarrollado una relación especial con los productos de la empresa, apreciando el diseño, el rendimiento y la innovación que ofrecen. Escribir y leer noticias tecnológicas de todo el mundo.
ARTÍCULOS RELACIONADOS

DEJA UNA RESPUESTA

ingresa tu comentario!
por favor ingresa tu nombre aquí

Más popular

Ultimos articulos