W.A.I. #6

¡Hecha a mano, 100% libre de Inteligencia Artificial!

¡Hecha a mano, 100% libre de Inteligencia Artificial!

Bienvenidos/as a otra edición de WAI. 

El título de la edición nº 6 no engaña, todo lo que ves está hecho artesanalmente. ¿Igual debería usar un poco de esta tecnología mágica para no llegar apurado cada domingo? Quizás.

Mientras decido si dormir es motivo suficiente para empezar a automatizar tareas, aquí tienes la sexta edición de tu informativo dominical sobre Inteligencia Artificial. Para verla en 4k y sonido envolvente (o sin cortes y formatos raro por culpa de Gmail), échale un ojo a la versión web aquí.

Seguimos con mucho movimiento a diario y en esta edición se nota que la cabra tira al monte, porque hay un incremento de todo lo relacionado con el mundo 3d. Poco a poco parece que va cogiendo forma este segmento y diría que en un mes o dos tendremos entre manos aplicaciones útiles capaces de generar modelos usables en juegos y entornos virtuales.

 📍 ÍNDICE - Echa un vistazo al contenido de hoy

  • La edición de imágenes con lenguaje natural es ya una realidad.

  • Flawless te dejará sin palabras. ¿El fin de los actores de doblaje?

  • Generación de música a partir de texto.

  • Creación de modelos 3d animados a partir de texto.

  • Deepfakes nivel Dios.

  • $250k - $335k por ser Ingeniero de prompts.

  • LoRA te permite entrenar modelos de Stable Diffusion en tan sólo 3.3Mb

  • Alternativas gratuitas para usar Midjourney y Stable Diffusion.

  • Plugin para photoshop de Stable Diffusion sin necesidad de GPU y gratis

  • Text-to-Video ahora con inpaint

  • NeRFs mejorados

  • La IA te ayuda a ligar

  • Tutoriales gourmet

Superada la introducción y el índice, empezamos.

🔍 El caso

▶️ Hoy esta sección va directa al grano. Jamás adivinarás quién está detrás de la empresa que aspira a ser la referencia en deepfakes y que ya ha colaborado, entre otros, con Kendrick Lamar en este vídeo, donde se transforma en OJ Simpson, Will Simith o Koby Bryant. Como siempre, al final tienes la respuesta. Enlace

🗻 TOP - Si solo tienes 2 minutos, esta es tu sección.

▶️ Increíble esto de Flawless. Poder cambiar la expresión facial de un actor o actriz para adaptarlo a otros idiomas o incluso suavizar el lenguaje abre un mundo de posibilidades. ¿Youtubers multi-idioma? ¿Adiós actores de doblaje? Enlace

▶️ Google recurre a sus fundadores para intentar remontar en la carrera por la IA. Enlace

▶️ MAV3D (Make a video 3d). Primer modelo en crear escenas 3d dinámicas a partir de texto, cortesía de Meta. Cuando todavía no tenemos un modelo que genere objetos 3d a la altura de los modelos de imágenes, se redobla la apuesta, ahora con animación. Enlace

▶️ MusicLM es un generador de música a partir de texto. Enlace

▶️ Nueva versión de la tecnología de Nvidia que permite mirar a cualquier lado y que tus ojos se fijen en la cámara. Parece brujería. Enlace

▶️ Tutorial de 100 páginas de cómo hacer animaciones con tus personajes creados con Midjourney. Increíble trabajo. Enlace

▶️ ¿Qué pasaría si entrenáramos a GPT-3 con 10 años de entradas de nuestro diario personal? Aquí tienes la respuesta. Enlace

▶️  Editar imágenes con lenguaje natural ya es posible con Playground.ai. Enlace

▶️ Anthropic pone el listón muy alto con los salarios ofrecidos para los puestos de ingenieros de prompts. Enlace

▶️ Modelos entrenados con tus propios conceptos en tan solo 3.3mb gracias a LoRA. Antes eran casi 2Gb🤯. Enlace

 🐔 Tuit de la semana

🖼️ Imágenes 

▶️ Shutterstock elige la estrategia completamente opuesta a Gettymages y presenta su propio generador de imágenes por IA. ¿Cuál tendrá razón? Enlace 

▶️ Demo de instruct pix2pix, para editar imágenes con lenguaje natural. Enlace

▶️ En el buscador You.com puedes crear imágenes tanto con Stable Diffusion como con Midjourney. GRATIS. Enlace

▶️ Nuevo modelo de OpenClip de Laion. Recuerda que CLIP es una tecnología vital en los modelos de difusión y que el gran cambio de la versión 1.5 a la 2.0 de Stable Diffusion fue por cambiar el modelo de OpenAI al modelo OpenCLIP. Enlace

▶️ Mosaic asegura que entrenar Stable Diffusion desde 0 costaría 160.000$. ¿Quien se apunta a un crowfounding? Enlace

▶️ Futuretools. Genera imágenes con diferentes modelos de Stable Diffusion de manera completamente gratuita. Enlace 

▶️ Los resultados de combinar img2img con EBSynth pueden ser espectsculares. Enlace

▶️ Plugin de stable difussion para photoshop. Gratis, sin necesidad de GPU…ya no hay excusa. Enlace

▶️ Inpaint en video. Genmo.ai va cogiendo cada vez mejor forma. Enlace

▶️ El servidor de Midjourney en Discord es el primero en alcanzar los 10 millones de usuarios. Enlace

🏆 Imagen de la semana

Creada por Linus con Midjourney. Enlace

▶️ ¿Qué pasaría si Padre de Familia fuera una sitcom de los 80? Enlace (Gracias a mi corresponsal Berto)

✏️ Texto

▶️ Cómo pedirle a ChatGPT que sea tu ingeniero de software de bolsillo. Enlace 

▶️ ¿Cómo funciona realmente Chat GPT? Enlace

▶️ Marcas de agua invisibles para los modelos de generación de texto. Enlace

▶️ Trucos sobre cómo esquivar los detectores de texto generado por ChatGPT. Enlace

🧱 Diseño / 3D

▶️ De Midjourney a robot animado en Unity en 8 horas. Enlace

▶️ Dataset con mas de 800k objetos 3d etiquetados. Enlace

▶️ Diario de desarrollo de videojuegos, 4º fascículo. Si la semana pasada veíamos como (no) usar la IA par generar assets 3D, esta semana el enfoque es en los assets 2D. Enlace

▶️ Gana 50000$ integrando IA con personajes y experiencias inmersivas. Enlace

▶️ Hay que seguirle la pista a Gepetto AI y su futura herramienta text-2-3d. Enlace

▶️ La gente de Luma sigue a lo suyo: hacer la captura y uso de NeRF lo más sencillo y eficiente posible. Actualización que mejora aún más la aplicación. Enlace

▶️  Si eres desarrollador de videojuegos esto te interesa. Artículo de por qué la IA no va a suponer una revolución en este campo (aún). Enlace

▶️ Luma anuncia una ronda de invitaciones para probar su herramienta Text-to-3D. Estando en la lista de espera desde hace mes y medio espero que me llegue pronto. Enlace 

🧠 Productividad

▶️ GPTAgent. Asistente para hacer apps no code. Enlace 

▶️ Un combo con muchísimo potencial: ChatGPT puede diseñar flujos no-code. Enlace

▶️ Bardeen.ai promete automatizar esas tareas repetitivas sin usar código. Enlace

▶️ Convierte tus archivos de audio o video en artículos de blog. Enlace 

📻 Todo lo demás

▶️ Separa las pistas de una canción con IA. Enlace

▶️ ¿Inteligencia Artificial para ligar? Parece que sí, Roast.dating promete potenciar tus cualidades para conseguir mejores resultados en las aplicaciones de citas. Enlace 

▶️ Hazte viejo de golpe gracias a esta app. Enlace

▶️ Te aconseja qué cocinar basándose en tus ingredientes disponibles y una pizca de IA. Enlace 

▶️ Repositorio con el panorama actual de las herramientas y aplicaciones de inteligencia artificial generativa. Enlace

▶️ No habrá robots abogados, al menos, por ahora. Si recuerdas, en anteriores ediciones contaba que iba a darse un juicio en el que el abogado defensor iba a ser una IA que se comunicara con el acusado por un audífono en la corte.

Pues bien, han debido de ejercer muchas presiones porque el CEO de la compañía DoNotPay ha anunciado que se aplaza. Enlace

▶️ BuzzFeed anuncia que usará ChtrGPT para ayudar a crear contenido y sus acciones se disparan. Recordemos cómo acabaron los anteriores intentos como el de CNET (mal). Enlace 

▶️ Agente de viajes por IA. ¿Quién se atreve a comprobar si hace bien su función? Enlace

▶️ Msanii es un nuevo modelo de generación de música mediante espectogramas. Con demo usable. Enlace

▶️ RunwayML fue usado en la película recientemente nominada a no sé cuántos Oscar Everything, everywhere all at once (si no la has visto te la recomiendo). Honestamente, pensé que estas herramientas tardarían más en incorporarse a grandes producciones. Enlace

🎓 Formación y tutoriales

▶️ Reemplazar ropa en un vídeo con Instruct Pix2Pix y Ebsynth. Enlace 

▶️ Repositorio de recursos sobre machine learning, estructura de datos, estadísticas y más de la mano de Merve. Enlace

▶️ Proceso creativo de Stelfie, el viajero del tiempo. Si no lo ubicas, entrenó un modelo para generar imágenes de sí mismo en momentos cumbre de la historia. Enlace

▶️ Cambiar la expresión facial de tus personajes manteniendo sus rasgos. Enlace

📜 Papers, please.

▶️ En principio es imposible incorporar conceptos nuevos en los grandes modelos de lenguaje, pero parece que en Microsoft han dado con un método para hacerlo. Enlace

▶️ Método para explorar espacios complejos de Meta. Enlace 

▶️ Representación 3d de imágenes dinámicas (vídeos, vaya). Enlace

▶️  RecolorNeRF. O cómo editar los colores de una captura NeRF de forma eficiente. ¿He dicho ya que esta tecnología es mi perdición? Enlace

▶️ Meta asegura que con Data2vec 2.0 se pueden entrenar modelos de texto, audio e imágen hasta 16 veces mas rápido. Enlace

▶️ Triaje de pacientes con dolor de pecho mediante IA. Enlace

▶️ BallGAN. O cómo representar en 3D imágenes 2D. Enlace

▶️ StyleGAN-T como alternativa a los modelos de difusión de generación de imágenes. Porque sí amigos, había vida antes de los modelos actuales y usaban GAN en su mayoría. Enlace

🍅 Salseo

▶️ ChatGPT no puede aparecer como autor en publicaciones. Springer Nature, responsable de la gran mayoría de publicaciones académicas, dice que no tiene problema en que se use la IA mientras se deje claro en qué partes del proceso se usaron, pero no son autores de las obras. Enlace

▶️ Yann LeCun, jefe de IA de Meta, dice que ChatGPT en realidad no supone nada tan impresionante.

Algunas de las respuestas son muy interesantes, dando argumentos en uno u otro sentido. Enlace

Desenlace

Pues resulta que Trey Parker y Matt Stone, creadores de South Park han decidido invertir parte de su recompensa por la renovación de su icónica serie en Deep Voodoo, una empresa cuyo objetivo es juntar a los mejores talentos a nivel global sobre deepfakes. Enlace

Y por el momento, viendo el vídeo de Kendrick Lamar y otros ejemplos que aparecen en su web, están en muy buen camino. Enlace

Como siempre, muchísimas gracias por leer esta newsletter. ¿Qué te ha parecido?

Si tienes cualquier sugerencia o comentario, por favor, házmelo llegar (estoy por aquí en Twitter) y lo tendré en cuenta para futuras ediciones.

Y si crees que le puede interesar a alguien, aquí tienes la forma de compartirla.

También puedes copiar y compartir directamente este enlace

¡Saludos!