W.A.I.
Posts
W.A.I. #6

W.A.I. #6

¡Hecha a mano, 100% libre de Inteligencia Artificial!

David Garrido
29 de enero de 2023

¡Hecha a mano, 100% libre de Inteligencia Artificial!

Bienvenidos/as a otra edición de WAI.

El título de la edición nº 6 no engaña, todo lo que ves está hecho artesanalmente. ¿Igual debería usar un poco de esta tecnología mágica para no llegar apurado cada domingo? Quizás.

Mientras decido si dormir es motivo suficiente para empezar a automatizar tareas, aquí tienes la sexta edición de tu informativo dominical sobre Inteligencia Artificial. Para verla en 4k y sonido envolvente (o sin cortes y formatos raro por culpa de Gmail), échale un ojo a la versión web aquí.

Seguimos con mucho movimiento a diario y en esta edición se nota que la cabra tira al monte, porque hay un incremento de todo lo relacionado con el mundo 3d. Poco a poco parece que va cogiendo forma este segmento y diría que en un mes o dos tendremos entre manos aplicaciones útiles capaces de generar modelos usables en juegos y entornos virtuales.

📍 ÍNDICE - Echa un vistazo al contenido de hoy

La edición de imágenes con lenguaje natural es ya una realidad.
Flawless te dejará sin palabras. ¿El fin de los actores de doblaje?
Generación de música a partir de texto.
Creación de modelos 3d animados a partir de texto.
Deepfakes nivel Dios.
$250k - $335k por ser Ingeniero de prompts.
LoRA te permite entrenar modelos de Stable Diffusion en tan sólo 3.3Mb
Alternativas gratuitas para usar Midjourney y Stable Diffusion.
Plugin para photoshop de Stable Diffusion sin necesidad de GPU y gratis
Text-to-Video ahora con inpaint
NeRFs mejorados
La IA te ayuda a ligar
Tutoriales gourmet

Superada la introducción y el índice, empezamos.

🔍 El caso

▶️ Hoy esta sección va directa al grano. Jamás adivinarás quién está detrás de la empresa que aspira a ser la referencia en deepfakes y que ya ha colaborado, entre otros, con Kendrick Lamar en este vídeo, donde se transforma en OJ Simpson, Will Simith o Koby Bryant. Como siempre, al final tienes la respuesta. Enlace

🗻 TOP - Si solo tienes 2 minutos, esta es tu sección.

▶️ Increíble esto de Flawless. Poder cambiar la expresión facial de un actor o actriz para adaptarlo a otros idiomas o incluso suavizar el lenguaje abre un mundo de posibilidades. ¿Youtubers multi-idioma? ¿Adiós actores de doblaje? Enlace

Our software harnesses the power of generative AI to change filmed dialogue.
TrueSync opens a new world of possibilities from fast and efficient AI reshoots to the creation of immersive, visual translations, for any language around the world.
#GenerativeAI#Hollywood
— Flawless (@Flawlessai)
12:49 PM • Jan 27, 2023

▶️ Google recurre a sus fundadores para intentar remontar en la carrera por la IA. Enlace

▶️ MAV3D (Make a video 3d). Primer modelo en crear escenas 3d dinámicas a partir de texto, cortesía de Meta. Cuando todavía no tenemos un modelo que genere objetos 3d a la altura de los modelos de imágenes, se redobla la apuesta, ahora con animación. Enlace

Text-To-4D Dynamic Scene Generation

Text-To-4D Dynamic Scene Generation, 2023.

https://make-a-video3d.github.io/

▶️ MusicLM es un generador de música a partir de texto. Enlace

▶️ Nueva versión de la tecnología de Nvidia que permite mirar a cualquier lado y que tus ojos se fijen en la cámara. Parece brujería. Enlace

Introducing Eye Contact by NVIDIA 👀
NVIDIA just released a new Eye Contact feature that uses AI to make you look into the camera.
— Jousef Murad (@Jousefm2)
7:18 PM • Jan 21, 2023

▶️ Tutorial de 100 páginas de cómo hacer animaciones con tus personajes creados con Midjourney. Increíble trabajo. Enlace

▶️ ¿Qué pasaría si entrenáramos a GPT-3 con 10 años de entradas de nuestro diario personal? Aquí tienes la respuesta. Enlace

▶️ Editar imágenes con lenguaje natural ya es posible con Playground.ai. Enlace

1/ Introducing AI-first image editing to Playground—a way to instruct an AI to synthesize spectacular yet subtle edits
Try it here: playgroundai.com/create
We are blown away by the creative possibilities with this.
Example: "Make it summer"
(More examples in a thread)
— Suhail (@Suhail)
10:32 PM • Jan 23, 2023

▶️ Anthropic pone el listón muy alto con los salarios ofrecidos para los puestos de ingenieros de prompts. Enlace

▶️ Modelos entrenados con tus propios conceptos en tan solo 3.3mb gracias a LoRA. Antes eran casi 2Gb🤯. Enlace

🐔 Tuit de la semana

🖼️ Imágenes

▶️ Shutterstock elige la estrategia completamente opuesta a Gettymages y presenta su propio generador de imágenes por IA. ¿Cuál tendrá razón? Enlace

After inking its OpenAI deal, Shutterstock rolls out a generative AI toolkit to create images based on text prompts

Customers of Shutterstock's Creative Flow online design platform will now be able to create images based on text prompts, powered by OpenAI and Dall-E 2

https://techcrunch.com/2023/01/25/after-inking-its-openai-deal-shutterstock-rolls-out-a-generative-ai-toolkit-to-create-images-based-on-text-prompts/

▶️ Demo de instruct pix2pix, para editar imágenes con lenguaje natural. Enlace

▶️ En el buscador You.com puedes crear imágenes tanto con Stable Diffusion como con Midjourney. GRATIS. Enlace

▶️ Nuevo modelo de OpenClip de Laion. Recuerda que CLIP es una tecnología vital en los modelos de difusión y que el gran cambio de la versión 1.5 a la 2.0 de Stable Diffusion fue por cambiar el modelo de OpenAI al modelo OpenCLIP. Enlace

▶️ Mosaic asegura que entrenar Stable Diffusion desde 0 costaría 160.000$. ¿Quien se apunta a un crowfounding? Enlace

Training Stable Diffusion from Scratch Costs <$160k

We wanted to know how much time (and money) it would cost to train a Stable Diffusion model from scratch using our Streaming datasets, Composer, and MosaicML Cloud Platform. Our results: it would take us 79,000 A100-hours in 13 days, for a total training cost of less than $160,000. Our tooling not only reduces time and cost by 2.5x, but it is also extensible and simple to use.

https://www.mosaicml.com/blog/training-stable-diffusion-from-scratch-costs-160k

▶️ Futuretools. Genera imágenes con diferentes modelos de Stable Diffusion de manera completamente gratuita. Enlace

Future Tools - InstantArt

AI art generator and search engine (with prompts)

https://www.futuretools.io/tools/instantart

▶️ Los resultados de combinar img2img con EBSynth pueden ser espectsculares. Enlace

▶️ Plugin de stable difussion para photoshop. Gratis, sin necesidad de GPU…ya no hay excusa. Enlace

▶️ Inpaint en video. Genmo.ai va cogiendo cada vez mejor forma. Enlace

Use AI to Paint a Video
alpha.genmo.ai
1️⃣ Upload a photo 📷 @genmoai
2️⃣ Paint over it and write a caption
3️⃣ One minute later, it's animated
🎥🖌️ New video inpainting model out now
— Ajay Jain (@ajayj_)
12:09 AM • Jan 28, 2023

▶️ El servidor de Midjourney en Discord es el primero en alcanzar los 10 millones de usuarios. Enlace

🏆 Imagen de la semana

Creada por Linus con Midjourney. Enlace

▶️ ¿Qué pasaría si Padre de Familia fuera una sitcom de los 80? Enlace (Gracias a mi corresponsal Berto)

A Realistic 80's-Style Family Guy Opening Made by AI Is Terrifyingly Impressive

This reminds me of that time we all became three-dimensional.

https://twinfinite.net/2023/01/a-realistic-80s-style-family-guy-opening-made-by-ai-is-terrifyingly-impressive/

✏️ Texto

▶️ Cómo pedirle a ChatGPT que sea tu ingeniero de software de bolsillo. Enlace

Having AI tools like ChatGPT is like having a personal software engineer in your pocket.
But most people don't know how to craft prompts for code.
Here's how you can get AI to write software for you:
— Replit ⠕ (@Replit)
5:05 PM • Jan 20, 2023

▶️ ¿Cómo funciona realmente Chat GPT? Enlace

▶️ Marcas de agua invisibles para los modelos de generación de texto. Enlace

▶️ Trucos sobre cómo esquivar los detectores de texto generado por ChatGPT. Enlace

🧱 Diseño / 3D

▶️ De Midjourney a robot animado en Unity en 8 horas. Enlace

AI assisted gamedev: going from @midjourney to #unity in-game robot character (in 8 hours). Read all about it: echoesofsomewhere.com/2023/01/25/mod…#gamedevelopment#indiedev#AIart
— Jussi Kemppainen (@JussiKemppainen)
7:39 PM • Jan 25, 2023

▶️ Dataset con mas de 800k objetos 3d etiquetados. Enlace

▶️ Diario de desarrollo de videojuegos, 4º fascículo. Si la semana pasada veíamos como (no) usar la IA par generar assets 3D, esta semana el enfoque es en los assets 2D. Enlace

2D Asset Generation: AI for Game Development #4

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

https://huggingface.co/blog/ml-for-games-4

▶️ Gana 50000$ integrando IA con personajes y experiencias inmersivas. Enlace

▶️ Hay que seguirle la pista a Gepetto AI y su futura herramienta text-2-3d. Enlace

Here it is!
@Gepettoai text to 3D at runtime with point e!!!
Text-to-3D will change everything!!!
We thought we’d start with building out a ‘HONEY I SHRUNK THE KIDS’ style platformer. #AIart#stablediffusion#gamedev
Gepettoai.com
— The Culture DAO (@theculturedao)
5:12 PM • Jan 26, 2023

▶️ La gente de Luma sigue a lo suyo: hacer la captura y uso de NeRF lo más sencillo y eficiente posible. Actualización que mejora aún más la aplicación. Enlace

▶️ Si eres desarrollador de videojuegos esto te interesa. Artículo de por qué la IA no va a suponer una revolución en este campo (aún). Enlace

Generative AI Won’t Revolutionize Game Development Just Yet

Hypesters say artificial intelligence will one day automate all the hard work of video game creation. But it’s not that simple.

https://www.wired.com/story/generative-ai-video-game-development/

▶️ Luma anuncia una ronda de invitaciones para probar su herramienta Text-to-3D. Estando en la lista de espera desde hace mes y medio espero que me llegue pronto. Enlace

Text-to-3D is here #imagine3d!
Starting today we are WIDELY expanding the access, first to our community members, then all of you who joined the waitlist! What will you make?
captures.lumalabs.ai/imagine
#textto3d#GenerativeAI#LumaAI
— Luma AI (@LumaLabsAI)
10:10 PM • Jan 27, 2023

🧠 Productividad

▶️ GPTAgent. Asistente para hacer apps no code. Enlace

▶️ Un combo con muchísimo potencial: ChatGPT puede diseñar flujos no-code. Enlace

▶️ Bardeen.ai promete automatizar esas tareas repetitivas sin usar código. Enlace

Bardeen | Automate your repetitive tasks with one click

Bardeen is an automation app to replace your repetitive tasks with a single shortcut and control your web apps from anywhere. Explore our integrations with your favorite apps and hundreds of pre-built playbooks that help you stay in the flow.

https://www.bardeen.ai/

▶️ Convierte tus archivos de audio o video en artículos de blog. Enlace

VoicePen - Convert audio/video files to blog posts

Leverage AI to transform your audio/video content into written content and access more channels for cross promotion.

https://voicepen.ai/

📻 Todo lo demás

▶️ Separa las pistas de una canción con IA. Enlace

▶️ ¿Inteligencia Artificial para ligar? Parece que sí, Roast.dating promete potenciar tus cualidades para conseguir mejores resultados en las aplicaciones de citas. Enlace

Get Swiped Right! Tinder, Bumble, Hinge Dating Tips - ROAST

Your end-to-end solution to build an attractive profile, get matches, convert them into dates, and find the one! Online dating has never been that simple.

https://roast.dating/

▶️ Hazte viejo de golpe gracias a esta app. Enlace

Extrapolate - Transform your face with Artificial Intelligence

Extrapolate is an app for you to see how well you age by transforming your face with Artificial Intelligence. 100% free and privacy friendly.

https://extrapolate.app/

▶️ Te aconseja qué cocinar basándose en tus ingredientes disponibles y una pizca de IA. Enlace

▶️ Repositorio con el panorama actual de las herramientas y aplicaciones de inteligencia artificial generativa. Enlace

▶️ No habrá robots abogados, al menos, por ahora. Si recuerdas, en anteriores ediciones contaba que iba a darse un juicio en el que el abogado defensor iba a ser una IA que se comunicara con el acusado por un audífono en la corte.

Pues bien, han debido de ejercer muchas presiones porque el CEO de la compañía DoNotPay ha anunciado que se aplaza. Enlace

Good morning! Bad news: after receiving threats from State Bar prosecutors, it seems likely they will put me in jail for 6 months if I follow through with bringing a robot lawyer into a physical courtroom. DoNotPay is postponing our court case and sticking to consumer rights:
— Joshua Browder (@jbrowder1)
3:11 PM • Jan 25, 2023

▶️ BuzzFeed anuncia que usará ChtrGPT para ayudar a crear contenido y sus acciones se disparan. Recordemos cómo acabaron los anteriores intentos como el de CNET (mal). Enlace

🚨Breaking ChatGPT news:
BuzzFeed announces it will use ChatGPT creator OpenAI to help create content.
@BuzzFeed stock, $BZFD rallies 177% on announcement
— Rowan Cheung (@rowancheung)
8:15 PM • Jan 26, 2023

▶️ Agente de viajes por IA. ¿Quién se atreve a comprobar si hace bien su función? Enlace

▶️ Msanii es un nuevo modelo de generación de música mediante espectogramas. Con demo usable. Enlace

▶️ RunwayML fue usado en la película recientemente nominada a no sé cuántos Oscar Everything, everywhere all at once (si no la has visto te la recomiendo). Honestamente, pensé que estas herramientas tardarían más en incorporarse a grandes producciones. Enlace

How director and editor Evan Halleck uses Runway for films, music videos, and commercials

Learn how some of the best professionals use Runway.

https://runwayml.com/customers/how-director-and-editor-evan-halleck-uses-runway-for-films-music-videos-and-commercials/

🎓 Formación y tutoriales

▶️ Reemplazar ropa en un vídeo con Instruct Pix2Pix y Ebsynth. Enlace

r/StableDiffusion - Replacing clothes using AI in video. InstructPix2Pix + EbSynth

149 votes and 12 comments so far on Reddit

https://www.reddit.com/r/StableDiffusion/comments/10jrafq/replacing_clothes_using_ai_in_video/

▶️ Repositorio de recursos sobre machine learning, estructura de datos, estadísticas y más de la mano de Merve. Enlace

▶️ Proceso creativo de Stelfie, el viajero del tiempo. Si no lo ubicas, entrenó un modelo para generar imágenes de sí mismo en momentos cumbre de la historia. Enlace

▶️ Cambiar la expresión facial de tus personajes manteniendo sus rasgos. Enlace

📜 Papers, please.

▶️ En principio es imposible incorporar conceptos nuevos en los grandes modelos de lenguaje, pero parece que en Microsoft han dado con un método para hacerlo. Enlace

▶️ Método para explorar espacios complejos de Meta. Enlace

▶️ Representación 3d de imágenes dinámicas (vídeos, vaya). Enlace

▶️ RecolorNeRF. O cómo editar los colores de una captura NeRF de forma eficiente. ¿He dicho ya que esta tecnología es mi perdición? Enlace

RecolorNeRF

Abstract

https://sites.google.com/view/recolornerf

▶️ Meta asegura que con Data2vec 2.0 se pueden entrenar modelos de texto, audio e imágen hasta 16 veces mas rápido. Enlace

▶️ Triaje de pacientes con dolor de pecho mediante IA. Enlace

▶️ BallGAN. O cómo representar en 3D imágenes 2D. Enlace

▶️ StyleGAN-T como alternativa a los modelos de difusión de generación de imágenes. Porque sí amigos, había vida antes de los modelos actuales y usaban GAN en su mayoría. Enlace

🍅 Salseo

▶️ ChatGPT no puede aparecer como autor en publicaciones. Springer Nature, responsable de la gran mayoría de publicaciones académicas, dice que no tiene problema en que se use la IA mientras se deje claro en qué partes del proceso se usaron, pero no son autores de las obras. Enlace

ChatGPT can’t be credited as an author, says world’s largest academic publisher

But using AI to help write a paper is fine, with proper disclosure.

https://www.theverge.com/2023/1/26/23570967/chatgpt-author-scientific-papers-springer-nature-ban

▶️ Yann LeCun, jefe de IA de Meta, dice que ChatGPT en realidad no supone nada tan impresionante.

Algunas de las respuestas son muy interesantes, dando argumentos en uno u otro sentido. Enlace

Desenlace

Pues resulta que Trey Parker y Matt Stone, creadores de South Park han decidido invertir parte de su recompensa por la renovación de su icónica serie en Deep Voodoo, una empresa cuyo objetivo es juntar a los mejores talentos a nivel global sobre deepfakes. Enlace

Y por el momento, viendo el vídeo de Kendrick Lamar y otros ejemplos que aparecen en su web, están en muy buen camino. Enlace

Como siempre, muchísimas gracias por leer esta newsletter. ¿Qué te ha parecido?

Si tienes cualquier sugerencia o comentario, por favor, házmelo llegar (estoy por aquí en Twitter) y lo tendré en cuenta para futuras ediciones.

Y si crees que le puede interesar a alguien, aquí tienes la forma de compartirla.

También puedes copiar y compartir directamente este enlace

https://wai-newsletter.beehiiv.com/subscribe

¡Saludos!