- W.A.I.
- Posts
- W.A.I. #14
W.A.I. #14
IA hasta en las zapatillas
I.A. hasta en las zapatillas
Bienvenido/a un domingo más a W.A.I., gracias por asomarte a curiosear.
Probablemente estés de resaca del tsunami de noticias de la semana pasada pero no te relajes, que el ritmo sigue implacable y han sido otros 7 días con grandes movimientos en este espacio.
Como digo en el título, a este paso vamos a tener IA, o decir que tenemos IA, hasta en las zapatillas. ¿No te lo crees? Mira este tuit.
Si quieres ver qué más ha sucedido en esta semana, no te quedes en la puerta, pasa dentro. Comenzamos.
📍 ÍNDICE - Echa un vistazo al contenido de hoy
Nvidia se viste gala en su GDC y anuncia su plataforma de IA
OpenAI da puñetazo en la mesa con sus plugins y absorbe gran parte del mercado
Adobe presenta sus herramientas de IA éticas.
Los papers de hoy nos indican que el 3D está a punto de caramelo
Runway revoluciona la creación de vídeo con GEN-2
Google deja probar BARD
Microsoft publica su creador de imágenes y su “Notion”
Unity y Unreal controlados con lenguaje natural
Copilot X de GitHub
Nuevo modelo de Stable Difussion
🔍️ El caso
He cambiado el caso de esta semana a última hora porque me ha llamado mucho la atención el caso que relata @peakcooper en twitter.
Aparte del titular llamativo, que cumple perfectamente con su intención, “GPT4 saved my dog's life” creo que, como la semana pasada, da para pensar un rato. O al menos a mí.
Lo resumo por si te da pereza leer el hilo de twitter. Dice que su perro tuvo un problema de salud y tras llevarlo al veterinario no parecían dar con la solución. Ante el miedo de no encontrar tratamiento, buscó un segundo doctor que revisara el caso y por el camino preguntó a ChatGPT.
ChatGPT, tras ver los análisis y sintomatología, dio con un posible diagnóstico. Este segundo diagnóstico fue consultado con el segundo veterinario y tras nuevas pruebas, resultó ser acertado. Final feliz, ¿no?
A mí me surgen muchas cuestiones. ¿El segundo veterinario habría dado con ese diagnóstico sin la sugerencia de ChatGPT? ¿Qué habría pasado si no hubiera acertado? ¿Hasta qué punto la gente va a empezar a usar GPT en cualquiera de sus formas para auto-diagnóstico como algunos hacen ahora con Google?
Ahí lo dejo. Yo, de momento, no pondría la salud de mi perro en manos de la IA actual.
No tengo una foto de mi perro a mano, así que le he pedido a Bing Chat ayuda.
🗻 TOP - Si solo tienes 2 minutos, esta es tu sección.
▶️ OpenAI vuelve a dar un meneo al panorama con ChatGPT plugins. Una plataforma para expandir el potencial de la herramienta de chat mediante, por ejemplo, servicios para conectarse a internet o mediante su integración con plataformas como Zapier o Wolfram. El potencial es increíble.
▶️ Una de cal y una de arena, porque OpenAI anunció también que un pequeño porcentaje de usuarios habrían visto expuesta su información personal por un bug el pasado lunes
▶️ Runway tenía un anuncio para el lunes y fue nada menos que su modelo de Text to Video, Gen-2.
▶️ Google abre el acceso a Bard. Pero no en España y mediante registro previo. Algunos ya lo han podido probar mediante magia negra (VPN) como Carlos Ortega o Juan González Villa.
▶️ Microsoft anuncia el despliegue de Bing Image Creator, su herrameinta de generación de imágenes. También a través de Bing Chat.
▶️ Adobe presenta su plataforma de creación con IA, Firefly.
Welcome to the world, #AdobeFirefly!
firefly.adobe.comWe have great stuff you can out try right now, plus so much brewing in the lab. Here's a quick preview:
— John Nack (@jnack)
1:36 PM • Mar 21, 2023
▶️ OpenAI publicó un paper con su análisis del impacto de los modelos como ChatGPT en el mundo laboral. Es extenso, pero merece la pena leerlo y formarte tu propia opinión en vez de asumir lo que se publica en redes.
▶️ GitHub presenta Copilot X, versión vitaminada del actual y parece que el compañero ideal para desarrolladores.
▶️ Esta semana fue la GDC de Nvidia y daría para una edición únicamente hablando de todo lo que se presentó. De momento nos quedaremos con el anuncio de Nvidia AI Foundations, servicio más enfocado en empresas para el uso de IA en modelos de texto, imagen, vídeo y hasta 3D.
I can finally discuss something extremely exciting publicly. Jensen just announced NVIDIA AI Foundations:
- Foundation Model as a Service is coming to enterprise, customized for your proprietary data.
- Multimodal from day 1: text LLM is just one part. Bring your images, videos,… twitter.com/i/web/status/1…— Jim Fan (@DrJimFan)
4:10 PM • Mar 21, 2023
▶️ Instruct NeRF2NeRF. Edita archivos NeRF mediante lenguaje natural.
NeRFとInstructPix2Pixを組みわせる"Instruct-NeRF2NeRF"めちゃイケてるな。
NeRFで生成した3Dモデルをプロンプトで編集できる技術らしい。
これ使ってできることたくさんありそう💡🤔
— 木内翔大|海外AIサービスの最新情報を毎日発信📣 (@shota7180)
8:40 AM • Mar 24, 2023
▶️ Loop es el equivalente a Notion por parte de Microsoft, que sigue presentando proyectos a un ritmo tremendo.
▶️ ModelScope es el primer modelo Text to Video open source. Si no me equivoco es de Alibaba y lo puedes probar aquí vía Google Collab.
▶️ Ya te puedes apuntar a la beta de Unity AI.
🐔 Tuit de la semana
Playing with Stable Diffusion I discovered that it can be used to make realistic images from 3D baby ultrasounds 🤯 #stablediffusion#GenerativeAI#ControlNet#AI
— Sacha Arozarena (@SachaArozarena)
1:24 AM • Mar 21, 2023
🖼️ Imágenes
▶️ TemporalNet. Modelo creado para mantener la coherencia temporal entre los frames de los vídeos generados con Stable Difussion y ControlNet.
▶️ Pequeña guía de cómo crear deepfakes.
▶️ UnCLIP. Modelo para crear variaciones de una imagen usado en ReImagine de Stable Difussion.
▶️ Detalles de la nueva versión de NijiJourney, el modelo enfocado a ilustración, anime y manga.
▶️ Demo de CoAdapter, modelo que transfiere estilo, color y más a tus generaciones mediante texto usando imágenes de partida.
▶️ DS-Fusion, creación de tipografía creativa.
▶️ Luma AR. Integración de NeRFs con realidad aumentada desde tu móvil.
▶️ Ya parece estar disponible en modo beta los nuevos modelos de Stable Difussion, SDXL en DreamStudio.
▶️ Y también está disponible para todos ya GEN-1 de Runway.
🏆️ Imagen de la semana
Creada por Óscar Bartolomé con Midjourney. Enlace
✏️ Texto
▶️ La revista Wired va a usar IA y explica en este artículo para qué y cuáles son sus límites.
▶️ Ammaar Reshi creó un juego complejo, en 3D gracias a GPT-4, Replit, MidJourney y Claude, partiendo sin idea alguna sobre cómo hacerlo.
▶️ Google Bard raramente hace citaciones o referencias a los autores de las webs de dónde extrae la información.
▶️ Más pruebas con Bard. En este caso se le “pilla” plagiando un artículo en su respuesta y se disculpa. Luego lo vuelve a hacer.
▶️ Plataforma para comparar diferentes modelos de lenguaje. Vía Olga Ortega.
▶️ Artículo que resume un poco el sentir general. Bard está por detrás de GPT-4 y Claude.
🧱 Diseño / 3D
▶️ A principios de semana teníamos esta prueba de concepto para usar Unity con ChatGPT.
▶️ UnrealGPT. Si Unity tenía su control mediante lenguaje natural, poco iba a tardar en aparecer los mismo para Unreal.
▶️ Roblox ya tiene creación de materiales mediante IA. El primero de muchos pasos hacia la creación de videojuegos y mundos asistidos.
▶️ No es nuevo ni es puramente IA, pero al hilo de los avances en el campo del 3D mucha gente se quejaba y pedía algo para crear UVs automáticamente. Pues echadle un ojo a Rizomuv.
▶️ MetaHuman de Unreal para animación en real-time.
▶️ GetFloorPlan. Levanta modelos 3D y hasta tours 360º a partir de planos 2D.
🧠 Productividad
▶️ Otter.AI te ayuda a tomar notas y resumir tus reuniones o clases.
▶️ Targum Video. Traduce cualquier vídeo a cualquier idioma en segundos.
📻️ Todo lo demás
▶️ Paper sobre las capacidades de GPT-4 para afrontar problemas médicos.
▶️ Reconocimiento de la comida en comedores de China mediante IA.
Reconocimiento de alimentos en comedores chinos 🇨🇳 Este restaurante está en Hangzhou. Se factura en función de lo que se escanea ¿Qué ves además de la identificación de producto?
— MΛRC VIDΛL (@marcvidal)
11:00 AM • Mar 23, 2023
▶️ Al hilo del caso que expongo esta semana, este artículo que encontré a última hora. Un médico de urgencias cuenta qué habría pasado si se hubiera fiado de ChatGPT para el diagnóstico. Spoiler: nada bueno.
▶️ Esta semana salió a la luz una noticia falsa sobre la detención de Donald Trump con imágenes generadas con IA.
▶️ Upheal. Plataforma para asistirte mediante IA en tus sesiones de terapia. Yo sigo sin ver claro todo esto en temas de salud hasta que haya más base y estudios.
🎓️ Formación y tutoriales
▶️ Cómo hacer fotografía estroboscópica con Midjourney
Introducing Stroboscopic Photography 📸 using #midjourney
Full info, prompts and examples ✍️
— Armando Sotoca (@Skeku)
10:33 PM • Mar 22, 2023
📜 Papers, please. Asómate al futuro.
▶️ Text2Tex. Texturizado de modelos 3D mediante modelos de difusión.
▶️ Text2Room. Creación de estancias 3D mediante texto.
▶️ RaBit. Modelado paramétrico de bípedos tipo cartoon.
▶️ Según este paper, un tercio del dataset de Laion 2B serían duplicados.
▶️ DreamBooth 3D. Creación de modelos 3D a partir de fotos y modificación posterior mediante texto.
▶️ Zero-1-to-3. Creación de modelos 3D a partir de una única foto. Incluye demo y es muy entretenido ver cómo calcula diferentes vistas sin información previa.
🍅 Salseo
▶️ La historia menos conocida de OpenAI, Sam Altman y Elon Musk y el por qué no se llevan especialmente bien.
Despedida
Como siempre, muchísimas gracias por leer esta newsletter. ¿Qué te ha parecido?
Si tienes cualquier sugerencia o comentario, por favor, házmelo llegar (estoy por aquí en Twitter) y lo tendré en cuenta para futuras ediciones.
Y si crees que le puede interesar a alguien, aquí tienes la forma de compartirla.
También puedes copiar y compartir directamente este enlace
¡Saludos!