- W.A.I.
- Posts
- W.A.I. #55
W.A.I. #55
Google saca la artillería, OpenAI revoluciona el vídeo con IA y ¿podremos trabajar en sueños?
Bienvenida/o a otra edición de WAI.
Probablemente esta haya sido una de las semanas más movidas en Inteligencia Artificial desde que se inició esta reciente revolución.
Y con la que ha caído ya te puedes hacer una idea de lo que tienes por delante: edición de las gordas, de las que hay que dar a “Lee online” arriba a la derecha si no quieres perderte nada.
He intentado seguir manteniendo la variedad y no centrarme sólo en los grandes anuncios, creo que es más interesante así. Si prefieres que haya menos variedad y más profundidad, escríbeme y cambio el enfoque en siguientes ediciones.
Dicho lo cual, no te entretengo más, a disfrutar de las novedades.
Empezamos.
Contenidos de hoy
🗻 TOP - Si solo tienes 2 minutos, esta es tu sección.
▶️ OpenAI anunció, a las pocas horas de la noticia de Gemini 1.5, Sora, su primer modelo de vídeo. Y es impresionante, dejo dos enlaces para profundizar:
▶️ Reddit ha llegado a un acuerdo con una compañía para ceder sus datos para entrenar modelos. Serán 60 millones por año y aún no se ha desvelado qué empresa es la elegida.
🐔 Tuit de la semana
▶️ Es de la semana pasada pero se la vi publicada a Carlos Santana y me pareció una reflexión para pensar: ¿qué habría pasado si Google no hubiera compartido el invento de la tecnología transformers?
🏆️ Imagen de la semana
▶️ Brillante como siempre Tom Fishburne sobre el futuro de la búsqueda web con IA.
🛠️ La Cacharrería (si eres de probar las cosas, estás en el lugar adecuado)
🖼️ Imágenes
▶️ Ya hay implementación oficial de InstantID para ComfyUI. Recordemos que sirve para generar personajes consistentes con tan sólo una imagen de referencia.
▶️ La aplicación Draw Things se vuelve a actualizar y añade más mejoras. Si no la conoces es una de las vías más sencillas para empezar a usar Stable Diffusion.
▶️ ¿Tienes una imagen y quieres crear variaciones de forma rápida y gratis? En este espacio de Hugging Face tienes la solución.
✏️ Texto
▶️ Sam Altman dijo esta semana que GPT-5 iba a ser más listo en todo. Después de Sora las expectativas son aún más altas.
🎥 Vídeo
▶️ Boximator de TikTok permite controlar la generación de vídeos a partir de imágenes usando “cajas”. Los ejemplos son muy ilustrativos.
▶️ Maravilloso uso del entrenamiento de modelos de imagen para crear animaciones estilo stop-motion. Recomiendo horrores ver el vídeo.
🧱 Diseño 3D
▶️ GES es un nuevo método más efectivo que Gaussian Splatting para visualizar 3D. Y Camenduru ya tiene montado un Colab para probarlo.
▶️ Holo-Gen de Unity es un método para crear texturas PBR para objetos 3D. Y hay demo para probarlo.
▶️ Meta presenta IM-3D, modelo capaz de generar varias vistas de un objeto y luego trasladarlo a 3D.
▶️ Me ha gustado mucho esta charla en el canal de Esperando el render entre dos profesionales consagrados en la industria hablando de todo un poco y de su visión sobre la IA.
📻️ Todo lo demás
▶️ Navi es una aplicación súper útil aplicación para las Vision Pro de Apple que permite traducir voz en tiempo real. Merece mucho la pena ver el vídeo.
🎓️ Formación y tutoriales
🍅 Salseo
Despedida
Como siempre, muchísimas gracias por leer esta newsletter. ¿Qué te ha parecido?
Si tienes cualquier sugerencia o comentario, por favor, házmelo llegar (estoy por aquí en Twitter) y lo tendré en cuenta para futuras ediciones.
Y si crees que le puede interesar a alguien, aquí tienes la forma de compartirla.
También puedes copiar y compartir directamente este enlace
¡Saludos!