- W.A.I.
- Posts
- W.A.I. #19
W.A.I. #19
Robots futbolistas y pizzas con IA
Bienvenido/a a otra edición de WAI, llegamos a la 19.
Uno diría que llevamos unas semanas más o menos tranquilas, porque no ha habido bombazos, pero si te paras a repasar todo lo que aparece en esta newsletter, verás que de tranquilidad nada.
¡Y eso que, como siempre, se quedan casi la mitad de las historias fuera por falta de espacio!
Algún día tendré tiempo y haré la cara B de esta newsletter, con noticias más underground. Hasta entonces, espero que disfrutes de lo variada que es la edición de hoy.
Está feo que lo diga yo, pero creo que ha quedado muy redonda :).
Empezamos.
🗻 TOP
▶️ Track Anything. Modelo que permite segmentar en vídeos con múltiples funciones como, por ejemplo, cambios de plano. Recomiendo ver los ejemplos del vídeo, las posibilidades son muchas.
▶️ Esta investigación predice modelos de texto con 1 millón de tokens de contexto.
▶️ Stability por fin libera su nuevo modelo, DeepFloyd, capaz de, entre otras cosas, generar texto. Más abajo tienes un Colab para probarlo.
▶️ Algunos usuarios comienzan a tener una versión de ChatGPT 3.5 con acceso a navegador web.
▶️ Parece que habrá un asistente para salud de Apple con IA.
▶️ Después de la polémica con la canción hecha con IA de Drake y The Weekend, la artista Grimes dice que ella repartirá al 50% los royalties de generaciones de este tipo, abriendo un melón importante.
▶️ Esto es lo que ha avanzado la IA en generación de imágenes en apenas un año. Difícil de imaginar lo que habrá en 2024.
🔍️ El caso
Hoy me gustaría hablar brevemente de lo que, según mi opinión, se nos viene encima en el tema salud e inteligencia artificial.
Soy especialmente crítico con la implementación de la IA a toda prisa en ámbitos que afectan de manera tan directa a la vida de las personas. Sin embargo, siguen saliendo estudios que parecen apuntar la gran utilidad de esta tecnología en este campo.
El propio presidente de OpenAI se hacía eco este semana de la siguiente noticia.
Así que supongo que más pronto que tarde estará integrado en nuestro día a día algún tipo de sistema con Inteligencia Artificial en lo relativo a las consultas médicas.
Esperemos que salga mejor que eso de preguntarle a Google por nuestros síntomas.
🐔 Tuit de la semana
Coders make better code with AI than non-coders.
Artists make better art with AI than non-artists.
Writers make better writing with AI than non-writers.AI augments skill, but with a skilled collaborator, the ceiling for human potential is way higher than we can imagine yet
— Claire Silver 🌸 (@ClaireSilver12)
2:56 AM • Apr 20, 2023
🏆 Imagen de la semana
Una semana más, cambio imagen por vídeo, pero es que la explosión de este medio está siendo tremenda. Para muestra el ejemplo de este tuit.
"A Few Good Women" - done with TemporalKit
#stablediffusion#TemporalKit#AIArtworks #AIArtwork— CiaraRowles (@CiaraRowles1)
9:10 PM • Apr 21, 2023
Creada por CiaraRowles con TemporalKit
🖼️ Imágenes
▶️ Edge of Realism. Nuevo modelo de generación de imágenes entrenado para el extremo realismo.
▶️ Ya está disponible el upscaler de Stability vía API.
▶️ En Midjourney aprietan el turbo. Quieren lograr sacar Versiones cada 30 días.
▶️ Investigadores de Google descubren como mejorar el rendimiento en móviles de modelos de difusión.
▶️ El artista que ganó en el Sony World Photography Award con una imagen generada con IA habla de, exacto, la IA.
▶️ Microsoft anuncia que Designer ya está disponible para todo el mundo. Recuerda que es su intento de robar mercado a Photoshop.
▶️ Dall-E en la portada de Vogue Italia. No quiero pensar cuánto dinero habrá soltado OpenAI, porque no es la elección obvia ni mucho menos ahora mismo para generación de imágenes.
🎥 Vídeo
▶️ El mejor peor anuncio de pizza de la historia hecho con IA. Por favor, tienes que verlo, no tiene desperdicio.
Plus Badant que cette IA qui crée une pub pour de la Pizza ça va être compliqué je crois.
Source : r/oddlyterrifying— AVA MIND || 🥡 (@avamind_)
3:32 PM • Apr 26, 2023
▶️ Runway anuncia su app para ios con la que podrás usar GEN-1.
▶️ Y Runway también anunció que ahora GEN-1 permite una duración de hasta 15 segundos. Los créditos van a volar.
▶️ Woxo. Crea vídeos con ChatGPT.
▶️ Total Recon. Crea nuevos puntos de vista de una secuencia de vídeo. Magia negra.
¿Te está gustando esta edición?
✏️ Texto
▶️ Pietro Schirano se cansó de esperar al multi-modal de ChatGPT y se lo creó él mismo con plugins.
▶️ Stability anunció esta semana StableVicuna, según ellos, el primer competidor open source de ChatGPT.
🧱 Diseño / 3D
▶️ Creación de assets con IA generativa.
▶️ Houdini y Stable Diffusion trabajando juntos. De aquí pueden salir cosas muy interesantes.
▶️ Anuncio de 3DFY, herramienta de text to 3D que acaba de abrir su plataforma a los primeros usuarios.
▶️ Deemos promete un flujo de trabajo para crear avatares 3D a partir de imágenes.
▶️ HOSNeRF: Dynamic Human-Object-Scene Neural Radiance Fields. O lo que es lo mismo, NeRFs de escenas de vídeo. La demo es impresionante.
📻 Todo lo demás
We integrated ChatGPT with our robots.
We had a ton of fun building this!
Read on for the details:
— Santiago (@svpino)
12:01 PM • Apr 25, 2023
▶️ ChatJAm crea listas de reproducción de Spotify basadas en un prompt.
▶️ Binance anuncia Sensei, un asistente virtual basado en IA.
▶️ AudioGPT. Modelo que entiende y genera audio, incuyendo texto, ruidos y sonido.
▶️ Usan el modelo de segmentación SAM de Meta para encontrar a Wally
Did you know you can teach #GPT3 to find Waldo? 🕵️
𝚐𝚛𝚊𝚍𝚒𝚘-𝚝𝚘𝚘𝚕𝚜 version 0.0.7 is out, with support for @MetaAI 's #segmentanything model (SAM)
Ask #GPT3 to find a man wearing red and white stripes and Waldo will appear!
𝚙𝚒𝚙 𝚒𝚗𝚜𝚝𝚊𝚕𝚕 𝚐𝚛𝚊𝚍𝚒𝚘-𝚝𝚘𝚘𝚕𝚜
— Freddy A Boulton (@freddy_alfonso_)
4:15 PM • Apr 28, 2023
🎓 Formación y tutoriales
▶️ Cómo instalar y usar babyAGI, uno de los agentes autónomos pioneros.
▶️ Tutorial de cómo utilizar TemporalKit de CiaraRowles, para crear vídeos consistentes con Stable Diffusion.
▶️ Y por si uno fuera poco, otro tutorial de TemporalKit
📜 Papers, please.
▶️ Ray Conditioning. Cambia el ángulo o punto de vista de fotografías de retratos.
▶️ DiFaReli. Reilumina fotografías e incluso vídeos.
▶️ Investigación que propone inducir ansiedad a los modelos de lenguaje para estudiar sus sesgos.
▶️ TextMesh. Generación de 3D a partir de textos.
Google's DeepMind has taught robots to play soccer.
— Citizen Free Press (@CitizenFreePres)
10:07 PM • Apr 28, 2023
🍅 Salseo
Despedida
Una semana más, muchísimas gracias por leer esta newsletter. ¿Qué te ha parecido?
Si tienes cualquier sugerencia o comentario, por favor, házmelo llegar (estoy por aquí en Twitter) y lo tendré en cuenta para futuras ediciones.
Y si crees que le puede interesar a alguien, aquí tienes la forma de compartirla.
También puedes copiar y compartir directamente este enlace
¡Saludos!