W.A.I.
Posts
W.A.I. #20

W.A.I. #20

La calma antes de la tempestad

David Garrido
7 de mayo de 2023

Bienvenida/o a otra edición de WAI. Acabamos de llegar a la número 20, así que estoy muy contento. Uno de mis principales miedos era si sería capaz de mantener la constancia en las publicaciones y míranos, en mayo y funcionando a toda máquina.

Esta semana, la sensación personal que tengo es que es la antesala de grandes movimientos por parte de Google y OpenAI. Se empiezan a escuchar rumores en muchos sentidos y sería raro que esta fuera la primera vez que dichos rumores acaban siendo un farol.

A título individual pediría que liberasen los plugins, el modelo con acceso a internet y Code Interpreter por un lado y que den acceso a Bard a otras regiones y cuenten de primera mano de qué se trata el proyecto MAGI por el otro.

En una semana vemos si mi lista de Papá Noel se ha cumplido o no.

No te entretengo más, adelante, coge un café y a ponerse al día. Empezamos.

🔍️ El caso

Muy brevemente me gustaría hablar de dos estudios publicados esta semana. Ambos relacionados con la habilidad de interpretar las señales cerebrales.

El primero sería capaz de transformar dicha actividad en texto. Aquí puedes bucear en la investigación llevada a cabo por la Universidad de Texas.

Por otro lado, el segundo estudio, es capaz de decodificar las señales para identificar y reproducir vídeos a partir de la actividad cerebral. Aquí tienes el artículo original.

🗻 TOP - Si solo tienes 2 minutos, esta es tu sección.

▶️ Midjourney anuncia su nueva actualización, la 5.1, con 2 versiones, una más estilizada y otra mas “cruda”.

▶️ Hay nuevo Chatbot en la ciudad, su nombre es Pi y tiene voz.

▶️ OpenAI deja ver su nuevo modelo Code Interprer, capaz de interpretar datos, analizarlos y realizar increíbles tareas con ellos. Aquí algunos ejemplos.

▶️ El padrino de la IA abandona Google.

▶️ Bing anuncia su siguiente gran actualización, con la habilidad de generar y entender texto y video, plugins, etc.

▶️ Supuesta filtración de un documento de Google donde, entre otras cosas, viene a decir que ni ellos ni OpenAI tienen un plan para protegerse de los modelos open source. Juan “Seostratega” hace un análisis muy interesante al respecto.

▶️ StarCode aspira a ser la competencia directa de Copilot en versión open source.

▶️ Microsoft y AMD unen fuerzas para intentar robar un trozo de pastel en la creación de GPUs a Nvidia.

▶️ La Casa Blanca anuncia acciones y acuerdos para avanzar con la IA y proteger la seguridad de los usuarios.

▶️ Esta reportera generó un clon virtual, replicando su imagen y voz, e intento ver cuántas tareas podía su doble hacer por ella.

🐔 Tuit de la semana

▶️ Biden se reúne con los principales responsables de las empresas de IA en la Casa Blanca.

Artificial Intelligence is one of the most powerful tools of our time, but to seize its opportunities, we must first mitigate its risks.

Today, I dropped by a meeting with AI leaders to touch on the importance of innovating responsibly and protecting people's rights and safety.
— President Biden (@POTUS)
9:32 PM • May 4, 2023

🏆️ Imagen de la semana

🖼️ Imágenes

▶️ Consejos y trucos de National Geographic para diferenciar imágenes reales de imágenes generadas con IA.

▶️ Asistente con lenguaje natural para photoshop.

▶️ ¿Qué le está haciendo la IA al arte?

▶️ Vídeo explicando las novedades, y no son pocas, del nuevo ControlNet 1.1.

▶️ Actualizaciones en Automatic1111, la interfaz más popular para Stable Diffusion.

▶️ ControlNet llega a ScenarioGG.

▶️ Uso del modelo P2P Model transformar vídeos a este nivel.

P2P Model (sd15_ip2p) "Make her a reptile." These are the first tests that I do with this model to make drastic changes (perhaps a lora can help), the interesting thing is that the background does not change, only the subject, I did not mask or green screen of any kind.
— Mrboofy (@Mrboofyy)
10:07 PM • May 3, 2023

✏️ Texto

▶️ ExplainPaper es una herramienta que te ayuda a entender publicaciones científicas.

▶️ Replit anuncia su modelo de texto especializado en completar código.

▶️ BabyAGI ahora tiene interfaz. Recuerda que es uno de loa Agentes Autónomos más famosos.

▶️ Modelo que puede traducir en segundos lo que dices con tu propia voz y acento.

google translate but with a clone of my voice 💌
this website uses gpt-4 to accurately translate anything into spanish, and say it back like you would with an accent!
check out the demo & github 👇 http
— Aleem Rehmtulla (@aleemrehmtulla)
12:18 PM • May 1, 2023

▶️ Otter, modelo multimodal que entiende texto, imagen y vídeo. Demo.

▶️ Se rumorea que Bard estaría en la pantalla de inicio de los próximos móviles Android.

▶️ Nuevo modelo open source publicado, MPT-7B, entrenado por Mosaic y con capacidad de hasta 64k tokens de contexto.

▶️ Samsung prohíbe a sus empleados el uso de ChatGPT por una filtración interna en abril.

🧱 Diseño / 3D

▶️ 3Dpresso es una posible alternativa a Lumalabs, que genera modelos 3D a partir de vídeos de 1 minuto y, además, luego puedes cambiarles las texturas.

▶️ Ejemplo de integración de LumaLabs con Unreal 5.

▶️ Artículo a manos de un desarrollador de videojuegos sobre el uso de los skyboxes generados con IA de Blockade Labs.

▶️ Usando agentes autónomos para crear niveles de un rpg.

▶️ Shap-E, modelo de generación de modelos 3D a partir de texto de OpenAI. Demo cortesía de Camenduru.

▶️ Le pide a GPT-4 que genera objetos sencillos en 3D.

Asked GPT-4 to design 25 tiny 3D-printable objects that are painful to step on, so I can scatter them by the door to keep monsters away. 🚪👾 #GPT4#3DPrinting
— Kristian Muri Knausgård (@knausgard)
1:05 PM • Mar 17, 2023

🎥 Vídeo

▶️ Listado de compañías trabajando en video con IA.

📻️ Todo lo demás

▶️ Entrevista de Elon Musk con Bill Maher

Interview with @billmaher
— Elon Musk (@elonmusk)
1:37 AM • May 1, 2023

▶️ Cuando los modelos de lenguaje alucinan. Artículo de New York Times (sin muro de pago ;)) sobre qué sucede cuando los chatbots dan respuestas incorrectas.

▶️ Entrevista a Cristobal Valenzuela, CEO de Runway.

▶️ El modelo de generación de audio Bark, anuncia que puede usarse de manera comercial.

▶️ Khan Academy presenta sus tutores para alumnos y profesores en su academia online.

▶️ Demis Hassabis, CEO de Deepmind, en el programa 60 minutos.

▶️ Artículo muy interesante que plantea que el futuro de la IA es trabajar en nichos muy concretos, no de forma generalizada.

▶️ Palantir anuncia su modelo de IA. La parte menos positiva es que es un modelo aplicado a estrategia militar.

▶️ Artículo que nos pone en alerta ante la aparición como setas de influencers de la IA.

▶️ Por suerte cada vez aparecen más noticias de este estilo. Un IA ayuda a incrementar la detección de cáncer.

▶️ Entrevista sobre creatividad e IA con Bilawal Sidhu

🎓️ Formación y tutoriales

▶️ Cómo automatizar la generación de imágenes con Midjourney. Ojo cuidado que esto está prohibido en sus términos, así que bajo tu responsabilidad.

▶️ Listado con las “estéticas” que tiene Midjourney en su base de datos.

▶️ Promp para Midjourney muy curioso y con unos resultados asombrosos aplicando fórmulas matemáticas.

▶️ Guía sobre lenguaje cinematográfico en promps de Midjourney para componer mejor tus creaciones.

▶️ Tutorial sobre colorización de imágenes.

▶️ Guía de creación de imágenes con estilo anime con Midjourney.

📜 Papers, please.

▶️ TEXTure es un modelo que texturiza objetos 3d automáticamente.

▶️ TextDeformer. Deforma mayas 3D con instrucciones de texto.

▶️ Sin3DGen. Generación de escenas 3D a partir de un único ejemplo.

🍅 Salseo

▶️ Definición de ir a por lana y volver trasquilado. Este fotógrafo denunció para sacar sus fotografías del Dataset de Laion y de vuelta le llegó una factura de casi 1000$ por hacer una reclamación injustificada.

▶️ A este moderador de Midjourney se le fue la pinza. Por suerte, el CEO aclaró que, efectivamente, se le fue la pinza y mucho.

Despedida

Como siempre, muchísimas gracias por leer esta newsletter. ¿Qué te ha parecido?

Si tienes cualquier sugerencia o comentario, por favor, házmelo llegar (estoy por aquí en Twitter) y lo tendré en cuenta para futuras ediciones.

Y si crees que le puede interesar a alguien, aquí tienes la forma de compartirla.

También puedes copiar y compartir directamente este enlace

https://wai-newsletter.beehiiv.com/subscribe

¡Saludos!