W.A.I. #20

La calma antes de la tempestad

Bienvenida/o a otra edición de WAI. Acabamos de llegar a la número 20, así que estoy muy contento. Uno de mis principales miedos era si sería capaz de mantener la constancia en las publicaciones y míranos, en mayo y funcionando a toda máquina.

Esta semana, la sensación personal que tengo es que es la antesala de grandes movimientos por parte de Google y OpenAI. Se empiezan a escuchar rumores en muchos sentidos y sería raro que esta fuera la primera vez que dichos rumores acaban siendo un farol.

A título individual pediría que liberasen los plugins, el modelo con acceso a internet y Code Interpreter por un lado y que den acceso a Bard a otras regiones y cuenten de primera mano de qué se trata el proyecto MAGI por el otro.

En una semana vemos si mi lista de Papá Noel se ha cumplido o no.

No te entretengo más, adelante, coge un café y a ponerse al día. Empezamos.

🔍️ El caso

Muy brevemente me gustaría hablar de dos estudios publicados esta semana. Ambos relacionados con la habilidad de interpretar las señales cerebrales.

El primero sería capaz de transformar dicha actividad en texto. Aquí puedes bucear en la investigación llevada a cabo por la Universidad de Texas.

Por otro lado, el segundo estudio, es capaz de decodificar las señales para identificar y reproducir vídeos a partir de la actividad cerebral. Aquí tienes el artículo original.

🗻 TOP - Si solo tienes 2 minutos, esta es tu sección.

▶️ Midjourney anuncia su nueva actualización, la 5.1, con 2 versiones, una más estilizada y otra mas “cruda”.

▶️ OpenAI deja ver su nuevo modelo Code Interprer, capaz de interpretar datos, analizarlos y realizar increíbles tareas con ellos. Aquí algunos ejemplos.

▶️ Bing anuncia su siguiente gran actualización, con la habilidad de generar y entender texto y video, plugins, etc.

▶️ Supuesta filtración de un documento de Google donde, entre otras cosas, viene a decir que ni ellos ni OpenAI tienen un plan para protegerse de los modelos open source. Juan “Seostratega” hace un análisis muy interesante al respecto.

▶️ StarCode aspira a ser la competencia directa de Copilot en versión open source.

▶️ Microsoft y AMD unen fuerzas para intentar robar un trozo de pastel en la creación de GPUs a Nvidia.

▶️ Esta reportera generó un clon virtual, replicando su imagen y voz, e intento ver cuántas tareas podía su doble hacer por ella.

 🐔 Tuit de la semana

▶️ Biden se reúne con los principales responsables de las empresas de IA en la Casa Blanca.

🏆️ Imagen de la semana

🖼️ Imágenes

▶️ Actualizaciones en Automatic1111, la interfaz más popular para Stable Diffusion.

▶️ Uso del modelo P2P Model transformar vídeos a este nivel.

✏️ Texto

▶️ ExplainPaper es una herramienta que te ayuda a entender publicaciones científicas.

▶️ BabyAGI ahora tiene interfaz. Recuerda que es uno de loa Agentes Autónomos más famosos.

▶️ Otter, modelo multimodal que entiende texto, imagen y vídeo. Demo.

▶️ Nuevo modelo open source publicado, MPT-7B, entrenado por Mosaic y con capacidad de hasta 64k tokens de contexto.

▶️ Samsung prohíbe a sus empleados el uso de ChatGPT por una filtración interna en abril.

🧱 Diseño / 3D

▶️ 3Dpresso es una posible alternativa a Lumalabs, que genera modelos 3D a partir de vídeos de 1 minuto y, además, luego puedes cambiarles las texturas.

▶️ Artículo a manos de un desarrollador de videojuegos sobre el uso de los skyboxes generados con IA de Blockade Labs.

▶️ Shap-E, modelo de generación de modelos 3D a partir de texto de OpenAI. Demo cortesía de Camenduru.

🎥 Vídeo

📻️ Todo lo demás

▶️ Entrevista de Elon Musk con Bill Maher

▶️ Cuando los modelos de lenguaje alucinan. Artículo de New York Times (sin muro de pago ;)) sobre qué sucede cuando los chatbots dan respuestas incorrectas.

▶️ Entrevista a Cristobal Valenzuela, CEO de Runway.

▶️ El modelo de generación de audio Bark, anuncia que puede usarse de manera comercial.

▶️ Khan Academy presenta sus tutores para alumnos y profesores en su academia online.

▶️ Artículo muy interesante que plantea que el futuro de la IA es trabajar en nichos muy concretos, no de forma generalizada.

▶️ Palantir anuncia su modelo de IA. La parte menos positiva es que es un modelo aplicado a estrategia militar.

🎓️ Formación y tutoriales

▶️ Cómo automatizar la generación de imágenes con Midjourney. Ojo cuidado que esto está prohibido en sus términos, así que bajo tu responsabilidad.

▶️ Guía sobre lenguaje cinematográfico en promps de Midjourney para componer mejor tus creaciones.

📜 Papers, please.

▶️ TEXTure es un modelo que texturiza objetos 3d automáticamente.

▶️ TextDeformer. Deforma mayas 3D con instrucciones de texto.

▶️ Sin3DGen. Generación de escenas 3D a partir de un único ejemplo.

🍅 Salseo

▶️ Definición de ir a por lana y volver trasquilado. Este fotógrafo denunció para sacar sus fotografías del Dataset de Laion y de vuelta le llegó una factura de casi 1000$ por hacer una reclamación injustificada.

▶️ A este moderador de Midjourney se le fue la pinza. Por suerte, el CEO aclaró que, efectivamente, se le fue la pinza y mucho.

Despedida

Como siempre, muchísimas gracias por leer esta newsletter. ¿Qué te ha parecido?

Si tienes cualquier sugerencia o comentario, por favor, házmelo llegar (estoy por aquí en Twitter) y lo tendré en cuenta para futuras ediciones.

Y si crees que le puede interesar a alguien, aquí tienes la forma de compartirla.

También puedes copiar y compartir directamente este enlace

¡Saludos!