Pasada rápida antes de entrar en materia. Google DeepMind lanzó un copiloto matemático de IA basado en Gemini 3.1 Pro que acaba de marcar un récord en FrontierMath Tier 4, y de hecho ayudó a un humano a resolver un problema abierto de hace 60 años. OpenAI contraatacó el Mythos de Anthropic con GPT-5.5-Cyber, un modelo de ciberdefensa solo para el lado defensor, con acceso restringido y verificado. Bitcoin ronda los 80.000 dólares con una cuña ascendente y los traders haciéndose oír en redes sociales, y eso suele acabar de una sola manera. La dificultad de la red cayó un 2,3% el 1 de mayo, el sexto recorte del año, y siete grandes pools de minería, incluidos Foundry, Antpool y F2Pool, se sumaron al grupo de trabajo de Stratum V2. Y en Europa, Adam Back firmó otro cheque para Capital B y logró reprecificar a su favor los términos de su convertible. Vamos allá.
La cifra de portada es 47,9% en FrontierMath Tier 4. Es el nivel más difícil de un benchmark diseñado para romper modelos frontera, y el nuevo co‑matemático de DeepMind resolvió 23 de 48 problemas, incluidos 3 que ningún modelo previo había logrado. GPT‑5.5 Pro tenía el récord anterior, con 39,6%. Epoch AI corrió la prueba a ciegas, con hasta 48 horas de cómputo por pregunta.
Pero el benchmark no es la historia. La arquitectura lo es. No es un único modelo gigante a fuerza bruta. Es una jerarquía: un coordinador de proyecto delega en coordinadores de flujos de trabajo, que a su vez envían agentes especialistas para búsquedas bibliográficas, ejecución de código, búsqueda de contraejemplos y verificación de pruebas usando Gemini Deep Think. Agentes revisores auditan las demostraciones antes de que salga nada. Básicamente, un pequeño laboratorio de investigación simulado en software.
La prueba de concepto es lo que importa. El topólogo Marc Lackenby usó el sistema para atacar el problema 21.10 del Kourovka Notebook, una cuestión abierta sobre si todo grupo finito tiene lo que se llama una “presentación simplemente finita”. El sistema persiguió prueba y refutación en paralelo. Produjo un borrador, los agentes revisores señalaron una laguna, Lackenby lo encaminó hacia la estrategia correcta y juntos armaron una demostración completa. Una segunda pasada detectó dos errores menores. Resultado final: un problema abierto de 60 años, cerrado.
Las limitaciones son reales. Los revisores pueden converger en razonamientos plausibles pero incorrectos. El equipo describe espirales de muerte donde el sistema revisa sin fin sin avanzar. El acceso está restringido a un pequeño grupo de matemáticos. Pero si lo emparejas con AlphaEvolve, el otro agente de programación de DeepMind que ahora mejora la corrección de errores de ADN en un 30%, eleva la viabilidad de optimización de redes eléctricas del 14% al 88% y propone circuitos cuánticos con un error 10 veces menor en el chip Willow de Google, el panorama es claro. La tesis de investigación basada en agentes empieza a dar victorias duras y verificables en dominios donde no puedes fingir la respuesta. A las matemáticas no les importan las sensaciones.
Mientras DeepMind persigue demostraciones, el resto del ecosistema de agentes se vuelve más práctico y mucho más interesante. Anthropic lanzó esta semana una actualización importante de Claude Managed Agents. Tres cosas destacan. Primero, Dreaming, un proceso programado que revisa sesiones pasadas y memorias, extrae patrones y refina lo que el agente ha aprendido. Piénsalo como el agente consolidando memoria fuera de horario. Segundo, Outcomes, donde defines una rúbrica y un calificador aparte, en su propia ventana de contexto, evalúa si el trabajo cumple el estándar y le dice al agente qué corregir. Sus benchmarks internos muestran subidas de 8 a 10 puntos en tareas difíciles. Tercero, orquestación multiagente, donde un agente líder delega en subagentes que trabajan en paralelo sobre un sistema de archivos compartido. Netflix ya lo usa en producción en su equipo de plataforma.
Por su parte, OpenAI lanzó la Operator API. Acciones web autónomas desde 15 centavos por tarea completada, hasta 100 tareas por minuto, con registros y capturas de pantalla para depuración. Zapier y Notion son integradores tempranos. Y Google está haciendo algo interesante y a la vez un poco incómodo. Cerró discretamente Project Mariner, su agente de navegador basado en visión, porque costaba unas 85 veces más cómputo que los agentes basados en código y texto. Están integrando esas capacidades en Gemini, incluido un nuevo agente para macOS que puede manejar tu Mac, organizar archivos, escanear facturas a Sheets y redactar seguimientos a partir de tus transcripciones de Meet.
El patrón en los tres laboratorios: los agentes de navegador orientados a visión están perdiendo frente a los orientados a código porque la economía por unidad no cuadra. Anthropic y OpenAI apostaron fuerte por el uso estructurado de herramientas y la ejecución de código. Google ahora retrocede hacia el mismo guion. Si estás construyendo con agentes, la lección es apostar por arquitecturas en las que el modelo escribe y ejecuta código en vez de mirar píxeles. Más barato, más rápido, más fiable y más fácil de verificar. La era de mover píxeles fue un desvío breve.
La minería de Bitcoin está en un lugar raro. La dificultad cayó un 2,3% el 1 de mayo, el sexto ajuste a la baja de 2026. En lo que va de año, la dificultad baja un 10,7%, de 148,3 billones a 132,47 billones. El hashrate se deslizó por debajo de 1 zettahash por segundo, entre 899 y 958 exahashes. El próximo ajuste, alrededor del 17 de mayo, podría volver a bajar.
¿Por qué cae el hashrate? Dos razones, ambas estructurales. Primero, los mineros cotizados están en el punto de equilibrio o por debajo. Los costos de producción rondan los 80.000 a 90.000 dólares por moneda, y Bitcoin está ahí mismo, en 80.000. Los mineros públicos vendieron un récord de 32.000 BTC en el primer trimestre, más que en los cuatro trimestres de 2025 combinados. Segundo, la IA y el HPC les están comiendo la tostada en el frente energético. Se han anunciado más de 70.000 millones de dólares en contratos de IA y HPC en el sector minero. TeraWulf es el caso emblemático esta semana: reportó una pérdida trimestral de 427 millones de dólares pero duplicó ingresos de IA, con alquileres de HPC subiendo 117% trimestre a trimestre hasta 21 millones. Están literalmente reasignando infraestructura eléctrica fuera del hashing.
El único punto brillante es el precio del hash, en torno a 38 dólares por petahash al día, con comisiones por bloque subiendo un 12% semana contra semana. Menor dificultad más precio estable igual a márgenes más gordos para quien sigue enchufado.
La historia más interesante es estructural. Siete grandes pools, Antpool, F2Pool, Foundry, Spiderpool, Block Inc., MARA Foundation y DMND, se unieron al Stratum V2 Working Group el 7 de mayo. Stratum V2 permite que los mineros individuales elijan sus propias plantillas de bloque en lugar de aceptar lo que dicte el operador del pool. Cifrado de extremo a extremo, menor ancho de banda, y pruebas de Braiins muestran hasta un 7,4% más de rentabilidad gracias a una entrega de plantillas más rápida y mejor captura de comisiones. Es la noticia más positiva para la descentralización de la minería en años. Si los mineros individuales empiezan de verdad a elegir sus propias plantillas a escala, se frena un vector real de censura y se contrarresta el problema de construir bloques conformes con OFAC. Que Foundry y Antpool estén en la mesa, siendo que minaron el 48% de los bloques de la semana pasada entre ambos, es lo que lo hace creíble.
Adam Back firmó otro cheque, este de 1,1 millones de euros, para Capital B, la empresa de tesorería de Bitcoin cotizada en Europa, antes conocida como The Blockchain Group. La estructura es lo que hace que valga la pena comentarlo, porque es un modelo diferente del manual de Strategy que todos copian.
El acuerdo: Back suscribe 10 millones de warrants sobre acciones a 0,11 € cada uno, ejercitables al mayor entre 0,84 € o lo que Capital B llama mNAV 1.1, que es el 110% del valor en euros de Bitcoin mantenido por acción totalmente diluida. En otras palabras, el precio de ejercicio flota con Bitcoin. Al mismo tiempo, Capital B recortó a la mitad el precio de conversión de los bonos convertibles ya existentes de Back, de 5,17 € a 2,59 €, y eliminó la condición sobre el precio de la acción que antes limitaba la conversión. Los bonos no pagan cupón y pueden redimirse en Bitcoin, euros o acciones.
Back queda ahora alrededor del 9,97% totalmente diluido. Capital B tiene unos 2.943 BTC, aproximadamente 234 millones de dólares.
Lo interesante no es el tamaño, es la métrica explícita: Bitcoin por acción totalmente diluida. Eso es lo que optimizan. Strategy usa el rendimiento en BTC como concepto similar, pero Capital B lo ha codificado en los propios instrumentos. El precio de ejercicio del warrant, el precio de conversión, toda la estructura de capital está denominada contra el Bitcoin mantenido por acción, no contra el precio de la acción. Si eres accionista, no te importa si la acción sube, te importa que suba el número de Bitcoin por acción.
Esta es la segunda ola de diseño de empresas de tesorería. La primera fue simple: recaudar dólares, comprar Bitcoin, ver cómo se expande el múltiplo. Ya vimos lo que pasa cuando eso sale mal esta semana, con Trump Media reportando una pérdida trimestral de 406 millones de dólares, en su mayoría devaluaciones no realizadas de Bitcoin comprado cerca del pico del verano pasado y de tokens Cronos del acuerdo con Crypto.com. Comprar caro con apalancamiento y cruzar los dedos no es una estrategia. Capital B intenta algo más disciplinado, con instrumentos que alinean a todos alrededor de la métrica de Bitcoin por acción. Vale la pena observar si otras tesorerías europeas copian la estructura, y vale la pena ver si Adam Back sigue acumulando capital en vehículos que están, básicamente, denominados en Bitcoin por diseño.
Una predicción. En 18 meses, al menos un pool grande de minería de Bitcoin ejecutará Stratum V2 por defecto, y al menos un minero público de nivel medio retirará discretamente su segmento de minería para convertirse en una empresa pura de infraestructura de IA. La gravedad económica tira demasiado fuerte en ambas direcciones.