Rapida carrellata prima di entrare nel vivo. Google DeepMind ha presentato un co‑matematico IA basato su Gemini 3.1 Pro che ha appena stabilito un nuovo record su FrontierMath Tier 4, e ha effettivamente aiutato un umano a risolvere un problema aperto da 60 anni. OpenAI ha risposto al Mythos di Anthropic con GPT‑5.5‑Cyber, un modello cyber solo per la difesa, accessibile tramite un programma di accesso verificato. Bitcoin oscilla intorno agli 80.000 dollari con un cuneo ascendente e i trader che fanno rumore sui social, cosa che di solito finisce in un modo solo. La difficoltà di rete è appena scesa del 2,3% il 1° maggio, sesto taglio dell’anno, e sette grandi pool di mining, tra cui Foundry, Antpool e F2pool, si sono uniti al gruppo di lavoro su Stratum V2. E in Europa, Adam Back ha staccato un altro assegno su Capital B e si è fatto rinegoziare i termini del convertibile a suo favore. Entriamo nel merito.
Il numero da titolo è 47,9% su FrontierMath Tier 4. È il livello più difficile di un benchmark pensato per mandare in crisi i modelli di frontiera, e il nuovo co‑matematico IA di DeepMind ha risolto 23 problemi su 48, inclusi 3 che nessun modello precedente aveva mai sbloccato. GPT‑5.5 Pro deteneva il record precedente al 39,6%. Epoch AI ha condotto il test alla cieca, con fino a 48 ore di calcolo per domanda.
Ma il benchmark non è la vera notizia. Lo è l’architettura. Non è un unico modello gigante che forza le risposte a colpi di brute force. È una gerarchia. Un coordinatore di progetto delega a coordinatori di flussi di lavoro, che a loro volta attivano agenti specialisti per recupero di letteratura, esecuzione di codice, ricerca di controesempi e verifica di dimostrazioni usando Gemini Deep Think. Agenti revisori controllano le dimostrazioni prima che esca qualcosa. In pratica è un piccolo laboratorio di ricerca simulato in software.
Conta la prova di concetto. Il topologo Marc Lackenby ha usato il sistema per attaccare il problema 21.10 del Kourovka Notebook, una domanda aperta sul fatto che ogni gruppo finito abbia quella che si chiama una presentazione semplicemente finita. Il sistema ha perseguito in parallelo dimostrazione e confutazione. Ha prodotto una bozza, gli agenti revisori hanno segnalato una lacuna, Lackenby l’ha indirizzato verso la strategia giusta e insieme hanno assemblato una dimostrazione completa. Una seconda passata ha individuato due errori minori. Risultato finale: un problema aperto da 60 anni, chiuso.
I limiti sono reali. I revisori possono convergere su un ragionamento plausibile ma sbagliato. Il team descrive spirali di morte in cui il sistema rivede all’infinito senza progredire. L’accesso è limitato a un piccolo gruppo di matematici. Ma se lo affianchiamo ad AlphaEvolve, l’altro agente di coding di DeepMind che ora migliora la correzione degli errori sul DNA del 30%, porta la fattibilità dell’ottimizzazione delle reti elettriche dal 14% all’88% e propone circuiti quantistici con errori 10 volte inferiori sul chip Willow di Google, il quadro è chiaro. La tesi della ricerca basata su agenti sta iniziando a consegnare risultati duri e verificabili in domini dove non puoi bluffare la risposta. La matematica se ne infischia delle vibes.
Mentre DeepMind insegue dimostrazioni, il resto dell’ecosistema degli agenti diventa più pratico e molto più interessante. Anthropic ha rilasciato questa settimana un aggiornamento significativo ai Claude Managed Agents. Tre cose spiccano. Primo, Dreaming, un processo pianificato che rivede le sessioni passate e gli archivi di memoria, estrae pattern e affina ciò che l’agente ha imparato. Pensatelo come l’agente che consolida la memoria a orologio fermo. Secondo, Outcomes, dove definisci una rubrica e un valutatore separato, con una sua finestra di contesto, giudica se il lavoro supera la soglia e dice all’agente cosa correggere. I benchmark interni mostrano guadagni di 8‑10 punti su compiti difficili. Terzo, orchestrazione multi‑agente, dove un agente capofila delega a sotto‑agenti che lavorano in parallelo su un filesystem condiviso. Netflix lo usa già in produzione per il team piattaforma.
Nel frattempo OpenAI ha lanciato la Operator API. Azioni web autonome a partire da 15 centesimi per task completato, fino a 100 task al minuto, con log e screenshot per il debug. Zapier e Notion sono tra i primi integratori. E Google sta facendo qualcosa di interessante e un po’ imbarazzante allo stesso tempo. Ha chiuso in sordina Project Mariner, il suo agente da browser basato sulla visione, perché costava circa 85 volte più calcolo rispetto agli agenti di coding testuali. Le capacità confluiscono in Gemini, incluso un nuovo agente per macOS che può controllare il tuo Mac, organizzare file, acquisire le fatture in Sheets e preparare follow‑up a partire dalle trascrizioni di Meet.
Il pattern comune tra i tre laboratori: gli agenti da browser vision‑first stanno perdendo contro quelli code‑first perché i conti unitari non tornano. Anthropic e OpenAI hanno puntato forte su uso strutturato di strumenti ed esecuzione di codice. Google ora ripiega sullo stesso copione. Se stai costruendo su agenti, la lezione è di scommettere su architetture in cui il modello scrive ed esegue codice invece di fissare i pixel. Più economiche, più veloci, più affidabili e più facili da verificare. L’era degli agenti che spostano pixel è stata una breve deviazione.
Il mining di Bitcoin è in una situazione strana. La difficoltà è scesa del 2,3% il 1° maggio, sesto aggiustamento al ribasso del 2026. Da inizio anno la difficoltà è giù del 10,7%, da 148,3 trilioni a 132,47 trilioni. L’hashrate è sceso sotto 1 zettahash al secondo, tra 899 e 958 exahash. Il prossimo aggiustamento attorno al 17 maggio potrebbe scendere ancora.
Perché l’hashrate cala? Due ragioni, entrambe strutturali. Primo, i miner quotati sono a pareggio o sotto. I costi di produzione stanno tra 80.000 e 90.000 dollari per BTC, e Bitcoin è lì a 80.000. I miner pubblici hanno venduto un record di 32.000 BTC nel Q1, più di tutti e quattro i trimestri del 2025 messi insieme. Secondo, IA e HPC gli stanno portando via la partita dal lato energetico. Sono stati annunciati oltre 70 miliardi di dollari di contratti IA e HPC nel settore mining. TeraWulf è l’emblema della settimana: ha registrato una perdita trimestrale di 427 milioni di dollari ma ha raddoppiato i ricavi IA, con i canoni HPC in leasing su del 117% trimestre su trimestre a 21 milioni di dollari. Stanno letteralmente riconvertendo le infrastrutture elettriche a scapito dell’hashing.
L’unica nota positiva è l’hashprice, salito a circa 38 dollari per petahash al giorno, con le fee per blocco in aumento del 12% settimana su settimana. Difficoltà in calo più prezzo stabile uguale a margini più grassi per chi è ancora collegato.
La storia più interessante è strutturale. Sette grandi pool, Antpool, F2pool, Foundry, Spiderpool, Block Inc., MARA Foundation e DMND, si sono uniti allo Stratum V2 Working Group il 7 maggio. Stratum V2 consente ai singoli miner di scegliere i propri modelli di blocco invece di accettare quelli decisi dall’operatore del pool. Crittografia end‑to‑end, minore consumo di banda, e i test di Braiins mostrano fino al 7,4% di redditività in più grazie a consegna più rapida dei template e migliore cattura delle fee. È la notizia più positiva per la decentralizzazione del mining da anni. Se i singoli miner iniziano davvero a scegliere i propri template su larga scala, contrasti un vettore reale di censura e il problema dei blocchi conformi a OFAC. Il fatto che Foundry e Antpool siano al tavolo, visto che insieme hanno minato il 48% dei blocchi della scorsa settimana, è ciò che rende la cosa credibile.
Adam Back ha staccato un altro assegno, questo da 1,1 milioni di euro, su Capital B, la società di tesoreria Bitcoin quotata in Europa, nota in passato come The Blockchain Group. La struttura è ciò che rende la notizia interessante, perché è un modello diverso dal playbook di Strategy che tutti copiano.
L’accordo: Back sottoscrive 10 milioni di warrant su azioni a 11 centesimi ciascuno, esercitabili al maggiore tra 84 centesimi o quello che Capital B chiama mNAV 1.1, cioè il 110% del valore in euro di Bitcoin detenuto per azione su base fully diluted. In altre parole, il prezzo di esercizio fluttua con Bitcoin. Allo stesso tempo, Capital B ha dimezzato il prezzo di conversione dei convertibili già in mano a Back, da 5,17 euro a 2,59 euro, e ha rimosso la condizione sul prezzo dell’azione che prima bloccava la conversione. I bond sono a zero cedola e possono essere rimborsati in Bitcoin, euro o azioni.
Back ora è intorno al 9,97% fully diluted. Capital B detiene circa 2.943 BTC, per circa 234 milioni di dollari.
La parte interessante non è la dimensione, è la metrica esplicita: Bitcoin per azione fully diluted. È quello che stanno ottimizzando. Strategy usa il rendimento in BTC come concetto simile, ma Capital B l’ha codificato negli strumenti stessi. Lo strike dei warrant, il prezzo di conversione, l’intera struttura del capitale è ancorata ai Bitcoin detenuti per azione, non al prezzo del titolo. Se sei azionista, non ti importa se l’azione rimbalza, ti importa che il numero di Bitcoin per azione salga.
Questa è la seconda ondata di design delle società di tesoreria. La prima ondata era semplice: raccogli dollari, compra Bitcoin, guarda il multiplo espandersi. Abbiamo visto cosa succede quando va storto questa settimana, con Trump Media che ha riportato una perdita trimestrale di 406 milioni di dollari, per lo più svalutazioni non realizzate su Bitcoin comprati vicino al picco dell’estate scorsa e su token Cronos dell’accordo con Crypto.com. Comprare caro a leva e incrociare le dita non è una strategia. Capital B sta provando qualcosa di più disciplinato, con strumenti che allineano tutti intorno alla metrica dei Bitcoin per azione. Da seguire se altre tesorerie europee copieranno la struttura, e da seguire se Adam Back continuerà ad accumulare equity in veicoli che, per disegno, sono di fatto denominati in Bitcoin.
Una previsione. Entro 18 mesi, almeno un grande pool di mining Bitcoin farà girare Stratum V2 di default, e almeno un miner pubblico di fascia media farà delistare in sordina il segmento mining per diventare una pura società di infrastrutture IA. La gravità economica spinge forte in entrambe le direzioni.