DEEP COGITO: L’AI CHE IMPARA DA SOLA
Nasce Deep Cogito, un modello di AI che supera in ragionamento e risoluzione di problemi complessi tutti i suoi predecessori, ed è stato sviluppato in appena 75 giorni! (contro i cicli estenuanti richiesti dai giganti del settore).
Addestramento più breve, meno parametri (solo 70 miliardi) e un uso più mirato delle risorse significano anche minor consumo di energia.
Ma come fa?
IL SISTEMA CHE DIVENTA MAESTRO DI SE STESSO
Mentre gli altri sistemi necessitano di supervisione esterna, questo modello utilizza i propri ragionamenti come materia prima per evolversi.
Startup fondata a San Francisco solo nel giugno 2024, Deep Cogito supera già in prestazioni colossi come l’AI di Meta nei principali benchmark di ragionamento.
AMPLIFICAZIONE E DISTILLAZIONE
Il meccanismo con cui funziona si chiama IDA (Iterated Distillation and Amplification) e lavora in due fasi:
- Fase 1: Amplificazione
L’arte di pensare ad alta voce.
Nella fase di amplificazione, il modello affronta un problema scomponendolo meticolosamente. Ad esempio, dato il problema 23 × 7 – 3², procede così: “Devo prima calcolare 23 × 7 = 161, poi 3² = 9, infine 161 – 9 = 152.” È un ragionamento visibile, esplicito, quasi didattico.
- Fase 2: Distillazione
La cristallizzazione dell’esperienza.
Durante la distillazione, avviene la magia: il modello non si limita a catalogare risposte, ma interiorizza i metodi risolutivi stessi. Affrontando successivamente un problema come 18 × 4 – 5², applica automaticamente la sequenza logica appresa: prima le potenze, poi le moltiplicazioni, infine le sottrazioni. È come se avesse metabolizzato un principio matematico, non memorizzato un risultato.
Questo ciclo si perpetua con problemi di complessità crescente, in una spirale ascendente di auto-miglioramento che procede senza richiedere costante supervisione umana.
POTENZIALITÀ FUTURE
Le implicazioni di questa tecnologia sono considerevoli:
- Prestazioni superiori con riduzione significativa dei costi e tempi di sviluppo.
- Miglioramento continuo senza necessità di supervisione umana costante.
- Accelerazione della ricerca: i cicli di sviluppo più brevi permettono iterazioni più rapide e progressi più veloci.
L’avvento di Deep Cogito ci ricorda che l’intelligenza autentica non si misura nella mole di conoscenza, ma nella capacità di distillarne l’essenza.
L’eleganza dell’approccio spesso supera la potenza bruta.
DISTILLAZIONE: DA DEEP SEEK A DEEP COGITO
La cinese DeepSeek aveva stupito il mondo appena pochi mesi fa proprio usando alcune tecniche di distillazione, con modelli più piccoli che catturano gran parte delle capacità di modelli molto più grandi.
Ora Deep Cogito estende il concetto di distillazione: qui il modello impara dalle proprie elaborazioni raffinate, in un ciclo di auto-miglioramento.
Dunque, anziché dipendere da un “insegnante” esterno più grande, il modello diventa sia insegnante che studente di se stesso.
La vera innovazione sembra risiedere nella natura iterativa e ciclica del processo, dove ogni fase di amplificazione-distillazione porta a un modello migliore che può poi amplificare più efficacemente, creando un ciclo virtuoso di miglioramento.
Si tratta di un’evoluzione significativa della tecnica di distillazione e anche un bell’esempio di come: