La più grande difficoltà degli LLM è quella di generare ragionamenti di tipo logico-matematico che siano sensati e portino a risultati corretti. Con svariate tecniche di prompt engeneering gli utenti hanno sempre provato a far “ragionare” un passo alla volta l’AI cosicché prima di dire la risposta restituisse alcuni punti di una CoT (Chain of Thought) che le permettesse di arrivare ad un risultato corretto o, se così non fosse di capire dove ha sbagliato. Queste tecniche non sempre -eufemismo- restituivano il risultato sperato.
OpenAI ha rilasciato quindi il 12 settembre a tutti gli 11 milioni (11 mln secondo The Information) tra utenti Plus, Team, Business ed Enterprise una preview del modello o1 e il modello o1-mini.
Questi modelli integrano nativamente i processi di CoT che avvengono prima di dare la risposta (e non nella risposta stessa come avveniva cone tecniche di prompt engineering). I tempi di risposta di questi modelli sono molto più alti di quelli che abbiamo conosciuto finora, perché il modello potrebbe “pensare” anche per 40 secondi se la richiesta è complessa. Ed è proprio questo il punto su cui il CEO di OpenAI Sam Altman insisteva da mesi. Un sistema AI che impieghi meno tempo se deve rispondere ad una domanda semplice, e per più tempo se deve farlo con una più complessa, proprio come fa l’essere umano.
Nel processo di CoT il modello, si propone anche delle risposte e cerca di capire se queste sono corrette, in caso contrario cerca di capire gli errori e come andare avanti.
L’azienda ha deciso di non fare vedere per questioni di sicurezza l’intero processo di “ragionamento”, ha optato per un riassunto di un paio di frasi per ogni anello della catena di CoT. Si può visionare il “ragionamento” cliccando sul tasto “thought for x seconds”.
OpenAI dice che le prestazioni migliori del modello avvengono nelle materie STEM. È proprio su questo punto che l’azienda sta puntando con collaborazioni che vengono mostrate sul suo canale YT.
I rumor riguardanti questo modello, inizialmente chiamato come nome in codice Q*, poi soprannominato in Strawberry, girano ormai da un anno su questi modelli e sembra sia proprio su questo passaggio che uno dei fondatori di OpenAI, Ilya Sutskever, ha lasciato l’azienda dopo essere stato per mesi senza fare interviste o altre apparizioni pubbliche, tanto che tra gli appassionati del settore ci si chiedeva “What has Ilya seen?”. Quest’estate Ilya ha lasciato OpenAI, spaventato della direzione che l’azienda di Sam Altman stava prendendo, di minore attenzione verso la sicurezza. Ha fondato SSI (Safe Super intelligence Inc) che ha recentemente ottenuto 1 miliardo di dollari di finanziamenti (sì, un’azienda di 10 dipendenti, nata da qualche mese, prende 1 miliardo di finanziamenti).
Questo è un passo fondamentale verso gli Agenti, necessari per arrivare all’AGI e un’AI in grado di creare nuova conoscenza. Ci stanno lavorando tutti: OpenAI, Google, Meta, Xai. Non è importante chi ci arrivi per primo, ma se ci si arriverà (ad esempio Federico Faggin, inventore del microprocessore, ritiene che l’AI in quanto computer non possa e non potrà mai creare qualcosa di veramente autentico), avremo fatto Bingo. Tutti.
Lascia un commento