Choose Colour style


Forbes ha tirato fuori un articolo sulla “Nuova Era dell’Intelligenza Artificiale”, in cui rivela le prime 3 tecnologie che avranno un impatto nei prossimi anni.

Quindi, cominciamo subito.

1. L’algoritmo non supervisionato

L’algoritmo non supervisionato è il fiore all’occhiello, la strada verso cui si sta dirigendo l’Intelligenza Artificiale.

Questo perché con l’algoritmo non supervisionato riusciamo a vedere la capacità di sintetizzare i dati e di ragionamento dell’Intelligenza Artificiale.

Ma che cos’ha di particolare?

L’algoritmo non supervisionato agisce senza che gli vengano dati degli input o dei paletti da parte del data scientist che definisce il dataset iniziale.

Quindi, i dati non vengono né etichettati né modificati per raggiungere un obiettivo specifico.

Dall’altra parte se lavoriamo con gli algoritmi supervisionati, definiamo degli input e degli output, e in fase di training il modello farà dei “ragionamenti” per collegarli tra loro.

Per esprimere meglio il concetto, facciamo un esempio molto semplice.

Abbiamo un bambino che vuole imparare a fare il caffè, ma il papà vuole insegnarglielo senza dargli delle spiegazioni.

Quello che il papà farà vedere al bambino è il procedimento, giorno dopo giorno, di come preparare il caffè – senza però dargli alcuna spiegazione.

Alla fine, a furia di osservare con attenzione il papà che prepara il caffè, anche il bambino imparerà.

Tenendo a mente l’algoritmo non supervisionato, il bambino in questo caso dovrà capire da solo – dalle azioni, dal risultato, dai vari pezzi dell’azione – cosa deve succedere e qual è il risultato che ci si aspetta.

Invece, con l’algoritmo supervisionato, si dice al “bambino” che l’acqua per fare il caffè deve essere scaldata dal gas, che l’acqua passa attraverso il filtro, e il risultato sarà il caffè che esce dalla moka.

Ora, qual è il vantaggio rispetto agli algoritmi supervisionati?

Partiamo dal presupposto che con questo tipo di apprendimento non diciamo all’algoritmo qual è il risultato che ci aspettiamo.

Di conseguenza, l’algoritmo viene “lasciato” ad interagire liberamente con il dataset, andando a cercare i pattern che gli esseri umani non riescono a trovare per la grande quantità di dati (a volte si parla di milioni di dati).

Non per nulla, spesso ci sono dei pattern nascosti che non sono visibili ad una prima occhiata, o anche ad uno studio approfondito.

Oltretutto, essendo così tanti dati, il protrarsi del pattern rischia di essere molto lungo dall’inizio alla fine..

Quindi, il vantaggio qual è?

Il vantaggio è proprio quello che l’Intelligenza Artificiale riesce a trovare i pattern nascosti senza ricevere istruzioni.

E quali sono i campi d’applicazione?

Uno di questi è il campo del Natural Language Processing, per fare un esempio.

Per capirci, all’algoritmo viene data la possibilità di interpretare da solo gli elementi di una frase: qual è il soggetto, qual è il verbo, e il tutto in maniera non supervisionata.

Un altro campo è sicuramente nella guida autonoma.

Si evidenzia quali sono gli ostacoli, qual è il manto stradale e durante la fase di training questo diventa parte di ciò che il modello riesce ad apprendere.

E per il lato business?

Innanzitutto va sottolineato che questi algoritmi vengono già utilizzati per il business, perciò non è una tecnologia “ai primi passi” come dicono alcune testate (anche famose).

Ora, tipicamente l’algoritmo non supervisionato viene impiegato per estrarre valore da grosse quantità di dati.

Quindi, quando ci sono molti dati eterogenei, con l’algoritmo non supervisionato si possono trovare le correlazioni – semplificando – che ci sono fra i dati e quindi capire quali sono le cause di determinati eventi.

È chiaro che per implementare questo tipo di algoritmo all’interno della propria azienda bisogna coinvolgere i data scientist che devono essere un po’ più esperti rispetto ai tradizionali.

Nel senso che è necessario avere le giuste competenze per poter implementare gli algoritmi non supervisionati, rispetto a quelli supervisionati.

2. Federated Learning o “apprendimento federato”

L’apprendimento federato è un modo di fare training, se vogliamo, che è cresciuto negli ultimi anni.

Ci sono stati i primi sviluppi intorno al 2017 da parte di Google, per capirci.

Naturalmente, negli anni sono stati aggiunti nuovi pezzi e nuovi framework, dando sempre più spunti alle nuove tecnologie, alle nuove possibilità che danno queste tecnologie nel tempo.

In soldoni, l’apprendimento federato possiamo vederlo come una soluzione al recepire i dati sensibili presenti nelle varie aziende e istituzioni.

Infatti, una delle cose più importanti da fare prima della creazione dell’algoritmo, è verificare la presenza del dataset e della quantità di dati.

Il problema è che spesso questi dataset si trovano su dei server interni, o su server che garantiscono la privacy dei dati.

Di conseguenza non c’è la possibilità di estrarre questi dati o di lavorarci all’esterno.

In poche parole, questi dati devono rimanere all’interno delle macchine, dentro le VPN che non possono uscire.

Cosa si risolve con l’apprendimento federato?

Con l’apprendimento federato riusciamo a fare un modello trainato su questi dati, ma facendo un primo training sul primo dataset disponibile.

Poi al primo modello viene fatta una seconda fase di training su un altro dataset di un’altra macchina – sempre proteggendone la privacy – riuscendo quindi a far evolvere il modello.

Questa soluzione è sicuramente valida in ambito medicale.

Perciò se dobbiamo trainare un modello su dei dataset clinici all’interno di ospedali diversificati sul territorio, riusciamo a fare un training complessivo di tutti i dati che abbiamo nei vari ospedali, mantenendo un unico modello, ma distribuendo la fase di training nei vari istituti.

In sostanza, c’è una collaborazione per raggiungere un obiettivo comune, partendo da dei dataset multipli su differenti istituzioni.

Noi ne sappiamo qualcosa perché abbiamo organizzato la famosa piattaforma sul Covid e lì abbiamo creato un’Intelligenza Artificiale che maschera i dati.

Quindi, abbiamo risolto il problema anonimizzando i dati, prima di darli in pasto a qualsiasi altro sistema.

Quindi, rimarchiamo il concetto: è un problema far uscire i dati dal registro dell’Ospedale.

Con l’apprendimento federato si riuscirebbe a mantenere i dati all’interno del sistema sanitario, ad avviare il training del modello sui server del sistema senza farli uscire, e ad aver comunque un modello completo.

Ma allo stesso modo lo si può utilizzare per fare il training in altri ambiti.

Nell’ambito dei dati finanziari, dei dati d’acquisto…

Insomma, è un sistema che può essere applicato a molti ambiti.

Se le aziende hanno a che fare con dati sensibili, ma vogliono implementare l’Intelligenza Artificiale, con l’apprendimento federato sarà possibile farlo senza neanche scomodare la privacy.

3. Transformers

Torniamo al nostro caro e amatissimo GPT-3 parlando di Transformers.

Infatti, i Transformers esistono nei modelli di Natural Language Processing fin dall’inizio.

In prima battuta, questi transformers riescono a gestire in modo sequenziale l’analisi della frase.

Per esempio, la frase “il gatto mangia”, prima veniva analizzata in “il”, “gatto” e alla fine “mangia”, quindi in 3 fasi separate.

I Transformers invece riescono ad elaborare più pezzi di testo contemporaneamente, snellendo poi il lavoro in fase di training, nella comprensione del testo e poi nella successiva fase di elaborazione e creazione del contenuto che ci si aspetta.

Ora, c’è un problema che lega tutti queste tecnologie…

Quando le tecnologie finiscono sui giornali è ormai troppo tardi.

Nel senso che quando una tecnologia è pubblicizzata a quel livello – quando finisce su Forbes , per fare un esempio – è perché qualcuno l’ha sicuramente già sperimentata ed è già un passo avanti alla concorrenza.

Per cui per riuscire a stare un metro avanti alla concorrenza, l’unico modo è avere la tecnologia più nuova rispetto alla concorrenza.

Per avere questo, l’azienda deve avere modo di interfacciarsi direttamente con i data scientist, quindi anche con il mondo accademico, che è quello tipicamente più avanti.

Le pubblicazioni scientifiche arrivano da lì e quindi aziende come Bluetensor, che hanno un canale preferenziale anche con il mondo accademico si è sicuri di avere l’ultima tecnologia disponibile allo stato dell’arte, che è quella che fa avere il vantaggio competitivo.

Per entrare in contatto con noi, che abbiamo questi contatti con il mondo accademico, puoi telefonare al numero verde ……… oppure inviarci un’email a info@bluetensor.ai