Skip to main content

Introduzione a Gemini

Google ha recentemente lanciato Gemini, un modello avanzato di intelligenza artificiale, progettato per superare i limiti dei modelli AI precedenti, come PaLM-2. Gemini è multimodale (cioè prende in input anche immagini, video, audio) ed è stato presentato in tre versioni distinte: Ultra, Pro e Nano, ognuna ottimizzata per compiti specifici e livelli di complessità diversi.

  1. Gemini Ultra: Questa è la versione più grande e capace, ideale per compiti altamente complessi. La sua architettura avanzata permette a Gemini Ultra di gestire e risolvere problemi che richiedono un elevato livello di intelligenza artificiale.
  2. Gemini Pro: Considerato il modello migliore per l’escalation su una vasta gamma di compiti, Gemini Pro si posiziona come la versione intermedia. Questa versione è in grado di superare alcuni altri modelli, come GPT di OpenAI, ma resta al di sotto delle capacità di Gemini Ultra.
  3. Gemini Nano: La versione più efficiente, ottimizzata per l’uso su dispositivi. Gemini Nano è progettato per fornire capacità di intelligenza artificiale direttamente sui dispositivi, rendendolo ideale per applicazioni che richiedono risposte rapide e localizzate.

Ogni versione di Gemini è costruita per eccellere in specifici ambiti di utilizzo. Mentre Gemini Ultra è il più potente, con capacità che superano tutti i modelli IA esistenti, Gemini Pro offre una soluzione più bilanciata per un’ampia gamma di applicazioni. Gemini Nano, d’altra parte, si adatta perfettamente a contesti in cui la velocità e l’efficienza sono fondamentali.

Gemini Pro e l’Integrazione in Bard

Una delle applicazioni più significative di Gemini è la sua integrazione con Bard, la piattaforma di generazione testi di Google (ho presentato Bard QUI). Gemini Pro, in particolare, viene utilizzato per potenziare Bard, migliorando la sua capacità di ragionamento, pianificazione e comprensione. Questa collaborazione segna un importante passo avanti nella fusione di diverse tecnologie AI per creare esperienze utente più ricche e intuitive.

Nonostante ciò, ho fatto un test che mi ha lasciato un po’ sorpreso: ho chiesto di realizzare un UdA e la relativa griglia di valutazione, utilizzando un linguaggio poco preciso e vago per valutare la sua capacità di interpretazione. I prompt proposti erano gli stessi di un’attività svolta durante un corso con ChatGPT 4, ma i risultati sono estremamente diversi e persino meno accurati di Bard con PaLM-2:

UdA con ChatGPT 4

UdA con Bard

Per curiosità ho chiesto a Bard come mai il risultato fosse così approssimativo, anche rispetto a PaLM-2 e, come puoi vedere nell’immagine, è possibile che Gemini abbia bisogno di un po’ di tempo, in particolar modo per la lingua italiana.

Inoltre, dal giorno della sua presentazione ci sono state alcune controversie, in particolare riguardanti la rappresentazione delle sue funzionalità. Ad esempio, è stato rivelato che un video promozionale sulla homepage di Gemini mostrava interazioni con il modello che non erano ancora possibili. Molti utenti hanno accusato Google di aver realizzato un video fake, che mostra un’interazione in tempo reale con il modello, mentre invece per ottenere quelle risposte è necessario caricare le immagini una alla volta (approfondisci qui). Visto che anche con il lancio di Bard c’erano stati dei problemi performance, dopo questo passo falso le quotazioni di Alphabet sono calate molto.

Conclusioni

L’accessibilità di Bard, che ora include la tecnologia Gemini Pro, potrebbe avere un impatto notevole nell’ambito dell’istruzione. Gli strumenti di IA avanzati e gratuiti possono fornire risorse preziose per studenti e insegnanti, facilitando l’apprendimento e offrendo nuove modalità per l’educazione. Mi riservo di continuare a testarlo e a verificare i miglioramenti del tempo con l’utilizzo.

Ritengo, però, che al momento il Large Language Model più efficiente sia ancora quello di OpenAI, vedremo in futuro se le cose cambieranno, dati i grandi investimenti in questo settore. Magari, anche in Italia sarebbe il momento di iniziare a pensare ad un LLM pubblico e open source, sul modello di quanto sta avvenendo in Francia con Bloom, per non correre il rischio di restare molto indietro con queste tecnologie che stanno avendo un impatto determinante in moltissimi settori (leggi la ricerca sui lavori a rischio del Dipartimento dell’Istruzione inglese).

Sostieni il mio lavoro!

Se ti è piaciuto l’articolo puoi compiere le seguenti semplici azioni per sostenere il mio lavoro:

Non hanno nessuno costo per te ma un grande valore per me!

Se vuoi organizzare un corso di formazione per la tua scuola, dai un’occhiata al mio nuovo catalogo!

Un caffè al prof!

Se invece vuoi supportare la creazione di contenuti con una piccola donazione tramite PayPal, puoi farlo cliccando il pulsante.

Grazie!

AGGIORNAMENTO: Da oggi tutto quello che ti serve sapere sulla console è nel mio libro! Il primo manuale dedicato alla console di amministrazione di Google Workspace. Puoi comprare il libro su Amazon, in formato digitale o cartaceo a QUESTO INDIRIZZO.

Didattica Innovativa è diventata un’associazione culturale!

Questo vuol dire che prima o poi chiuderò questo blog o lo trasformerò in qualcosa di diverso, per potermi dedicare a questa attività!

Guarda la presentazione dell’associazione QUI.

Lascia un commento

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.