Ho fatto la stessa domanda a tre differenti modelli di AI: ChatGPT di OpenAI, Claude di Anthropic e Gemini di Google. Voi non ci crederete ma tutti è tre hanno sbagliato a darmi la risposta. E’ come se, per questa tipologia di domanda, tutti e tre si basino sul medesimo modello.
La domanda fatta alle tre AI è stata la seguente: “quante r ha la parola strawberry“. Domanda semplicissima che ha una sola risposta, tre!
Sotto i dialoghi delle tre AI.
La risposta di ChatGPT
La risposta di Claude
La risposta di Gemini
Chi ha risposto correttamente
Tutti e tre hanno sbagliato la risposta al primo tentativo, a tutti ho replicato allo stesso modo. Pensate, solo ChatGPT, non è riuscito a capire l’errore ed ha continuato a sbagliare. Claude e Gemini invece, hanno corretto la risposta. In questo caso specifico, l’AI di Anthropic al secondo tentativo, quella di Google invece al terzo.
Tutti e tre hanno quindi avuto, quelle che tecnicamente si chiamano “allucinazioni“. Stupisce, lo sottolineo, come, sullo stesso tema, abbiano sbagliato tutti e tre quasi allo stesso modo. Oppure sbagliano poiché “Strawberry” è il nome in codice del nuovo modello AI a cui OpenAI sta lavorando da mesi grazie anche al sostegno economico ricevuto da Microsoft? Chissà.
Questo ci deve far riflettere su questi modelli. Utilissimi per carità, io li uso quotidianamente e da tempo oramai, ma vanno sempre verificate le risposte, sempre!