AI per analisi recensioni clienti: workflow PMI italiane

Avete 250 recensioni Google, 80 risposte a un sondaggio NPS, 100 ticket di supporto. Nessuno ha tempo di leggerli tutti. Il risultato: insight persi, problemi ricorrenti che nessuno vede, opportunità mancate. La recensione da tre stelle che dice “prodotto ottimo ma consegna lentissima” finisce in un foglio Excel e lì muore.

Per anni l’analisi sistematica del feedback è stata roba da aziende con un reparto customer insight. Una PMI italiana — un ristorante, uno studio dentistico, un e-commerce di nicchia, un’agenzia — non aveva né gli strumenti né il tempo. Si leggeva “a sensazione”, ci si ricordava le ultime due recensioni cattive e si dimenticava il resto.

Oggi un modello linguistico legge 300 recensioni in due minuti e ti restituisce i temi ricorrenti, con tanto di citazioni. Il punto non è più se puoi farlo, ma come farlo bene su dataset piccoli e in italiano, senza prendere lucciole per lanterne. Questa guida è il workflow concreto: da un file CSV a un piano di azioni, con i prompt che usiamo davvero.

Se ti serve prima il quadro d’insieme su dove l’AI conviene davvero in una piccola impresa, parti dalla guida pratica all’AI per PMI 2026 e poi torna qui per la parte operativa.

Perché le PMI hanno un problema diverso (dataset piccoli)

La maggior parte dei tutorial sulla sentiment analysis è scritta pensando a chi ha decine di migliaia di recensioni. Le tecniche statistiche, i modelli da addestrare, i dashboard: tutto presuppone volume. Una PMI italiana lavora su un altro ordine di grandezza. Tra Google, qualche risposta a un sondaggio e i messaggi diretti, parliamo spesso di 50-500 recensioni totali, accumulate in anni.

Questo cambia tre cose.

Primo: la statistica conta meno, la lettura conta di più. Con 80 recensioni non fai analisi del trend con intervalli di confidenza. Fai una cosa più simile a una buona sintesi qualitativa: capisci cosa dicono le persone e con che parole. L’AI qui è insostituibile perché legge ogni singolo testo, non un campione.

Secondo: ogni recensione pesa. Su 50 recensioni, tre persone che si lamentano della stessa cosa sono il 6% del campione: un segnale forte. Su un dataset piccolo non puoi permetterti di “perdere” recensioni nell’aggregato. Servono prompt che ti riportino i numeri e le citazioni, non solo un riassunto generico.

Terzo: il dataset piccolo entra tutto nella finestra di contesto. Cinquecento recensioni stanno comodamente dentro Claude o ChatGPT in un solo prompt. Non serve nessuna infrastruttura: niente database vettoriali, niente pipeline. Questo è il vantaggio nascosto delle PMI — quello che per una grande azienda è un problema di ingegneria, per te è un copia-incolla.

Cosa puoi tirare fuori dalle recensioni

Prima di aprire il modello, decidi cosa cerchi. Buttare dentro 200 recensioni con un “analizzami questo” produce un riassunto vago. Le domande utili sono specifiche:

Temi ricorrenti, positivi e negativi, con il conteggio di quante recensioni li menzionano.
Differenze per segmento: clienti business vs consumer, sede di Milano vs sede di Bergamo, chi ha comprato il prodotto A vs il prodotto B.
Evoluzione nel tempo: il sentiment è migliorato o peggiorato dopo il cambio di fornitore, il restyling del menù, l’aumento di prezzo?
Domande non risposte che ricorrono e che potrebbero diventare FAQ sul sito o contenuti.
I termini esatti che i clienti usano per descriverti. Oro puro per le schede prodotto, gli annunci, la SEO. Se dicono “veloce e senza pensieri”, quelle sono le parole che funzionano nel tuo marketing.
Segnali di prodotto/servizio: feature richieste, mancanze, confronti spontanei con i concorrenti.

Ognuno di questi obiettivi richiede un prompt diverso. È l’errore numero uno: usare un solo prompt generico per tutto.

Workflow operativo: da CSV a piano azioni

Quattro fasi. Dalla prima all’ultima, su un dataset da 200-300 recensioni, ci metti 30-45 minuti la prima volta, meno di 15 quando l’hai rodato.

1. Esporta i dati

Le fonti tipiche e come tirarne fuori un file:

Google Business Profile: non esporta nativamente in CSV. Puoi usare Google Takeout (parziale), un’estensione del browser per scraping leggero, o copiare a mano se sono poche. Molte PMI partono da qui.
Trustpilot / Yelp / TripAdvisor: alcuni piani business permettono l’export; altrimenti copia-incolla.
Sondaggi (Google Form, Typeform, SurveyMonkey): export CSV nativo, immediato.
Ticket di supporto (es. da una casella dedicata o da un help desk): export delle conversazioni chiuse.
Messaggi diretti (WhatsApp Business, DM social): copia-incolla dei più rilevanti.

L’obiettivo è un file con una riga per recensione. Non serve che sia perfetto.

2. Pulisci leggermente

Tieni solo le colonne utili: testo della recensione, data, voto (se c’è), categoria/segmento (se ce l’hai, es. prodotto acquistato o sede). Rimuovi tutto ciò che è dato personale e non serve all’analisi: email, numeri di telefono, cognomi. Su questo torniamo nella sezione privacy, ma il principio è: meno dati personali carichi, meglio è.

Se le recensioni hanno nomi propri nel testo (“Mi ha servito Marco, gentilissimo”), valuta se ti servono. Spesso il nome del dipendente è un’informazione che vuoi tenere (sapere chi lavora bene è utile); in quel caso sei consapevole di trattare un dato personale.

3. Carica e lancia i prompt

Usa un modello con finestra di contesto ampia e capacità di stare sull’italiano: Claude (Sonnet o Opus) o ChatGPT con caricamento file vanno benissimo per dataset di questa taglia. Incolla il CSV o allega il file, poi lancia i prompt mirati (la libreria completa è nella sezione successiva).

Lavora per obiettivi separati: prima i temi, poi i segmenti, poi le citazioni per il marketing. Un prompt, un output che verifichi, poi il successivo. Non chiedere otto cose insieme: la qualità crolla.

4. Verifica ed estrai le azioni

Questa è la fase che quasi tutti saltano, ed è quella che trasforma un riassunto in valore. Per ogni tema emerso, rispondi a tre domande:

È vero? Apri due o tre delle recensioni citate dall’AI e controlla che il tema ci sia davvero e che non sia un’allucinazione o un sarcasmo frainteso.
Quante persone lo sentono? Tre lamentele sulla stessa cosa contano diversamente se sono su 50 o su 500 recensioni.
Che azione concreta posso prendere? Operazione, formazione, processo, comunicazione, prodotto.

Il deliverable finale non è “il sentiment è 70% positivo”. È una tabella di questo tipo:

Tema	Frequenza	Sentiment	Azione	Priorità
Consegna lenta	18 su 220	Negativo	Rivedere contratto corriere; comunicare i tempi reali in checkout	Alta
Personale cortese	64 su 220	Positivo	Usare nelle risposte e negli annunci; citare nelle schede	Bassa (leva marketing)
Packaging fragile	7 su 220	Negativo	Test imballo prodotti pesanti	Media
Prezzi alti ma “ne vale la pena”	12 su 220	Misto	Lavorare sulla giustificazione del valore in pagina prodotto	Media

Questo lo porti in riunione lunedì mattina. Quello è il punto.

La libreria di prompt italiani (testati e copiabili)

Ecco i prompt che usiamo, per scopo. Sono pensati per essere incollati così come sono, sostituendo i pochi campi tra parentesi. Sono scritti per forzare l’AI a citare e a non inventare — su dataset piccoli è la cosa che conta di più.

Prompt 1 — Estrazione temi ricorrenti

Il cavallo di battaglia. Lo lanci per primo.

Sotto trovi N recensioni dei nostri clienti, una per riga. Identifica i 5-7 temi positivi più ricorrenti e i 5-7 temi negativi più ricorrenti. Per ciascun tema: (a) indica quante recensioni lo menzionano, anche come stima; (b) riporta 2-3 citazioni testuali reali prese dalle recensioni, senza modificarle; (c) assegna un’etichetta breve. Regole: non inventare temi che non sono nel testo. Se un tema è ambiguo o se una frase potrebbe essere ironica/sarcastica, segnalalo esplicitamente invece di classificarlo. Rispondi in italiano, in formato tabella.

Prompt 2 — Analisi per segmento

Quando hai una colonna che distingue i clienti (sede, prodotto, business/consumer). Serve a scoprire i problemi che colpiscono solo una parte della base, invisibili nell’aggregato.

Le recensioni qui sotto hanno una colonna “segmento” (es. sede o tipo di cliente). Confronta i temi positivi e negativi tra i diversi segmenti. Dimmi: quali lamentele sono concentrate in un solo segmento? Quali punti di forza valgono per tutti? Per ogni differenza rilevante riporta il segmento, il tema, la frequenza approssimativa e una citazione. Se un segmento ha troppe poche recensioni per dire qualcosa di sensato, dichiaralo invece di forzare una conclusione. Rispondi in italiano.

Prompt 3 — Linguaggio del cliente per il marketing

Questo non cerca problemi: cerca parole. Le espressioni esatte che i clienti contenti usano sono il miglior materiale per annunci, schede prodotto, email.

Dalle recensioni qui sotto, estrai le parole e le frasi esatte che i clienti usano per descrivere i benefici e ciò che apprezzano. Voglio il loro linguaggio, non parafrasi tue. Raggruppa per beneficio (es. “velocità”, “fiducia”, “convenienza”) e sotto ogni gruppo elenca 5-8 espressioni testuali ricorrenti. Indica quali sono le più frequenti. Questo materiale lo userò per testi di marketing, quindi privilegia frasi brevi e concrete. Rispondi in italiano.

Prompt 4 — Sarcasmo, ironia e casi dubbi

Da lanciare come secondo passaggio, dopo il Prompt 1, per stress-testare la classificazione sull’italiano (vedi la sezione dedicata più sotto).

Rileggi le recensioni qui sotto cercando specificamente frasi ironiche, sarcastiche o a doppio senso, tipiche dell’italiano parlato (es. “complimenti davvero”, “una favola…”, “bravissimi”). Per ciascuna: riporta la frase, di’ se secondo te è genuinamente positiva o una critica mascherata da sarcasmo, e spiega in una riga perché. Dove non sei sicuro, dillo chiaramente e marcala come “da verificare a mano”. Non classificare con sicurezza i casi ambigui. Rispondi in italiano.

Tabella: insight → prompt → output atteso

Tipo di insight che vuoi	Prompt da usare	Output atteso
Mappa dei punti di forza e debolezza	Prompt 1 (Temi)	Tabella temi + frequenze + citazioni
Problemi che colpiscono solo alcuni clienti	Prompt 2 (Segmento)	Confronto tra segmenti con differenze evidenziate
Materiale testuale per annunci e schede	Prompt 3 (Linguaggio)	Liste di frasi reali dei clienti raggruppate per beneficio
Affidabilità della classificazione sull’italiano	Prompt 4 (Sarcasmo)	Lista di frasi ambigue da verificare a mano
FAQ da pubblicare	Variante del Prompt 1	”Quali domande o dubbi ricorrono nelle recensioni?” → lista di domande

Una nota generale che vale per tutti: chiedi sempre citazioni testuali e l’istruzione esplicita “non inventare”. È la differenza tra un output verificabile e uno di cui non ti puoi fidare.

Il sarcasmo italiano: il punto cieco dei modelli

L’italiano è una lingua dove l’ironia fa danni alla classificazione automatica. “Complimenti davvero, due ore di attesa per un caffè” è formalmente positivo (la parola “complimenti”) ma è una stroncatura. “Una favola… peccato per il conto” è ambivalente. “Bravissimi a non rispondere mai al telefono” è puro sarcasmo. Un modello che legge per parole chiave classifica male tutto questo, e su un dataset piccolo anche pochi errori spostano il quadro.

Tre accorgimenti pratici:

Usa il Prompt 4 come passaggio dedicato. Non chiedere al modello di gestire il sarcasmo mentre fa l’analisi principale: fai un giro separato che cerca solo le frasi ambigue. La precisione sale parecchio quando il compito è uno solo.

Incrocia con il voto numerico. Se hai le stelle, una recensione “positiva nel testo” ma da 1-2 stelle è quasi sempre sarcasmo o un testo che il modello ha letto male. È il filtro più semplice e più efficace. Chiedi all’AI: “segnala le recensioni dove il sentiment del testo non corrisponde al voto in stelle”.

Verifica sempre a mano i casi dubbi. Il modello deve marcarteli, non risolverli da solo. Su 200 recensioni, i casi davvero ambigui sono in genere una decina: leggerli ti costa cinque minuti e ti salva da conclusioni sbagliate.

Lo stesso vale per il dialetto, le abbreviazioni da messaggio (“nn”, “cmq”, “x”) e gli emoji usati in chiave ironica. I modelli più recenti se la cavano bene, ma “bene” non è “sempre”. Questo è uno dei limiti dell’AI che è bene non delegare alla cieca: la lettura finale resta umana.

Punto serio, spesso ignorato. Le recensioni dei clienti sono quasi sempre dati personali ai sensi del GDPR: contengono nomi (l’autore, a volte dipendenti citati), possono rivelare stato di salute (recensione di uno studio medico o di una farmacia), abitudini, situazioni private. Caricarle in uno strumento AI è un trattamento di dati personali a tutti gli effetti.

Cosa significa in pratica per una PMI:

Scegli lo strumento giusto. Le versioni business/enterprise dei modelli (Claude for Work, ChatGPT Enterprise/Team, le API) di norma non usano i tuoi dati per l’addestramento e mettono a disposizione un Data Processing Agreement (DPA). Le versioni gratuite o consumer, in alcuni casi, possono usare gli input: per dati di clienti, non è la strada giusta. Verifica le impostazioni e i termini prima di caricare.

Minimizza. Prima di caricare, togli tutto ciò che non serve: cognomi, email, telefoni, qualsiasi identificativo. Se ti basta il testo della recensione per l’analisi tematica, l’autore non serve. Meno dati personali tratti, minore è il rischio. È anche un principio del GDPR (minimizzazione), non solo buon senso.

Pseudonimizza i nomi che vuoi tenere. Se ti interessa l’analisi per dipendente, sostituisci i nomi con codici (“Operatore A”) prima di caricare, e tieni la corrispondenza da parte.

Occhio alle categorie particolari. Recensioni che rivelano salute, orientamento, opinioni: trattamento a rischio più alto. Uno studio dentistico o un centro estetico devono essere particolarmente prudenti.

Fare a mano, AI, o tool dedicato: confronto onesto

Tre strade, costi e tempi diversi. Il punto non è quale sia “la migliore” in assoluto, ma quale sia adatta al tuo volume e alla tua frequenza.

Approccio	Tempo per 200 recensioni	Costo indicativo	Quando ha senso
A mano (foglio Excel, lettura)	3-5 ore	Solo il tuo tempo	Sotto 50 recensioni, o analisi una tantum
AI generalista (Claude/ChatGPT)	30-45 min (la 1ª volta)	0-20€/mese di abbonamento	50-500 recensioni, analisi periodica (trimestrale, semestrale)
AI + automazione (Make/Zapier + API)	Setup iniziale 1-2 giorni, poi automatico	~20-60€/mese tra piattaforma e token	Flusso continuo di recensioni da monitorare
Tool dedicato (Wonderflow, Birdeye, ecc.)	Setup assistito, poi automatico	Da ~100-300€/mese in su, spesso a preventivo	Volumi alti e costanti, più sedi/brand, serve dashboard e reportistica

Qualche nota per scegliere senza pentirsene.

A mano non è da snobbare. Per una micro-impresa con 40 recensioni l’anno, aprire l’AnnualReport e leggerle è più veloce che impostare prompt. E ti dà una sensibilità che nessun riassunto restituisce.

L’AI generalista è il punto di equilibrio per la stragrande maggioranza delle PMI italiane: costo quasi nullo, zero infrastruttura, ottima sull’italiano se usi i prompt giusti. Lo svantaggio è che è manuale e periodico — sei tu che lanci l’analisi quando ti serve. Per orientarti tra i modelli, abbiamo confrontato i migliori tool AI per piccole imprese nel 2026.

L’automazione (un flusso che prende le nuove recensioni e le fa analizzare via API) ha senso quando il volume è continuo e vuoi un alert se il sentiment peggiora. Richiede un minimo di setup tecnico; se vuoi capire la logica e gli strumenti, vedi la nostra panoramica su cosa conviene automatizzare in una PMI.

I tool dedicati (Wonderflow, Birdeye e simili) sono pensati per chi gestisce volumi grandi e costanti, magari su più sedi o più canali, e ha bisogno di dashboard, alert e report pronti per la direzione. Sono ottimi nel loro segmento, ma per una PMI con qualche centinaio di recensioni il rapporto costo/beneficio raramente regge: paghi una macchina industriale per un lavoro che l’AI generalista fa a venti euro al mese. È un classico caso da valutare con freddezza prima di firmare, per non finire nel tool overload.

Errori frequenti

Cose viste succedere, e come evitarle.

1. Un solo prompt per tutto. “Analizzami queste recensioni” produce un riassunto vago e inutilizzabile. Usa prompt mirati, uno per obiettivo. È la differenza tra un output che archivi e uno che usi.

2. Fidarsi dei numeri senza verificare. L’AI ti dice “18 recensioni menzionano la consegna lenta”. Bene: aprine tre. A volte ne conta una in più o in meno, a volte ci infila un sarcasmo. Su dataset piccoli, la verifica a campione costa due minuti e protegge da decisioni sbagliate.

3. Ignorare il sarcasmo. Già detto, ma è l’errore più costoso sull’italiano. Una stroncatura ironica classificata come lode ti fa credere che vada tutto bene su qualcosa che non funziona.

4. Confondere “chi recensisce” con “tutti i clienti”. Chi lascia una recensione è quasi sempre polarizzato: molto contento o molto deluso. La maggioranza silenziosa, quella tiepida, non scrive. Le recensioni sono un segnale prezioso ma parziale. Non leggerle come una fotografia dell’intera base clienti.

5. Fermarsi all’insight senza l’azione. “Il 30% si lamenta dei tempi di risposta” non è un risultato: è l’inizio. Il risultato è la decisione su cosa cambi, chi lo fa, entro quando. Senza la colonna “azione”, l’analisi è intrattenimento.

6. Caricare dati personali nello strumento sbagliato. Recensioni con nomi e dettagli in un account consumer che usa gli input per l’addestramento. Minimizza e usa una versione business con DPA.

7. Sovra-reagire a una singola recensione. Il senso di analizzare l’insieme è proprio smettere di farsi guidare dall’ultima stella bassa. Se un tema appare una volta su 300, è rumore, non segnale.

Quanto spesso rifarlo

Per la maggior parte delle PMI, un’analisi trimestrale è il ritmo giusto: abbastanza frequente da cogliere i cambiamenti, abbastanza distanziata da accumulare recensioni nuove a sufficienza tra un giro e l’altro. Fai un giro extra dopo eventi specifici — un cambio di fornitore, un nuovo prodotto, una modifica di prezzo, l’apertura di una sede — per misurarne l’effetto sul sentiment. Tieni i report dei vari trimestri: confrontarli nel tempo è dove l’analisi diventa davvero strategica, perché vedi se le azioni che hai preso hanno spostato qualcosa.

Domande frequenti

Quante recensioni servono come minimo? Sotto le 50, leggile a mano: è più veloce e più affidabile. Tra 50 e 500 l’AI generalista è ideale. La qualità dell’analisi dipende più dalla varietà delle recensioni che dal numero puro.

Posso usare la versione gratuita di ChatGPT o Claude? Tecnicamente sì per provare, ma per dati di clienti reali usa una versione business/enterprise o le API, che di norma non usano i tuoi input per l’addestramento e offrono un DPA. È una questione di GDPR, non solo di qualità.

L’AI capisce il dialetto e gli errori di battitura? In buona parte sì: i modelli recenti gestiscono italiano informale, abbreviazioni ed emoji meglio di quanto ci si aspetti. Ma “in buona parte” non è “sempre”: i casi ambigui vanno fatti marcare al modello e verificati a mano.

Posso analizzare recensioni in più lingue insieme? Sì, i modelli sono multilingua e possono normalizzare tutto in un report italiano. Specifica nel prompt che vuoi l’output in italiano anche per le recensioni in altre lingue, e chiedi di indicare la lingua originale delle citazioni.

Come evito che l’AI si inventi i dati? Tre regole nel prompt: chiedi citazioni testuali, vieta esplicitamente di inventare temi non presenti, imponi di segnalare i casi incerti invece di forzarli. Poi verifica a campione aprendo qualche recensione citata. La verifica umana resta parte del processo, non un optional.

Conviene un tool dedicato come Wonderflow o Birdeye? Solo se hai volumi alti e costanti, più sedi o più brand, e ti serve una dashboard con alert e report per la direzione. Per qualche centinaio di recensioni, l’AI generalista a 20€/mese fa lo stesso lavoro essenziale a una frazione del costo.

Le recensioni dei tuoi clienti sono già lì, scritte. Il lavoro non è procurarsele: è smettere di lasciarle morire in un foglio Excel. Con un’ora di lavoro a trimestre e i prompt giusti, una PMI italiana può fare quello che fino a poco fa era riservato a chi aveva un reparto dedicato.

Per inquadrare questa attività dentro una strategia AI più ampia — cosa automatizzare, su cosa investire, cosa lasciar perdere — parti dalla guida pratica all’AI per PMI 2026.