Microdati e analisi economica: quali potenzialità

L’importanza dell’analisi dei comportamenti micro per la conoscenza dei fenomeni aggregati

.

Pianificazione Internazionalizzazione Metodologie e Strumenti

Accedi con il tuo account per utilizzare le funzioni stampa migliorata (pretty print) e includi articolo (embed).
Non sei ancora registrato? registrati!

L’utilizzo di microdati rappresenta una frontiera dalle enormi potenzialità per l'analisi economica, dal momento che essi assicurano un insieme incredibilmente ricco di informazioni, per un approfondimento delle relazioni dei comportamenti singoli e aggregati.
I microdati sono infatti dati raccolti a livello di singola unità di osservazione, come individui, famiglie o aziende, e sono in grado di fornire informazioni granulari su vari aspetti delle unità osservate, descrivendone comportamenti e caratteristiche specifiche.
Questo avanzamento metodologico non solo migliora la robustezza teorica delle analisi economiche, ma offre anche strumenti pratici per la formulazione di politiche pubbliche più efficaci e mirate. I microdati rappresentano perciò un punto di frontiera in un quadro di evoluzione metodologico che trae radici lontane.

Dai modelli microfondati ai microdati

Nell’ambito dell’analisi economica, per molti anni gli economisti hanno sviluppato teorie per spiegare i fenomeni macroeconomici osservati. John Maynard Keynes, nel suo lavoro più celebre "Teoria generale dell'occupazione, dell'interesse e della moneta" (1936), ha elaborato una teoria che descrive la relazione tra il reddito e i consumi aggregati. Secondo questa teoria, il consumo aggregato può essere definito da una costante più una quota del reddito disponibile di una nazione. Se il reddito disponibile aumenta, i consumi aggregati tenderanno ad aumentare, ma non in proporzione diretta: solo una parte del reddito aggiuntivo verrà cioè consumata. Basandosi sulla semplice osservazione che le persone tendono a consumare solo una parte dell’aumento del reddito, Keynes osservò che tale quota è inferiore a uno. Questa relazione tra reddito e consumo è una componente cruciale della sua formulazione della teoria della domanda aggregata. Tuttavia, l’economista non si preoccupò di formalizzare esplicitamente la relazione tra comportamenti dei singoli agenti e osservazioni macro, ritenendo sufficiente la sua intuizione.

Negli anni successivi, questa semplificazione fu oggetto di molte critiche: negli anni '70, molti economisti conclusero che le relazioni macroeconomiche dovessero essere rigorosamente derivate dall'aggregazione delle relazioni microeconomiche dei singoli agenti. Tale dibattito sulla “microfondazione della macroeconomia” nasce e prosegue instancabilmente dalla celebre critica di Lucas (1976). Negli ultimi decenni del secolo scorso, nel mondo accademico divenne infatti regola non considerare valide le relazioni macroeconomiche che non fossero "microfondate". Ogni modello economico doveva contenere al suo interno il comportamento microeconomico degli agenti, derivati da un processo di aggregazione delle relazioni micro formulate su basi teoriche esplicite, chiare e razionali. La mancanza di dati micro imponeva una verifica delle ipotesi solo a livello macro, implicando che sia le ipotesi teoriche micro che quelle di aggregazione fossero sottoposte a verifica simultaneamente. Questo processo era indubbiamente complesso, ma era l'unico possibile prima dell'era dei microdati.

Con l'inizio del XXI secolo, lo sviluppo informatico e la crescente digitalizzazione hanno reso disponibili set crescenti di informazioni, permettendo di verificare empiricamente molte delle teorie economiche sviluppate nel corso dei decenni precedenti.

Il tema della segretezza statistica

Al crescere della disponibilità delle informazioni per singola unità di osservazione è cresciuta, in particolar modo nelle economie avanzate, l'importanza di tutelare l’anonimato e la riservatezza dei dati sensibili e delle informazioni individuali.
Questo per rispettare alcuni assunti cruciali legati alla raccolta e sistematizzazione di queste tipologie di informazioni: in primo luogo la necessità di non consentire l'identificazione degli individui o delle entità coinvolte, e in secondo luogo, la salvaguardia dell’integrità e della credibilità della ricerca scientifica.
La necessità di mantenere la segretezza statistica ha inizialmente limitato l'uso dei microdati al di fuori degli enti e delle organizzazioni in grado di fornire impegni formali di riservatezza. Tuttavia, tale vincolo rischiava di limitare l'uso dei microdati a un ristretto numero di enti, impedendo un uso più ampio, collettivo e una maggiore produzione di conoscenza.
Al fine di limitare i rischi e assicurare un’ampia diffusione, sono state implementate diverse metodologie in grado di garantire la segretezza statistica, consentendo di estrarre dall'uso dei microdati il massimo dell'informazione possibile.

Per contestualizzare meglio questo aspetto, si propone di seguito una disamina delle diverse metodologie utilizzate, focalizzando l'analisi su quelle elaborate per la salvaguardia della segretezza statistica delle imprese.

Metodologie utilizzate per garantire la segretezza statistica delle imprese

È possibile raccogliere le metodologie sviluppate in tre grandi aree:

  • Aggregazione per dimensione;
  • Micro-aggregazione;
  • Micro-aggregazione distribuita;
Aggregazione per dimensione

L'aggregazione per dimensione è il metodo più comune utilizzato dagli uffici statitici per garantire la segretezza delle informazioni. Si procede all’aggregazione dei record delle singole imprese o per settore di appartenenza, per regione di localizzazione, per numero di addetti o altre eventuali dimensioni di organizzazione dei dati.

Un caso particolarmente interessante sono i dati di import-export dichiarati dalle imprese. In questo caso le dimensioni considerate sono quattro: paese di origine, paese di destinazione, codice tariffario e mese della dichiarazione. Gli istituti di statistica aggregano i dati elementari prendendo in considerazione contemporaneamente le quattro le dimensioni, ottenendo una base dati "aggregata" relativa ai flussi commerciali che si originano da un paese verso specifici partner, riguardante merci classificate secondo una tariffa doganale in un dato mese dell'anno.
Prima della diffusione di tale base dati, gli istituti di statistica verificano inoltre che all'interno di ogni cella siano confluiti almeno tre osservazioni (c.d. “cella di frequenza minima”). In caso contrario, tale osservazione verrà riportata in riferimento al codice prodotto superiore.

Micro-aggregazione

Attraverso questa metodologia i dati relativi alle singole unità di rilevazione vengono sostituiti con quelli della media del cluster a cui l'unità di rilevazione appartiene.

Micro-aggregazione distribuita

In questa metodologia (Bartelsman, Haltiwanger e Scarpetta, 2004) si sostituiscono i dati elementari con informazioni relative alla loro distribuzione secondo la dimensione considerata. Generalmente la distribuzione è definita in termini di “momenti statistici ”, quali media , standard deviation e decili della distribuzione. Questa metodologia consente così di creare dataset sintetici che replicano le proprietà statistiche dei dati originali, senza rivelare informazioni individuali. Un esempio importante di tale metodologia è rappresentata dal 9th VINTAGE COMPNET DATASET sviluppato dal Competitiveness Research Network, che fornisce l'aggiornamento regolare di set di dati sulla competitività dei Paesi europei aggregati attraverso la metodologia micro-aggregata distribuita.

Conclusioni

I microdati sono una risorsa fondamentale per investigare e comprendere le leggi dell'economia, indispensabili per modellare e comprendere fenomeni complessi. La loro granularità consente infatti di sottoporre a verifica non solo le relazioni tra variabili macroeconomiche, ma anche quelle che la teoria ipotizza valere a livello di singolo agente economico. Tuttavia, l'uso dei microdati impone di preservare la segretezza statistica delle osservazioni elementari. Si tratta di un aspetto essenziale per proteggere la privacy degli individui e delle aziende e per garantire conformità legale ed etica nel loro utilizzo. Per soddisfare questa esigenza e, al contempo, consentire agli studiosi di sfruttare appieno le potenzialità dei microdati, sono state sviluppate metodologie specifiche di protezione dei dati.

La conoscenza e l'uso di queste metodologie sono fondamentali per chi vuole estrarre il massimo contenuto possibile dalla crescente disponibilità di dati economici. Integrando la segretezza statistica con tecniche avanzate di analisi dei microdati, i ricercatori possono ottenere intuizioni dettagliate e preziose. Questa combinazione di protezione dei dati e analisi avanzata permette di sfruttare pienamente le opportunità offerte dai microdati, contribuendo significativamente allo sviluppo della conoscenza e all'elaborazione di politiche basate su evidenze solide.