La piattaforma incentrata sul data warehouse (in seguito DWH) statistico offre molteplici soluzioni di analisi ed estrazioni dati. Parte delle soluzioni rimangono a stretto uso interno in quanto più mirate all’utilizzo di dati sensibili per drill-down specifici e basate anche su tecnologie proprietarie (es. GIS) non fruibili in ambiente aperto, mentre una componente pubblica è liberamente accessibile in ambiente web.
Le informazioni che alimentano la base dati DWH seguono il flusso disegnato nello schema. Le sorgenti dati possono essere di diversa natura: database, file in vari formati (principalmente testo e fogli di calcolo) oppure servizi web.
La raccolta dei dati è effettuata tramite delle procedure di extract tranform load (ETL) che, implementate con tecnologia Microsoft SQL Server Integration Services (SSIS), sono eseguite a scadenze regolari.
La presentazione e l’accesso ai dati sono affidati al sito internet statistica.lugano.ch.
La struttura del sistema è divisa in due macro aree: una interna di elaborazione e gestione del dato, e una esterna di presentazione e distribuzione, che per ragioni di sicurezza sono completamente separate.
La struttura della base dati DWH è organizzata in fatti, dimensioni e viste.
Definizioni
– fatto: entità che si intende analizzare (ad esempio gli abitanti);
– dimensione: attributo o caratteristica di uno o più fatti (per esempio l’età, lo stato civile,…);
– vista: aggregazione di un fatto con le sue dimensioni.
Esempi:
L’informazione – prima di essere caricata nella base dati – deve essere adeguata alla struttura del DWH, quindi l’indicatore d’interesse (fatto) deve essere messo in relazione alle sue caratteristiche (dimensioni) in modo da poter venir aggregato (vista). I vari passaggi di caricamento dati sono implementati con delle procedure ETL in forma di script transact-sql (T-SQL) e programmi VB.NET contenuti in package data transformation services (DTS).
Esempi:
Importante sottolineare come l’accesso ai dati statistici non avviene tramite servizi di collegamento a banche dati, bensì unicamente tramite files liberamente accessibili in formato json secondo il concetto di apertura dei dati pubblici statistici (OGD).
In sostanza tutto l’ambiente Web (applicazioni e dati) è completamente indipendente senza nessun collegamento con la parte operativa interna, garantendo massima sicurezza e protezione di dati sensibili. Tutti i dati alla base dei prodotti sono accessibili nella sezione Opendata, selezionabili per settore, anno e tipologia. Per ogni dato pubblicato sono specificate le descrizioni dei campi e fornito lo schema json come riferimento.
Interamente concepita e sviluppata dal Servizio di Statistica Urbana, la tecnologia utilizzata in ambito web consiste sostanzialmente di applicazioni/librerie in ambiente Javascript a cui sono integrate le librerie di rendering grafico di Highcharts.com. La scelta di Highcharts è motivata, oltre che dalla solidità del prodotto, anche per la sua grande flessibilità, ricchezza di prodotti e possibilità di estensione/personalizzazione.
Particolare attenzione è stata posta nello sviluppo di prodotti e componenti facilmente utilizzabili in qualsiasi contesto all’interno di pagine o articoli del nostro sito, permettendo di potere redarre facilmente testi, documenti o analisi minimizzando l’utilizzo di conoscenze di programmazione particolari.
Grafici di diverse tipologie o singoli indicatori possono venire facilmente inclusi in qualsiasi pagina per mezzo di un sistema di codifica html del prodotto.
Grafico dell’evoluzione totale delle notifiche di tassazione per l’anno di imposizione 2013, relativo al 31.12.2017, inclusa l’imposta mancante, senza titolo:
<div class="dwh-container" data-dwh='{"type":"con","year":2017,"month":13,"f":"contrib-evoluzione","mode":2,"mancante":true,"yeari":2015,"titles":false}'></div>
Grafico di ripartizione Uomini/Donne per tipologia di residenza e fasce d’età per l’anno 2019, trimestre 4 e quartiere 7 (Centro).
<div class="dwh-container" data-dwh='{"type":"cab","year":2019,"trim":4,"f":"demo-u-d-tipo","qid":7}'></div>
Testo che illustra alcuni elementi della popolazione del quartiere di Viganello
La popolazione al 31.12.2018 del quartiere di <strong>Viganello</strong> ammonta a <span class="dwh-container dwh-bold" data-dwh='{"type":"cab","year":2018,"trim":4,"f":"demo-counter","name":"abitanti","qid": 16}'></span> abitanti. Gli uomini sono <span class="dwh-container dwh-bold" data-dwh='{"type":"cab","year":2018,"trim":4,"f":"demo-counter","name":"uomini","qid": 16}'></span> e le donne <span class="dwh-container dwh-bold" data-dwh='{"type":"cab","year":2018,"trim":4,"f":"demo-counter","name":"donne","qid": 16}'></span>, per un'età media di <span class="dwh-container dwh-bold" data-dwh='{"type":"cab","year":2018,"trim":4,"f":"demo-counter","name":"etamedia","qid": 16}'></span> anni.
Gauge che illustra il valore dell’imposta mancante per l’anno fiscale 2015 al 31.12.2018:
<span class="dwh-container" data-dwh: {"type":"con","f":"contrib-gauge","name":"imp-mancante","year":2018,"month":12,"yeari":2015}></span>
Testo che illustra il reddito medio della popolazione del quartiere di Molino Nuovo al 31.12.2018 per l’anno fiscale 2015:
Reddito medio della popolazione del quartiere di Molino Nuovo per anno fiscale 2015 al 31.12.2018:<span class="dwh-container dwh-bold" data-dwh='{"type":"con","year":2018,"month":12,"yeari":2015,"f":"contrib-counter","name":"redditomedio","qid":12}'</span> Frs.