{"id":1063,"date":"2021-11-12T12:05:11","date_gmt":"2021-11-12T11:05:11","guid":{"rendered":"https:\/\/www.dodigital.it\/?p=1063"},"modified":"2022-05-17T10:50:38","modified_gmt":"2022-05-17T08:50:38","slug":"data-governance-nei-team-di-data-science","status":"publish","type":"post","link":"https:\/\/www.dodigital.it\/en\/data-governance-nei-team-di-data-science\/","title":{"rendered":"Data Governance &#038; Data Science"},"content":{"rendered":"<h2>Sommario:<\/h2>\n<ul>\n<li><a href=\"#inizio\">Agile e valorizzazione del dato: lo scenario attuale<\/a><\/li>\n<li><a href=\"#inizio1\">Perch\u00e9 l&#8217;approccio Agile?<\/a><\/li>\n<li><a href=\"#inizio2\">Perch\u00e9 la Data Governance?<\/a><\/li>\n<li><a href=\"#inizio3\">Implementazione di una Data Platform: il caso<\/a><\/li>\n<li><a href=\"#inizio4\">Problematiche esistenti<\/a><\/li>\n<li><a href=\"#inizio5\">La soluzione &#8211; il framework di Data Governance<\/a><\/li>\n<li><a href=\"#inizio6\">L&#8217;approccio Agile nel framework di Data Governance<\/a><\/li>\n<li><a href=\"#inizio7\">Il risultato<\/a><\/li>\n<li><a href=\"#inizio8\">Conclusioni<\/a><\/li>\n<\/ul>\n<p><a name=\"inizio\"><\/a><\/p>\n<h2>Agile e valorizzazione del dato: lo scenario attuale<\/h2>\n<p>Le pratiche di <strong>sviluppo Agile<\/strong> stanno (finalmente) prendendo piede anche in Italia nonostante l\u2019inerzia di molte organizzazioni sia stata un freno rilevante negli ultimi anni e, parallelamente, l\u2019attenzione delle aziende italiane per i <strong>progetti di valorizzazione dati<\/strong> sta aumentando grazie alla maggior consapevolezza delle potenzialit\u00e0 di utilizzo degli asset Dati.<\/p>\n<p>A titolo esemplificativo, nonostante il 2020 sia stato chiaramente un anno di rallentamento in termini di investimenti per le imprese, <strong>il 96% delle grandi aziende italiane<\/strong> <strong>dichiara di aver avviato o portato avanti investimenti<\/strong> (interni o esterni) <strong>in ambito Data Management &amp; Analytics<\/strong> e che <strong>lo sviluppo di progettualit\u00e0 di Advanced Analytics risulta essere prioritario per il 61% di esse <\/strong>.<\/p>\n<p>E sono proprio questo tipo di progettualit\u00e0 il motivo per cui, nelle grandi organizzazioni, team che al loro interno hanno <strong>competenze dedicate alla valorizzazione dell\u2019asset dati in azienda<\/strong> sono sempre pi\u00f9 presenti.<\/p>\n<p><a name=\"inizio1\"><\/a><\/p>\n<h2>Perch\u00e9 l&#8217;approccio Agile?<\/h2>\n<p>Viste le caratteristiche di questo tipo di progetti, <strong>Agile pu\u00f2 essere una leva per garantire efficacia ed efficienza al team<\/strong>. Si tratta, infatti, di progetti caratterizzati da componenti di incertezza elevate rispetto sia ai requisiti iniziali, sia alle soluzioni tecniche e tecnologiche che dovranno essere implementate da parte del team per il raggiungimento degli obiettivi di business.<\/p>\n<p>In questi contesti, infatti, l\u2019approccio <strong>Agile<\/strong> porta il team a sforzarsi nella divisione del lavoro in attivit\u00e0 di minore dimensione, prioritizzate rispetto al valore generato e su cui si ricevono feedback tempestivi.<\/p>\n<p><a name=\"inizio2\"><\/a><\/p>\n<h2>Perch\u00e9 la Data Governance?<\/h2>\n<p>Parallelamente, l\u2019<strong>utilizzo sempre pi\u00f9 evoluto dell\u2019asset dati<\/strong> all\u2019interno delle imprese sta facendo crescere l\u2019attenzione per un\u2019altra tematica fondamentale: la <strong>Data Governance<\/strong>. La definizione e l\u2019adozione di un framework di Data Governance, infatti, permette di definire flussi di lavoro e politiche di gestione dei dati a 360\u00b0.\u00a0Mettendo il dato al centro dei processi aziendali, siano essi processi <strong>business-as-usual<\/strong> o rivolti all\u2019<strong>innovazione<\/strong>.<\/p>\n<p>Andando a definire le modalit\u00e0 con cui l\u2019azienda si prende cura dei suoi dati, la <strong>Data Governance<\/strong> permette di garantire all\u2019azienda l\u2019utilizzo di dati di qualit\u00e0, coerenti e tempestivi ad utenti e processi di business.<\/p>\n<p>Un <strong>framework di Data Governance<\/strong> permette anzitutto di definire le responsabilit\u00e0 rispetto alla gestione del dato, ovvero quali sono le figure interne all\u2019organizzazione che garantiscono, in prima battuta, la copertura di alcuni obiettivi fondamentali:<\/p>\n<ul>\n<li>Conoscenza aggiornata dei <strong>data asset posseduti dall\u2019azienda<\/strong><\/li>\n<li>Garanzia di <strong>accessibilit\u00e0 e usabilit\u00e0 del dato<\/strong><\/li>\n<li>Monitoraggio della <strong>qualit\u00e0<\/strong><\/li>\n<li>Garanzia di <strong>sicurezza ed utilizzo corretto dei dati<\/strong><\/li>\n<\/ul>\n<p>Ovviamente, il raggiungimento di questi obiettivi dipende da attivit\u00e0 di <strong>Data Governance<\/strong> (pianificazione, esecuzione, monitoraggio) effettuate lungo tutto il ciclo di vita del dato, ed i progetti di cui si occupano i <strong>team di Data Science<\/strong> offrono un ottimo punto di partenza.<\/p>\n<p><a name=\"inizio3\"><\/a><\/p>\n<h2>Implementazione di una Data Platform: il caso<\/h2>\n<p>In una recente esperienza progettuale, ho avuto l\u2019opportunit\u00e0 di supportare, in un percorso di definizione ed attuazione di un framework di Data Governance, una <strong>multiutility leader in Italia<\/strong> che sta investendo nella valorizzazione dei molteplici data asset di cui dispone.<\/p>\n<p>Nel 2018, in azienda \u00e8 emersa evidente la necessit\u00e0 di avere a disposizione una <strong>piattaforma di gestione dati<\/strong> moderna. Dopo uno studio iniziale per definire le componenti principali, \u00e8 stata avviata la realizzazione pilota di una <strong>Data Platform a supporto della direzione commerciale<\/strong> realizzata su datacenter proprietario, ma gi\u00e0 nel 2019, il perimetro \u00e8 stato esteso a tutte le direzioni aziendali e ad inizio 2020 la piattaforma \u00e8 stata <strong>completamente migrata su infrastruttura Public Cloud<\/strong>.<\/p>\n<p>La <strong>Data Platform<\/strong> consente di avere disponibili in un unico spazio tutti i dati raccolti dalle varie fonti alimentanti, permettendo alle Business Unit di potere realizzare <strong>soluzioni di reportistica e di intelligenza artificiale per supportare le decisioni di business<\/strong> beneficiando di tutti i dati a disposizione. Inoltre, qualsiasi dato non ancora presente pu\u00f2 essere integrato in caso di necessit\u00e0, in modo da renderlo disponibile per ogni altra applicazione che lo richieda.<\/p>\n<p>La crescente disponibilit\u00e0 di dati ha permesso di aumentare considerevolmente la velocit\u00e0 con cui i <strong>modelli di machine learning<\/strong> vengono sviluppati.<\/p>\n<p>Questi modelli vengono sviluppati da un team di Data Scientists interno che, vista la natura di questi progetti, ha deciso di adottare un <strong>approccio Agile SCRUM-based<\/strong>.\u00a0I team sono organizzati in <strong>\u201cstanze\u201d di lavoro<\/strong>, gestite in modo iterativo ed incrementale e ogni \u201cstanza\u201d generalmente composta da un <strong>Product Owner di business<\/strong>, uno <strong>Scrum Master<\/strong>, due <strong>Data Scientist<\/strong> e un <strong>Data Engineer<\/strong>.<\/p>\n<p>Una volta creato un <strong>PoC<\/strong> di modello affinato e dopo averne testata l\u2019efficacia, questo viene trasferito al <strong>dipartimento IT<\/strong> che si occupa della sua \u201cindustrializzazione\u201d e del deploy del servizio a beneficio degli utenti.<\/p>\n<p><a name=\"inizio4\"><\/a><\/p>\n<h2>Problematiche esistenti<\/h2>\n<p>Durante il 2019, per\u00f2, sia durante le attivit\u00e0 progettuali di sviluppo che all\u2019adozione di alcuni dei casi d\u2019uso sviluppati sulla piattaforma, erano emerse alcune problematiche che l\u2019azienda ha ritenuto derivanti da una <strong>mancata definizione e applicazione di un Framework di Data Governance strutturato<\/strong>.<\/p>\n<p>Ad esempio, dopo alcuni mesi dopo lo sviluppo (PoC) di uno specifico modello che faceva uso di <strong>dati provenienti dai contatori elettrici<\/strong>, al momento del test del servizio \u201cindustrializzato\u201d, gli utenti finali hanno rilevato una anomalia negli output del modello. Dopo attenta analisi, \u00e8 emerso che uno dei dati utilizzati dai modelli, ovvero la potenza installata del cliente elettrico (dato proveniente dal <strong>Sistema Informativo Integrato<\/strong> &#8211; Autorit\u00e0), non era popolato in piattaforma, causando l\u2019anomalia.<\/p>\n<p>In un altro caso, invece, l\u2019eliminazione di alcune tabelle all\u2019interno della <strong>Data Platform<\/strong> da parte di un gruppo di lavoro, ha avuto conseguenze su altri modelli gi\u00e0 in fase di affinamento, portando ad una serie di rework imprevisti.<\/p>\n<p><a name=\"inizio5\"><\/a><\/p>\n<h2>La soluzione &#8211; il framework di Data Governance<\/h2>\n<p>Per prevenire questi ed altri inconvenienti, si \u00e8 deciso di sviluppare un <strong>framework di Data Governance<\/strong> che coinvolgesse tutti gli attori necessari per passare <strong>dalla definizione di un caso d\u2019uso di machine learning all\u2019industrializzazione del servizio di business<\/strong> basato su di esso.<\/p>\n<p>All\u2019interno di questi progetti, i<strong> team delle stanze<\/strong> hanno un ruolo fondamentale rispetto alla Data Governance poich\u00e9 \u00e8 proprio durante la stanza che, ad esempio, si:<\/p>\n<ul>\n<li><strong>definiscono le entit\u00e0 di business<\/strong> che devono essere utilizzate per supportare il modello<\/li>\n<li><strong>verifica o definisce il significato<\/strong> che quelle entit\u00e0 di business (e i relativi attributi) hanno<\/li>\n<li><strong>verificano eventuali vincoli<\/strong> all\u2019utilizzo dei dati (es. GDPR)<\/li>\n<li><strong>verificano la provenienza e le modalit\u00e0 di acquisizione<\/strong> dei dati<\/li>\n<\/ul>\n<p>e\u00a0questo spesso avviene in modo <strong>iterativo<\/strong> ed <strong>incrementale<\/strong>.<\/p>\n<p><a name=\"inizio6\"><\/a><\/p>\n<h2>L&#8217;approccio Agile nel framework di Data Governance<\/h2>\n<p>E\u2019 risultato fondamentale, quindi, definire e formalizzare alcune <strong>attivit\u00e0 di Data Governance<\/strong> che le differenti figure coinvolte in questa fase si sarebbero dovute prendere in carico, facendole diventare a tutti gli effetti parte della DoD (Definition of Done) di alcune attivit\u00e0 oppure incorporandole direttamente all\u2019interno del backlog della stanza.<\/p>\n<p>Molte di queste attivit\u00e0 prevedono l\u2019attivazione di <strong>ruoli di Data Governance<\/strong> esterni alla stanza, coinvolgendoli nel momento giusto all\u2019interno dei cicli di sviluppo, ed \u00e8 stato deciso di assegnare questo tipo di responsabilit\u00e0 allo <strong>Scrum Master<\/strong>, in virt\u00f9 del suo ruolo di facilitatore ed attivatore.<\/p>\n<p>Altre attivit\u00e0 maggiormente legate allo sviluppo della soluzione, ad esempio la <strong>documentazione dei flussi dati predisposti<\/strong> necessari alla stanza, sono state demandate al team di sviluppo (Data Scientist o Data Engineer) a seconda della loro natura. Inoltre, per garantire che non vadano perse le informazioni sulla storia e sulle evoluzioni del modello sviluppato, e delle relative logiche alimentati, si \u00e8 deciso di creare una figura di stewardship ad-hoc che garantisca continuit\u00e0 nel tracciare questo tipo di informazione.<\/p>\n<p>Come gi\u00e0 menzionato, il framework di Data Governance non ha coinvolto solo i team delle stanze, ma anche tutto il resto dell\u2019azienda, a livello sia di <strong>figure business<\/strong>\u00a0per quanto riguarda la <strong>semantica dei dati<\/strong>, sia di <strong>figure IT<\/strong>, maggiormente focalizzate sugli <strong>aspetti tecnici della Data Governance<\/strong>.<\/p>\n<p><a name=\"inizio7\"><\/a><\/p>\n<h2>Il risultato<\/h2>\n<p>Dopo qualche mese di progetto pilota, durante il quale sono stati affinati sia il modello che alcune delle procedure operative, il framework \u00e8 stato esteso a tutta la piattaforma, arrivando a coinvolgere pi\u00f9 di 100 persone all\u2019interno dell\u2019organizzazione.<\/p>\n<p>I<strong> team di Data Science<\/strong>, a fronte di un maggior impegno richiesto loro all\u2019interno della stanza, hanno beneficiato della presenza di documentazione sui dati presenti in <strong>piattaforma standardizzata ed aggiornata regolarmente<\/strong> , rendendo molto pi\u00f9 rapidi processi quali l\u2019identificazione dei corretti interlocutori di business per la validazione semantica delle informazioni e l\u2019accesso alla documentazione tecnica relativa alle trasformazioni subite dal dato prima di arrivare in piattaforma (<strong>Data Lineage<\/strong>).<\/p>\n<p>In questo modo \u00e8 stato possibile rendere pi\u00f9 efficiente ed efficace il lavoro delle stanze sin dalle prime iterazioni.<\/p>\n<p><a name=\"inizio8\"><\/a><\/p>\n<h2>Conclusioni<\/h2>\n<p>Questa esperienza conferma che \u00e8 possibile (oltre che necessario) far coesistere framework a prima vista lontani dalle logiche <strong>Agile<\/strong> con modalit\u00e0 di lavoro basate si questi principi. Sicuramente non \u00e8 sempre semplice ed \u00e8 necessario scendere a \u201ccompromessi\u201d da entrambi i punti di vista, ma con un&#8217;attenta osservazione delle dinamiche organizzative ed un approccio iterativo si riescono a raggiungere ottimi risultati.<\/p>\n<p>&nbsp;<\/p>\n<p>Autore:<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"alignnone wp-image-1019\" src=\"https:\/\/www.dodigital.it\/wp-content\/uploads\/2021\/10\/Icona_GN.png\" alt=\"\" width=\"61\" height=\"61\" srcset=\"https:\/\/www.dodigital.it\/wp-content\/uploads\/2021\/10\/Icona_GN.png 202w, https:\/\/www.dodigital.it\/wp-content\/uploads\/2021\/10\/Icona_GN-150x150.png 150w\" sizes=\"auto, (max-width: 61px) 100vw, 61px\" \/><b><a href=\"https:\/\/www.linkedin.com\/in\/giulio-nicelli-36955628\/\">Giulio Nicelli<\/a><\/b><\/p>\n<p>Partner doDigital e Practice Leader dell\u2019area Sistemi Informativi ed IT Governance, supporta le organizzazioni nell&#8217;approcciare i temi del digitale in modo strategico e sostenibile. Poich\u00e9 ritiene che Agile e Data Governance siano, all\u2019interno di questi percorsi, ingredienti fondamentali per le aziende di oggi e di domani, il suo lavoro \u00e8 mirato affinch\u00e9 diventino parte della cultura organizzativa.<br \/>\nIn parallelo con l\u2019attivit\u00e0 consulenziale, collabora con il Politecnico di Milano e la sua School of Management (MIP) svolgendo attivit\u00e0 di docenza e di ricerca.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Sommario: Agile e valorizzazione del dato: lo scenario attuale Perch\u00e9 l&#8217;approccio Agile? Perch\u00e9 la Data Governance? Implementazione di una Data Platform: il caso Problematiche esistenti La soluzione &#8211; il framework di Data Governance L&#8217;approccio Agile nel framework di Data Governance Il risultato Conclusioni Agile e valorizzazione del dato: lo scenario attuale Le pratiche di sviluppo [&hellip;]<\/p>\n","protected":false},"author":3,"featured_media":1073,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[9],"tags":[47,35],"industries":[],"services":[82],"applicativi":[],"class_list":["post-1063","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-news","tag-agile","tag-it-governance","services-data-strategy-data-governance"],"_links":{"self":[{"href":"https:\/\/www.dodigital.it\/en\/wp-json\/wp\/v2\/posts\/1063","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.dodigital.it\/en\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.dodigital.it\/en\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.dodigital.it\/en\/wp-json\/wp\/v2\/users\/3"}],"replies":[{"embeddable":true,"href":"https:\/\/www.dodigital.it\/en\/wp-json\/wp\/v2\/comments?post=1063"}],"version-history":[{"count":9,"href":"https:\/\/www.dodigital.it\/en\/wp-json\/wp\/v2\/posts\/1063\/revisions"}],"predecessor-version":[{"id":1075,"href":"https:\/\/www.dodigital.it\/en\/wp-json\/wp\/v2\/posts\/1063\/revisions\/1075"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.dodigital.it\/en\/wp-json\/wp\/v2\/media\/1073"}],"wp:attachment":[{"href":"https:\/\/www.dodigital.it\/en\/wp-json\/wp\/v2\/media?parent=1063"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.dodigital.it\/en\/wp-json\/wp\/v2\/categories?post=1063"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.dodigital.it\/en\/wp-json\/wp\/v2\/tags?post=1063"},{"taxonomy":"industries","embeddable":true,"href":"https:\/\/www.dodigital.it\/en\/wp-json\/wp\/v2\/industries?post=1063"},{"taxonomy":"services","embeddable":true,"href":"https:\/\/www.dodigital.it\/en\/wp-json\/wp\/v2\/services?post=1063"},{"taxonomy":"applicativi","embeddable":true,"href":"https:\/\/www.dodigital.it\/en\/wp-json\/wp\/v2\/applicativi?post=1063"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}