{"id":686,"date":"2021-02-01T05:00:00","date_gmt":"2021-02-01T04:00:00","guid":{"rendered":"https:\/\/ellycode.com\/?p=686"},"modified":"2021-05-07T16:40:55","modified_gmt":"2021-05-07T14:40:55","slug":"il-valore-dei-dati-nell-intelligenza-artificiale","status":"publish","type":"post","link":"https:\/\/ellycode.com\/it\/blog\/il-valore-dei-dati-nell-intelligenza-artificiale\/","title":{"rendered":"Il valore dei dati nell&#8217;Intelligenza Artificiale"},"content":{"rendered":"\n<p class=\"wp-block-paragraph\">Partiamo da una considerazione: le applicazioni software moderne estraggono sempre pi\u00f9 dati da fonti remote e, a loro volta, ne producono di nuovi. La persistenza non \u00e8 pi\u00f9 un problema: il Cloud ci offre uno spazio pressoch\u00e9 infinito a un costo accessibile.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Le applicazioni software nascono per risolvere un problema reale, ad esempio migliorare un ciclo produttivo. <strong>Pi\u00f9 dati abbiamo meglio possiamo analizzarli per scoprire strutture (pattern) nascoste che ci conducono sulla strada giusta<\/strong>. Il problema \u00e8 che questi pattern sono troppo complessi da trovare per l\u2019occhio umano. Questo \u00e8 il Machine Learning: uno strumento per trovare pattern e generare codice che ci aiuti a riconoscerli in nuovi dati, magari che stanno arrivando in tempo reale dalla nostra applicazione.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Ho scoperto il mondo dell\u2019analisi dei dati lungo il mio percorso di studio, che mi ha portato a partecipare in gruppi di ricerca presso il CERN di Ginevra a fine anni 90 alla <a href=\"https:\/\/cds.cern.ch\/record\/324550\/files\/ppe-97-033.pdf\" target=\"_blank\" rel=\"noreferrer noopener\">ricerca <\/a>del neutrino tau. Quell\u2019esperienza meravigliosa ha segnato definitivamente la mia concezione sulla natura dei dati e come vanno, per cos\u00ec dire, coltivati.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><strong>Il 2020 ci ha dimostrato come una massa enorme di dati riesca solo a generare confusione, lasciando spazio a qualsiasi tipo di interpretazione<\/strong>. Mi riferisco ovviamente al COVID-19: la mancanza di uniformit\u00e0 nella fase di raccolta complica non solo ogni possibile analisi ma anche una minima comprensione. Tuttavia questo comunque non ha limitato il numero di articoli caotici su giornali e siti web mondiali.<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img data-recalc-dims=\"1\" loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"631\" data-attachment-id=\"2413\" data-permalink=\"https:\/\/ellycode.com\/it\/blog\/il-valore-dei-dati-nell-intelligenza-artificiale\/attachment\/big-data-analysis-covid-19-1024x631-1-2\/\" data-orig-file=\"https:\/\/i0.wp.com\/ellycode.com\/wp-content\/uploads\/2021\/01\/Big-Data-Analysis-Covid-19-1024x631-1.jpg?fit=1024%2C631&amp;ssl=1\" data-orig-size=\"1024,631\" data-comments-opened=\"0\" data-image-meta=\"{&quot;aperture&quot;:&quot;0&quot;,&quot;credit&quot;:&quot;&quot;,&quot;camera&quot;:&quot;&quot;,&quot;caption&quot;:&quot;&quot;,&quot;created_timestamp&quot;:&quot;0&quot;,&quot;copyright&quot;:&quot;&quot;,&quot;focal_length&quot;:&quot;0&quot;,&quot;iso&quot;:&quot;0&quot;,&quot;shutter_speed&quot;:&quot;0&quot;,&quot;title&quot;:&quot;&quot;,&quot;orientation&quot;:&quot;0&quot;}\" data-image-title=\"Big-Data-Analysis-Covid-19-1024&amp;#215;631-1\" data-image-description=\"\" data-image-caption=\"\" data-large-file=\"https:\/\/i0.wp.com\/ellycode.com\/wp-content\/uploads\/2021\/01\/Big-Data-Analysis-Covid-19-1024x631-1.jpg?fit=1024%2C631&amp;ssl=1\" src=\"https:\/\/i0.wp.com\/ellycode.com\/wp-content\/uploads\/2021\/01\/Big-Data-Analysis-Covid-19-1024x631-1.jpg?resize=1024%2C631&#038;ssl=1\" alt=\"\" class=\"wp-image-2413\" srcset=\"https:\/\/ellycode.com\/wp-content\/uploads\/2021\/01\/Big-Data-Analysis-Covid-19-1024x631-1.jpg 1024w, https:\/\/ellycode.com\/wp-content\/uploads\/2021\/01\/Big-Data-Analysis-Covid-19-1024x631-1-980x604.jpg 980w, https:\/\/ellycode.com\/wp-content\/uploads\/2021\/01\/Big-Data-Analysis-Covid-19-1024x631-1-480x296.jpg 480w\" sizes=\"auto, (min-width: 0px) and (max-width: 480px) 480px, (min-width: 481px) and (max-width: 980px) 980px, (min-width: 981px) 1024px, 100vw\" \/><\/figure>\n\n\n\n<p class=\"wp-block-paragraph\"><strong>I dati vanno<\/strong> <strong>quindi raccolti seguendo un criterio certo<\/strong>: questo vuol dire assumersi anche la responsabilit\u00e0 di scartarne una parte. Nel caso di un sensore rotto pu\u00f2 essere una decisione semplice da prendere, ma laddove subentra il fattore umano\/politico il discorso cambia completamente. <\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Uno dei primi campi di studio della Statistica, stiamo parlando del diciottesimo secolo, \u00e8 stato il rapporto tra numero di maschi e numero di femmine alla nascita. Questo numero dovrebbe oscillare tra 1.03 e 1.06 maschi per ogni femmina; ogni volta che in qualche nazione questo numero \u00e8 aumentato significativamente a vantaggio dei maschi si \u00e8 poi scoperto un gravissimo problema sociale \/ politico.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Una volta deciso quale sia <strong>il campione \u201cbuono\u201d<\/strong> di dati parte la sua analisi. E anche qui possono nascondersi sorprese. Si arriva a un risultato e magari quel risultato \u00e8 sorprendente, se non rivoluzionario. Nel caso di un esperimento scientifico magari si scopre qualcosa di nuovo o si osserva ci\u00f2 che era stato previsto dalla teoria. Il fattore umano anche qui \u00e8 decisivo. Sale l\u2019entusiasmo, si cerca di contenerlo ripetendo le analisi. I risultati vengono confermati e allora si scrivono articoli, si concedono interviste. Poi, dopo un po\u2019 di tempo, si scopre un piccolo effetto sistematico in una delle componenti dell\u2019apparato sperimentale e tutti i risultati trovati svaniscono nel nulla. <\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Ricordo ad esempio quando fu annunciato da tutti i giornali del mondo (ad esempio <a href=\"https:\/\/www.repubblica.it\/scienze\/2011\/09\/22\/news\/neutrini_pi_veloci_della_luce_studio_italiano_supera_einstein-22085384\/\" target=\"_blank\" rel=\"noreferrer noopener\">qui<\/a>) che i neutrini viaggiavano a una velocit\u00e0 maggiore di quella della luce, in barba a quanto predetto da Einstein. Furono successivamente scoperte due anomalie: una nella calibrazione dell\u2019orologio di riferimento per calcolare il tempo di viaggio della particella, l\u2019altra, banalmente, nello stato del cavo che connette il sistema GPS a una scheda dei computer dell\u2019apparato sperimentale. Potete leggere le conseguenze di questa amara scoperta <a href=\"https:\/\/st.ilsole24ore.com\/art\/notizie\/2012-03-30\/dimette-fisico-flop-neutrini-122008.shtml\" target=\"_blank\" rel=\"noreferrer noopener\">qui<\/a>.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Cosa succede quando manca un qualsiasi fattore critico nell\u2019analisi dei risultati trovati da un algoritmo di Machine Learning? Quando non si prevede nessun meccanismo di controllo nell\u2019ingranaggio perfetto? Nella letteratura fantascientifica si \u00e8 coniato il termine <strong>\u201cghost in the machine\u201d<\/strong> per riferirsi al processo dell\u2019intelligenza artificiale che in maniera inaspettata evolve oltre i suoi scopi originali. <\/p>\n\n\n\n<figure class=\"wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio\"><div class=\"wp-block-embed__wrapper\">\n<span class=\"embed-youtube\" style=\"text-align:center; display: block;\"><iframe loading=\"lazy\" class=\"youtube-player\" width=\"1080\" height=\"608\" src=\"https:\/\/www.youtube.com\/embed\/DNWbm7g75SI?version=3&#038;rel=1&#038;showsearch=0&#038;showinfo=1&#038;iv_load_policy=1&#038;fs=1&#038;hl=it-IT&#038;autohide=2&#038;wmode=transparent\" allowfullscreen=\"true\" style=\"border:0;\" sandbox=\"allow-scripts allow-same-origin allow-popups allow-presentation allow-popups-to-escape-sandbox\"><\/iframe><\/span>\n<\/div><\/figure>\n\n\n\n<p class=\"wp-block-paragraph\">Non voglio evocare scenari alla Westworld, anche perch\u00e9 la realt\u00e0 quotidiana \u00e8 piena di esempi imbarazzanti sul malfunzionamento di assistenti di ogni marca e prezzo. Ci\u00f2 che deve farci riflettere, invece, \u00e8 che <strong>gli effetti sistematici, i \u201cbias\u201d negli scenari di network \u201csocial\u201d, possono produrre effetti imprevedibili e disastrosi<\/strong> come raccontato anche in questo caso dalle cronache dei giornali.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Voglio tenere un tono leggero e segnalarvi un <a href=\"http:\/\/www.tylervigen.com\/spurious-correlations\" target=\"_blank\" rel=\"noreferrer noopener\">sito web<\/a> dove si raccolgono bizzarre correlazioni del tutto casuali. Ad esempio, il numero di divorzi nel Maine col consumo pro capite di margarina:<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img data-recalc-dims=\"1\" loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"507\" data-attachment-id=\"1169\" data-permalink=\"https:\/\/ellycode.com\/it\/blog\/il-valore-dei-dati-nell-intelligenza-artificiale\/attachment\/schermata-2020-12-23-alle-14-50-28\/\" data-orig-file=\"https:\/\/i0.wp.com\/ellycode.com\/wp-content\/uploads\/2020\/12\/Schermata-2020-12-23-alle-14.50.28.png?fit=1932%2C956&amp;ssl=1\" data-orig-size=\"1932,956\" data-comments-opened=\"0\" data-image-meta=\"{&quot;aperture&quot;:&quot;0&quot;,&quot;credit&quot;:&quot;&quot;,&quot;camera&quot;:&quot;&quot;,&quot;caption&quot;:&quot;&quot;,&quot;created_timestamp&quot;:&quot;0&quot;,&quot;copyright&quot;:&quot;&quot;,&quot;focal_length&quot;:&quot;0&quot;,&quot;iso&quot;:&quot;0&quot;,&quot;shutter_speed&quot;:&quot;0&quot;,&quot;title&quot;:&quot;&quot;,&quot;orientation&quot;:&quot;0&quot;}\" data-image-title=\"Schermata-2020-12-23-alle-14.50.28\" data-image-description=\"\" data-image-caption=\"\" data-large-file=\"https:\/\/i0.wp.com\/ellycode.com\/wp-content\/uploads\/2020\/12\/Schermata-2020-12-23-alle-14.50.28.png?fit=1024%2C507&amp;ssl=1\" src=\"https:\/\/i0.wp.com\/ellycode.com\/wp-content\/uploads\/2020\/12\/Schermata-2020-12-23-alle-14.50.28.png?resize=1024%2C507&#038;ssl=1\" alt=\"\" class=\"wp-image-1169\" srcset=\"https:\/\/ellycode.com\/wp-content\/uploads\/2020\/12\/Schermata-2020-12-23-alle-14.50.28-980x485.png 980w, https:\/\/ellycode.com\/wp-content\/uploads\/2020\/12\/Schermata-2020-12-23-alle-14.50.28-480x238.png 480w\" sizes=\"auto, (min-width: 0px) and (max-width: 480px) 480px, (min-width: 481px) and (max-width: 980px) 980px, (min-width: 981px) 1024px, 100vw\" \/><\/figure>\n\n\n\n<p class=\"wp-block-paragraph\">Oppure il numero dottorati di ricerca in matematica con la quantit\u00e0 di uranio conservato presso gli impianti nucleari negli USA:<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img data-recalc-dims=\"1\" loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"521\" data-attachment-id=\"1172\" data-permalink=\"https:\/\/ellycode.com\/it\/blog\/il-valore-dei-dati-nell-intelligenza-artificiale\/attachment\/schermata-2020-12-23-alle-14-53-06\/\" data-orig-file=\"https:\/\/i0.wp.com\/ellycode.com\/wp-content\/uploads\/2020\/12\/Schermata-2020-12-23-alle-14.53.06.png?fit=1892%2C962&amp;ssl=1\" data-orig-size=\"1892,962\" data-comments-opened=\"0\" data-image-meta=\"{&quot;aperture&quot;:&quot;0&quot;,&quot;credit&quot;:&quot;&quot;,&quot;camera&quot;:&quot;&quot;,&quot;caption&quot;:&quot;&quot;,&quot;created_timestamp&quot;:&quot;0&quot;,&quot;copyright&quot;:&quot;&quot;,&quot;focal_length&quot;:&quot;0&quot;,&quot;iso&quot;:&quot;0&quot;,&quot;shutter_speed&quot;:&quot;0&quot;,&quot;title&quot;:&quot;&quot;,&quot;orientation&quot;:&quot;0&quot;}\" data-image-title=\"Schermata-2020-12-23-alle-14.53.06\" data-image-description=\"\" data-image-caption=\"\" data-large-file=\"https:\/\/i0.wp.com\/ellycode.com\/wp-content\/uploads\/2020\/12\/Schermata-2020-12-23-alle-14.53.06.png?fit=1024%2C521&amp;ssl=1\" src=\"https:\/\/i0.wp.com\/ellycode.com\/wp-content\/uploads\/2020\/12\/Schermata-2020-12-23-alle-14.53.06.png?resize=1024%2C521&#038;ssl=1\" alt=\"\" class=\"wp-image-1172\" srcset=\"https:\/\/ellycode.com\/wp-content\/uploads\/2020\/12\/Schermata-2020-12-23-alle-14.53.06-980x498.png 980w, https:\/\/ellycode.com\/wp-content\/uploads\/2020\/12\/Schermata-2020-12-23-alle-14.53.06-480x244.png 480w\" sizes=\"auto, (min-width: 0px) and (max-width: 480px) 480px, (min-width: 481px) and (max-width: 980px) 980px, (min-width: 981px) 1024px, 100vw\" \/><\/figure>\n\n\n\n<p class=\"wp-block-paragraph\">Uno dei capisaldi della statistica \u00e8 che la correlazione non implica la causalit\u00e0. A sua volta, una forte evidenza nei dati non implica necessariamente che quel segnale sia legato all\u2019effetto che stiamo ricercando. <a href=\"https:\/\/www.gwern.net\/Tanks\" target=\"_blank\" rel=\"noreferrer noopener\">Tempo fa<\/a>, l\u2019esercito degli Stati Uniti stava testando un algoritmo che cercasse la presenza di missili in un campione di foto. I risultati dei test su dei campioni di immagini scattate in Germania furono ottimi. Peccato che l\u2019algoritmo in realt\u00e0 stesse trovando alberi con qualche dettaglio di scarso rilievo di un missile. Lo stesso algoritmo non trovava nulla in immagini con missili scattate nel deserto oppure dava un falso positivo con una bicicletta in una foresta. Mi sa che non c\u2019era ancora TensorFlow!<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Si tratta solo di folklore? Cosa pu\u00f2 succedere se un algoritmo vaglia un certo numero di candidati a un\u2019assunzione analizzando il contenuto dei loro curriculum vitae e confrontandolo coi dati di chi ha lavorato in quell\u2019azienda negli ultimi 20 anni? Questo \u00e8 uno scenario di pura fantasia perch\u00e9 non voglio citare articoli senza fonti sicure. Basta una semplice ricerca per trovare decine di fonti sul bias razziale negli algoritmi di Machine Learning.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Mi rendo conto di aver insinuato molti dubbi ma ci\u00f2 \u00e8 solo positivo. Per citare una <a href=\"https:\/\/web.archive.org\/web\/20140908045019\/http:\/\/www.bratislavaguide.com\/radio-yerevan-jokes\">storica<\/a> battuta:<\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><strong><em>Domanda a  Radio Yerevan<\/em>: \u201cE&#8217; corretto che Grigori Grigorievich Grigoriev ha vinto una macchina di lusso durante la All-Union Championship a Mosca?\u201d<\/strong><\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><strong><em>Risposta di Radio Yerevan<\/em>: \u201cIn principio, si. Ma anzitutto, non era Grigori Grigorievich Grigoriev, bens\u00ec Vassili Vassilievich Vassiliev; in secondo luogo, non era alla All-Union Championship a Mosca, ma il Festival delle aziende agricole a Smolensk; terzo, non era un&#8217;auto ma una bicicletta; e quarto non l&#8217;aveva vinta ma gliel&#8217;avevano rubata.<\/strong><\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Sono entrato in Ellycode con la speranza di andare oltre il sensazionalismo che c\u2019\u00e8 dietro l\u2019AI e il Machine Learning. Con la consapevolezza che c\u2019\u00e8 tanto da fare e studiare ancora, ma che l\u2019opportunit\u00e0 \u00e8 troppo importante per lasciarsela sfuggire.<\/p>\n\n\n[et_pb_section global_module=\"1785\"][\/et_pb_section]\n","protected":false},"excerpt":{"rendered":"<p>Partiamo da una considerazione: le applicazioni software moderne estraggono sempre pi\u00f9 dati da fonti remote e, a loro volta, ne producono di nuovi. La persistenza non \u00e8 pi\u00f9 un problema: il Cloud ci offre uno spazio pressoch\u00e9 infinito a un costo accessibile. Le applicazioni software nascono per risolvere un problema reale, ad esempio migliorare un [&hellip;]<\/p>\n","protected":false},"author":195423236,"featured_media":2426,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_et_pb_use_builder":"","_et_pb_old_content":"","_et_gb_content_width":"","_coblocks_attr":"","_coblocks_dimensions":"","_coblocks_responsive_height":"","_coblocks_accordion_ie_support":"","_crdt_document":"","inline_featured_image":false,"_jetpack_newsletter_access":"","_jetpack_dont_email_post_to_subs":false,"_jetpack_newsletter_tier_id":0,"_jetpack_memberships_contains_paywalled_content":false,"_jetpack_memberships_contains_paid_content":false,"footnotes":"","jetpack_post_was_ever_published":false},"categories":[688637365],"tags":[],"class_list":["post-686","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-blog"],"jetpack_featured_media_url":"https:\/\/i0.wp.com\/ellycode.com\/wp-content\/uploads\/2021\/01\/1105x656_blog_Dati.png?fit=1105%2C656&ssl=1","jetpack_shortlink":"https:\/\/wp.me\/pcuDuD-b4","jetpack_sharing_enabled":true,"_links":{"self":[{"href":"https:\/\/ellycode.com\/it\/wp-json\/wp\/v2\/posts\/686","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/ellycode.com\/it\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/ellycode.com\/it\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/ellycode.com\/it\/wp-json\/wp\/v2\/users\/195423236"}],"replies":[{"embeddable":true,"href":"https:\/\/ellycode.com\/it\/wp-json\/wp\/v2\/comments?post=686"}],"version-history":[{"count":57,"href":"https:\/\/ellycode.com\/it\/wp-json\/wp\/v2\/posts\/686\/revisions"}],"predecessor-version":[{"id":3410,"href":"https:\/\/ellycode.com\/it\/wp-json\/wp\/v2\/posts\/686\/revisions\/3410"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/ellycode.com\/it\/wp-json\/wp\/v2\/media\/2426"}],"wp:attachment":[{"href":"https:\/\/ellycode.com\/it\/wp-json\/wp\/v2\/media?parent=686"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/ellycode.com\/it\/wp-json\/wp\/v2\/categories?post=686"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/ellycode.com\/it\/wp-json\/wp\/v2\/tags?post=686"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}