A proposito di analisi del DNA
Analisi del DNA, ovviamente in senso genealogico, non per scoprire i rischi "genetici" di essere portatori di malattie o di andare contro a disfunzioni.
Tra i vari sistemi on-line di gestione alberi genealogici ,oltre al sito personale, utilizzo MyHeritage.com. MyHeritage si è arricchito delle funzionalità relative all'analisi del DNA nell'anno 2016 con un bel pò di battage pubblicitario in merito, a chi risulta iscritto. Pur essendo attratto dall'analisi del DNA in generale, non nego che inizialmente non ho provato una forte attrazione per questo tipo di funzione... dubbi sulla validità, dubbi sulla reale capacità di analisi del laboratorio che sta dietro a MyHeritage, scarso valore dei risultati dal punto di vista della ricerca di cugini "lontani", ecc.ra.
Certo è, che a partire dal libro di Luca Luigi Cavalli Sforza e altri - Storia e geografia dei geni umani per passare a http://admixturemap.paintmychromosomes.com/ con in mezzo tutta una pletora di articoli scientifici sull'analisi genetica delle popolazioni, la voglia di conoscere qualcosa di più del proprio passato attraverso gli strumenti oggi disponibili è cresciuta.
Fino al momento in cui con una promozione, tutt'ora valida, ho acquistato il mio primo kit di analisi DNA sul sito MyHeritage.com. Prima di acquistarlo ho fatto alcune verifiche sul fatto che non fosse proprio solo una fregatura leggendo i vari commenti in giro per il web. Segnalo il sito: https://dnatestingchoice.com/ che permette di confrontare i vari test del DNA in funzione delle caratteristiche di ognuno. Segnalo che al momento dell'acquisto MyHeritage.com aveva un ranking migliore rispetto a quello che ha oggi (marzo - aprile 2017).
MyHeritage.com propone un'analisi dell'autosoma (cromosomi 1-22), cromosoma X, cromosoma Y in caso di soggetto di sesso maschile. Non è presente l'analisi del DNA mitocondriale (mtDNA). I risultati sono una stima di Etnia di appartenenza, un'analisi delle possibili corrispondenze di DNA con altri utenti MyHeritage, la possibilità di scaricare i dati in formato raw. Quest'ultima opzione è secondo me l'unica veramente importante!
Alcune considerazioni personali sui risultati:
- sul tempo di espletamento dell'analisi: risultati nei tempi indicati, ho ricevuto l'esito dell'analisi dal momento di arrivo dei campioni al laboratorio in circa 5 settimane;
- qualità della stima di etnia di appartenenza: mediocre tendente allo scarso, non è possibile vedere quali sono l'etnie che prendono in considerazione prima di avere i risultati, per cui possono esserci delle delusioni (troppa genericità) e per una piccola percentuale dovrei avere delle origini impossibili (per motivi storici e di separazione geografica pluri-millenaria)
- qualità della stima di corrispondenza con altre analisi DNA: funzione del tutto inutile..., molti siti di analisi del DNA mettono in guardia del fatto che non si possono fare analisi del DNA volte a stabilire il fatto di essere cugini... cioè i cugini di primo grado condividono solo il 12% del DNA, la probabilità di avere parti di DNA simili è più alta se dettata dal caso che dalla parte effettivamente in comune. Lo stesso sito nel caso delle poche corrispondenze trovate indica come molto scarsa la percentuale di DNA in comune (misurata in centiMorgan) e quindi della possibile parentela.
In definitiva l'algoritmo utilizzato per la stima di etnia e troppo generico e lasco, viene secondo me lasciato tutto al calcolo automatico e non vi è una vera e propria analisi da parte di un Data Scientist... altrimenti non sarebbero emerse delle cose impossibili storicamente e geograficamente, per quanto con una bassa percentuale, per cui comunque da prendere con una risata!!
La possibilità di scaricare i raw data dal sito fornisce invece un importante plus per questo tipo di test (consiglio vivamente di non scegliere test che non permettono tale funzione). I dati grezzi scaricati possono essere analizzati attraverso strumenti personali di analisi statistica e/o caricati su siti che ne permettono analisi ulteriori. Per le analisi statistiche personalmente uso R e/o Python e ho immediatamente caricato i miei dati grezzi per avviare qualche piccola ricognizione sui dati ma questa parte sarà analizzata in un articolo specifico.
Gli SNP analizzati sono 720.816, l'immagine seguente nè rappresenta la distribuzione:
Segnalo il seguente sito http://www.beholdgenealogy.com/blog/?p=2136 dove vengono comparate due analisi del DNA da due diversi vendors, seppure facenti riferimento al medesimo laboratorio.
L'appetito vien mangiando, per cui bisogna avviare una seconda analisi con altro vendor, questa volta della Gran Bretagna, lontano geograficamente dal precedente (Texas, U.S.A.) e con analisi specifiche su Y-DNA (linea paterna) e mtDNA (linea materna).
To be continued...