CROMOSOMA Y
cromosomi Y di un ampio numero di maschi sardi, utilizzando un pannello di polimorfismi a singolo nucleotide (SNPs) neutrali e di short tandem repeats 13 (STRs), altresì noti come microsatelliti, dislocati nella porzione non ricombinante, oggi definita porzione specifica del maschio (MSY), di tale cromosoma. Infatti, questo cromosoma per il 95% della sua lunghezza non dà luogo a fenomeni di ricombinazione con il suo omologo, il cromosoma X. L'assenza di ricombinazione contribuisce a trasformare il cromosoma Y in un vero e proprio superlocus genetico, capace di riflettere la storia dei maschi, conservando così una traccia del cammino evolutivo percorso dalla nostra specie dalle origini fino ad oggi. Inoltre, il suo stato aploide, la sua assenza nelle femmine e la sua trasmissione paterlineare hanno importanti conseguenze nella genetica di popolazione. Per queste caratteristiche il cromosoma Y si configura come il sistema più sensibile alla deriva genica la quale, di per sé, rappresenta un’ulteriore fonte di variabilità. 14 I marcatori testati sono assai utili ai fini delle analisi comparative poiché essi non sono esplicitamente attaccati dalle forze evoluzionistiche legate alla risposta immune contro gli agenti patogeni. La natura non ricombinante di questa porzione del cromosoma Y, così come la disponibilità di un orologio molecolare affidabile, “tarato” su tassi di mutazione definiti degli STRs, conduce ad una ricostruzione cronologica della genealogia degli aplotipi Y, quando questi differenti tipi di marcatori vengano analizzati congiuntamente [12-15]. Alcuni lavori, basati sullo studio di questo cromosoma, hanno riportato un certo grado di micro-eterogeneità nella popolazione sarda, soprattutto in conseguenza del confronto tra aree ad estensione piuttosto limitata e villaggi isolati [16-19].
Aplotipo Il termine deriva dal greco haplóos che in parole composte dotte o scientifiche significa ‘singolo’ o ‘semplice’. Combinazione di varianti alleliche lungo un cromosoma o segmento cromosomico contenente loci in linkage disequilibrium, cioè strettamente associati tra loro. L'associazione statistica tra loci si manifesta in assenza di ricombinazione tra i loci stessi. Per quanto riguarda gli autosomi (cromosomi non sessuali) e le regioni pseudoautosomiche dei cromosomi sessuali questo può essere dovuto alla vicinanza fisica tra i loci considerati e all'assenza di hot-spot di ricombinazione tra loro. Invece gli alleli della regione non ricombinante del cromosoma Y (NRY) sono sempre associati a formare aplotipi, così come gli alleli del genoma mitocondriale (mtDNA). Infatti queste due porzioni del genoma non ricombinano, essendo ereditate con modalità uniparentali, paterna la prima, materna la seconda. Aplotipi differenti sono generati da un aplotipo ancestrale per effetto della mutazione ai singoli loci. I prodotti di questo meccanismo evolutivo possono essere correlati attraverso la filogenesi fino a desumere la forma ancestrale dell'aplotipo. Spesso, quando la risoluzione molecolare di un aplotipo è molto elevata, può essere utile raggruppare filogeneticamente aplotipi diversi sulla base di un comune progenitore definendo così un aplogruppo. Applicazioni della tipizzazione aplotipica
L'analisi degli aplotipi in linkage disequilibrium costituisce uno strumento importante per il mappaggio genetico ad alta risoluzione. Gruppi di aplotipi tra loro affini evolutivamente costituiscono aplogruppi. Gli aplogruppi della regione non ricombinante del cromosoma Y (NRY) e quelli del DNA mitocondriale (mtDNA) sono particolarmente significativi in studi di filogenesi, tassonomia ed evoluzione. La conoscenza degli aplotipi HLA è coinvolta nel rigetto dei trapianti e nella valutazione del rischio genetico di suscettibilità ad alcune patologie autoimmuni (diabete, celiachia).
Polimorfismo a singolo nucleotide Un polimorfismo a singolo nucleotide (spesso definito in inglese Single Nucleotide Polymorphism o SNP, pronunciato snip) è un polimorfismo (cioè una variazione a livello di una sequenza di acidi nucleici) che si presenta tra individui della stessa specie, caratterizzata da una differenza a carico di un unico nucleotide. Ad esempio, se le sequenze individuate in due pazienti sono AAGCCTA e AAGCTTA, è presente un SNP che differenzia i due alleli C e T. Frequenza degli SNPs All'interno di una popolazione è possibile determinare una minor frequenza allelica, il rapporto tra la frequenza della variante più rara e quella più comune di un determinato SNP. Solitamente si guarda con maggiore attenzione a SNPs aventi minor frequenza allelica minore all'1%, trascurando nelle analisi la maggior parte degli SNPs che, anche per il loro elevatissimo numero, risultano poco maneggevoli. È importante notare che possono esistere variazioni notevoli tra popolazioni umane. Uno SNP molto comune in determinato gruppo etnico può dunque essere molto raro in un'altra popolazione. Gli SNPs possono presentarsi all'interno di una sequenza codificante di un gene, all'interno di una regione intronica o in una regione intergenica. Gli SNPs all'interno di un gene, in ogni caso, non necessariamente modificano la sequenza aminoacidica codificata, dal momento che il codice genetico è degenerato. Uno SNP che genera in tutte le sue forme lo stesso peptide è detto sinonimo (synonymous); in caso contrario è detto non-sinonimo (nonsynonymous). Gli SNPs che non si trovano in una sequenza codificante possono, in ogni caso, presentare sequenze negative sullo splicing o sul legame dei fattori di trascrizione. Gli SNPs costituiscono il 90% di tutte le variazioni genetiche umane. SNPs con minor frequenza allelica pari a circa l'1% sono presenti ogni circa 100-300 paia di basi lungo l'intero genoma. In media, due SNPs su tre vedono una variazione tra citosina e timina. Potenzialità degli SNPs Lo studio degli SNPs è molto utile poiché variazioni anche di singoli nucleotidi possono influenzare lo sviluppo delle patologie o la risposta ai patogeni, agli
agenti chimici, ai farmaci. Per tale motivo gli SNPs possono avere una grande importanza nello sviluppo di nuovi farmaci e nella diagnostica, in quanto consentono di conoscere l'effetto che può avere un farmaco su un individuo ancor prima della somministrazione, attraverso uno screening degli SNPs presenti nel gene responsabile della metabolizzazione del farmaco stesso; queste sono le basi della farmacogenomica. Dal momento che gli SNPs sono perlopiù ereditati di generazione in generazione, essi vengono utilizzati in alcuni studi genetici. Individuazione degli SNPs Un metodo utile per individuare gli SNPs è la valutazione dei cosiddetti restriction fragment length polymorphisms (polimorfismi di lunghezza dei frammenti di restrizione, o RFLP). Se un allele contiene un sito di riconoscimento per un enzima di restrizione e un altro no, la digestione dei due alleli genererà due frammenti di dimensione differente. In realtà oggi gli SNPs sono studiati principalmente attraverso i microarrays, che permettono l'analisi simultanea di centinaia di diversi SNPs e una veloce analisi elaborata da un computer.
Aplogruppi del cromosoma Y
Principali aplogruppi del cromosoma Y (lettere A-R) correlati filogeneticamente in un albero. MRCA = Most Recent Common Ancestor
In Genetica umana, gli aplogruppi del cromosoma Y sono raggruppamenti di combinazioni di marcatori (aplotipi) definiti dalle differenze nella regione nonricombinante del DNA del cromosoma Y (chiamato NRY da Non-Recombining Ychromosome). Queste differenze fanno riferimento a polimorfismi biallelici (SNPs, Single Nucleotide Polymorphisms). Il YCC (Y Chromosome Consortium) ha stabilito un sistema per definire gli aplogruppi del cromosoma Y basato sulle lettere da A a R, con ulteriori divisioni usando numeri e lettere in pedice. Il cromosoma Y ancestrale (scherzosamente definito dagli studiosi "di Adamo") è quello appartenuto a un maschio teorico che rappresenta il più recente progenitore comune (MRCA Most Recent Common Ancestor) di tutti i maschi attuali lungo la linea patrilineare, visto che il cromosoma Y è unicamente trasmesso dal padre ai figli maschi. La stima di quando questo individuo teorico sia vissuto varia a seconda degli studi. Aplogruppi A e B In nessuna parte del mondo sono stati trovati lignaggi del cromosoma Y più antichi di 200.000 anni. Gli aplogruppi A e B sono considerati i più antichi e si trovano soltanto nell'Africa Sub-Sahariana o in popolazioni con la stessa origine, come per esempio gli Afroamericani portati oltreoceano con la tratta degli schiavi. Le frequenze più importanti di A si trovano tra i Boscimani, i Khung e i Sudanesi. Le frequenze più elevate di B tra i Pigmei Biaka e Mbuti. Come si evince dall'albero filogenetico degli aplogruppi del cromosoma Y, tutta la diversità moderna si è generata in Africa, per cui le popolazioni contemporanee sono discendenti degli Africani che restarono in Africa o di quelle popolazioni che emigrarono fuori dall'Africa per popolare il resto dei continenti. La prima biforcazione dal tipo ancestrale teorico (di Adamo) deriva dalla mutazione M91 che definisce l'aplogruppo A (dal quale derivano A1, A2 e A3). Tutti gli altri aplogruppi derivano da BR (noto anche come YxA, che significa: tutti i cromosomi Y che non appartengono all'aplogruppo A). Aplogruppi C-R Le mutazioni M168 e M294, assenti in A e B, definiscono tutti gli aplogruppi da C a R. Queste mutazioni precedettero la migrazione fuori dall'Africa, essendo presenti sia in Africa che al di fuori. Le mutazioni che caratterizzano DE (M145, M203) si verificarono in Africa orientale più di 60.000 anni fa e parteciparono alle grandi migrazioni precoci, cosicché oggi si ritrovano solo tra Esquimesi e Amerindi. L'aplogruppo E rimase originariamente in Africa e le sue più alte frequenze si riscontrano in Africa Sub-Sahariana occidentale (81%) e Etiopia (68%). Il sub-clade E1a è di origine africana e si disperse per tutto il Mediterraneo raggiungendo la frequenza del 27% in Grecia. Anche E3b si trova nel sud-Europa. L'aplogruppo D si trova soltanto in Asia, soprattutto nell'Himalaya e in Giappone, dove fu introdotto dai primi colonizzatori.
Aplogruppi G-R (sub-clade di F) Gli aplogruppi che discendono da F rappresentano il 90% della popolazione mondiale, ma si distribuiscono quasi esclusivamente fuori dall'Africa sub-sahariana. I-J corrisponde probabilmente a un'ondata migratoria dal Medio-Oriente o all'Asia occidentale a partire da 45.000 anni fa, che si è poi diffusa in Europa con l'uomo di Cro-Magnon. L'aplogruppo G, originatosi anch'esso in Medio-Oriente, o nel Caucaso, o forse più a Est in Pakistan, intorno a 30.000 anni fa, secondo alcuni studi potrebbe essersi diffuso in Europa nel Neolitico, oppure, vista la sua forte discontinuità, aver raggiunto l'Europa già nel Paleolitico. L'aplogruppo H si originò forse in India 3040.000 anni fa, dove persistette fino a ridiffondere in epoche storiche con i Gitani. L'aplogruppo K si originò probabilmente nell'Asia sud-occidentale e da lì si diffuse in Africa, Eurasia, Australia e Sud-Pacifico. Aplogruppo K (L-R) L'aplogruppo L si trova principalmente nel sud dell'Asia. L'aplogruppo M è prevalente nelle isole Papua e Nuova Guinea. Gli aplogruppi N e O comparvero 3540.000 anni fa in Asia centrale. L'aplogruppo N si originò probabilmente in Mongolia e si diffuse fino all'estremo Oriente e la Siberia come a ovest, essendo il gruppo più comune tra i popoli uralici. L'aplogruppo O si trova in estremo Oriente e Oceania. L'aplogruppo P si trova soprattutto come sottotipi Q o R, raramente non differenziato. Si evolse probabilmente nell'Asia centrale o nella regione di Altai. Anche l'aplogruppo Q si originò nell'Asia centrale, migrò verso est e raggiunse l'America del nord attraverso lo stretto di Bering. Aplogruppo I L'aplogruppo I rappresenta circa un quinto dei cromosomi Y europei. È quasi esclusivo dell'Europa e pertanto si ritiene che si sia originato in quest'area prima dell'ultima glaciazione. È probabile che sia stato confinato nel rifugio balcanico durante la glaciazione e che poi si sia ridiffuso verso nord con il ritiro dei ghiacciai. Nonostante sia relativamente frequente negli Scandinavi, nei Sardi e nelle popolazioni balcaniche, questi popoli presentano subcladi differenti dell'aplogruppo I. Questo suggerisce che ognuna delle popolazioni ancestrali è oggi dominata da un particolare subclade che ha marcato una indipendente espansione della popolazione lungo diversi percorsi migratori durante e immediatamente dopo la glaciazione. I principali subcladi dell'aplogruppo I sono: I1a (M253, M307, P30, P40) con le più alte frequenze in Scandinavia, Islanda, e Europa nord- orientale. Nelle Isole britanniche la mutazione I1a-M253 è spesso usata come marcatore delle invasioni vichinghe o anglosassoni. I1b (S31) che include I1b1 (P37.2), la forma più comune nei Balcani e in Sardegna (dove rappresenta l'aplogruppo più cospicuo nella variante I1b1b (M26)) e I1b2 che raggiunge discrete frequenze lungo le coste nord-occidentali dell'Europa continentale
e in Sardegna. Dentro I1b2, si è formato I-M284 in Europa nord-occidentale e Isole Britanniche. Aplogruppo R Tutti gli aplotipi afferenti all'aplogruppo R condividono le mutazioni M207 (UTY2), M306 (S1), S4, S8, S9 e possono essere suddivisi in due principali linee evolutive: R1a e R1b. La R1a potrebbe essersi originata nelle steppe euroasiatiche a nord del Mar Caspio e del Mar Nero. È associato alla cultura Kurgan, nota per la domesticazione del cavallo (circa 5000 anni fa). Questa linea è attualmente presente in Asia centrale e occidentale, India, e nelle popolazioni slave dell'Europa orientale. La linea R1b è la più comune nelle popolazioni europee. Nell' Irlanda occidentale raggiunge una frequenza prossima al 100%. Si è originata prima della fine dell'ultima glaciazione e si è concentrata nei rifugi del sud-Europa per poi riespandersi verso nord con il progressivo mitigarsi del clima a partire da 14.000 anni fa.
Riepilogo delle mutazioni che determinano i principali aplogruppi del cromosoma Y umano