Ácido desoxirribonucleico (Redirigido desde « Adn Adn») ») «ADN» redirige aquí. Para otras acepciones, véase ADN véase ADN (desambiguación). (desambiguación) . «DNA» redirige aquí. Para otras acepciones, véase DNA (desambiguación). (desambiguación).
Situación del ADN dentro de una célula eucariota. eucariota.
Animación de parte de una estructura de ADN de doble hélice Elácido desoxirribonucleico, abreviado como ADN, es un ácido nucleicoque nucleicoque contiene las instruccionesgenéticas instruccionesgenéticas usadas en el desarrollo desarrolloyy funcionamiento de todos los losorganismos vivos conocidos y algunos virus virus,, y es responsable de su transmisión hereditaria hereditaria.. La función principal de la molécula de ADN es el almacenamiento a largo plazo de información información.. Muchas veces, el ADN es comparado con un plano o una receta, o uncódigo un código,, ya que contiene las instrucciones necesarias para construir otros componentes de lascélulas las células,, como las proteínas y las moléculas de ARN de ARN.. Los segmentos de ADN que llevan esta información genética son llamados genes genes,, pero las otras secuencias de ADN tienen propósitos estructurales o toman parte en la regulación del uso de esta información genética. Desde el punto de vista químico químico,, el ADN es un polímero de nucleótidos, es decir, un polinucleótido polinucleótido.. Un polímero es un compuesto formado por muchas unidades simples conectadas entre sí, como si fuera un largo tren formado por vagones. En el ADN, cada vagón es un nucleótido nucleótido,, y cada nucleótido, a su vez, está formado por un azúcar (la desoxirribosa desoxirribosa)), una base nitrogenada( nitrogenada(que puede ser adenina ser adenina→ A, timina→T , citosina→C o o guanina→G) y un grupo fosfato que actúa como enganche de cada vagón con el siguiente. Lo que distingue a un vagón (nucleótido) de otro es, entonces, la base nitrogenada, y por ello la secuencia del ADN se especifica nombrando solo la secuencia de sus bases. La disposición secuencial de estas cuatro bases a lo largo de la cadena (el ordenamiento de los cuatro tipos de vagones a lo largo de todo el tren) es la que codifica la información genética: por ejemplo, una secuencia de ADN puede
Animación de parte de una estructura de ADN de doble hélice Elácido desoxirribonucleico, abreviado como ADN, es un ácido nucleicoque nucleicoque contiene las instruccionesgenéticas instruccionesgenéticas usadas en el desarrollo desarrolloyy funcionamiento de todos los losorganismos vivos conocidos y algunos virus virus,, y es responsable de su transmisión hereditaria hereditaria.. La función principal de la molécula de ADN es el almacenamiento a largo plazo de información información.. Muchas veces, el ADN es comparado con un plano o una receta, o uncódigo un código,, ya que contiene las instrucciones necesarias para construir otros componentes de lascélulas las células,, como las proteínas y las moléculas de ARN de ARN.. Los segmentos de ADN que llevan esta información genética son llamados genes genes,, pero las otras secuencias de ADN tienen propósitos estructurales o toman parte en la regulación del uso de esta información genética. Desde el punto de vista químico químico,, el ADN es un polímero de nucleótidos, es decir, un polinucleótido polinucleótido.. Un polímero es un compuesto formado por muchas unidades simples conectadas entre sí, como si fuera un largo tren formado por vagones. En el ADN, cada vagón es un nucleótido nucleótido,, y cada nucleótido, a su vez, está formado por un azúcar (la desoxirribosa desoxirribosa)), una base nitrogenada( nitrogenada(que puede ser adenina ser adenina→ A, timina→T , citosina→C o o guanina→G) y un grupo fosfato que actúa como enganche de cada vagón con el siguiente. Lo que distingue a un vagón (nucleótido) de otro es, entonces, la base nitrogenada, y por ello la secuencia del ADN se especifica nombrando solo la secuencia de sus bases. La disposición secuencial de estas cuatro bases a lo largo de la cadena (el ordenamiento de los cuatro tipos de vagones a lo largo de todo el tren) es la que codifica la información genética: por ejemplo, una secuencia de ADN puede
ser ATGCTAGATCGC... En los organismos vivos, el ADN se presenta como una doble cadena de nucleótidos, en la que las dos hebras están unidas entre sí por unas conexiones denominadas puentes de hidrógeno. hidrógeno.1 Para que la información que contiene el ADN pueda ser utilizada por la maquinaria celular, debe copiarse en primer lugar en unos trenesde nucleótidos, más cortos y con unas unidades diferentes, llamados ARN llamados ARN.. Las moléculas de ARN se copian exactamente del ADN mediante un proceso denominado transcripción transcripción.. Una vez procesadas en el núcleo celular , las moléculas de ARN pueden salir al citoplasma para su utilización posterior. La información contenida en el ARN se interpreta usando el código genético, genético, que especifica la secuencia de los aminoácidos de las proteínas, según una correspondencia de un triplete de nucleótidos (codón codón)) para cada aminoácido. Esto es, la información genética (esencialmente: qué proteínas se van a producir en cada momento del ciclo de vida de una célula) se halla codificada en las secuencias de nucleótidos del ADN y debe traducirse para poder funcionar. Tal traducción se realiza usando el código genético a modo de diccionario. El diccionario "secuencia de nucleótido-secuencia de aminoácidos" permite el ensamblado de largas cadenas de aminoácidos (las proteínas) en el citoplasma de la célula. Por ejemplo, en el caso de la secuencia de ADN indicada antes ( ATGCTAGCATCG...), la ARNpolimerasa ARNpolimerasa utilizaría como molde la cadena complementaria de dicha secuencia de ADN (que sería TACGAT-CTA-GCG-...) para transcribir una molécula de ARNm que se leería AUGCUA-GAU-CGC-...; el ARNm resultante, utilizando el código genético, se traduciría como la secuencia de aminoácidos metionina metionina--leucina leucina--ácido aspárticoaspártico-arginina arginina--... Las secuencias de ADN que constituyen la unidad fundamental, física y funcional de la herencia se denominan genes genes.. Cada gen contiene una parte que se transcribe a ARN y otra que se encarga de definir cuándo y dónde deben expresarse expresarse.. La información contenida en los genes (genética) se emplea para generar ARN yproteínas yproteínas,, que son los componentes básicos de las células, los "ladrillos" que se utilizan para la construcción de los orgánulos u organelos celulares,, entre otras funciones. celulares Dentro de las células, el ADN está organizado en estructuras llamadas cromosomas que, durante el ciclo celular , se duplican duplicanantes antes de que la célula se divida divida.. Los organismos eucariotas (por ejemplo, animales animales,, plantas y hongos hongos)) almacenan la mayor parte de su ADN dentro del núcleo celular y celular y una mínima parte en elementos celulares llamados mitocondrias mitocondrias,, y en los plastos y los centros organizadores de microtúbulos o centríolos centríolos,, en caso de tenerlos; los organismos procariotas (bacterias y arqueas arqueas)) lo almacenan en el e lcitoplasma de la célula y, por último, los virus ADN lo hacen en el interior de la cápside de naturaleza proteica.
Existen multitud de proteínas, como por ejemplo las histonas y los factores de transcripción, que se unen al ADN dotándolo de una estructura tridimensional determinada y regulando su expresión. Los factores de transcripción reconocen secuencias reguladoras del ADN y especifican la pauta de transcripción de los genes. El material genético completo de una dotación cromosómica se denominagenoma y, con pequeñas variaciones, es característico de cadaespecie.
Índice [ocultar ]
1Historia de la genética
2Propiedades físicas y químicas o
2.1Componentes
o
2.2Apareamiento de bases
o
2.2.1Otros tipos de pares de bases
2.3Estructura
2.3.1Estructuras en doble hélice
2.3.2Estructuras en cuádruplex
o
2.4Hendiduras mayor y menor
o
2.5Sentido y antisentido
o
2.6Superenrollamiento
3Modificaciones químicas o
3.1Modificaciones de bases del ADN
o
3.2Daño del ADN
4Funciones biológicas o
o
4.1Genes y genoma
4.1.1El ADN codificante
4.1.2El ADN no codificante
4.2Transcripción y traducción
o
4.3Replicación del ADN
4.3.1Hipótesis sobre la duplicación del ADN
5Interacciones ADN-proteína o
o
5.1Proteínas que unen ADN
5.1.1Interacciones inespecíficas
5.1.2Interacciones específicas
5.2Enzimas que modifican el ADN
5.2.1Nucleasas y ligasas
5.2.2Topoisomerasas y helicasas
5.2.3Polimerasas
6Recombinación genética
7Evolución del metabolismo de ADN
8Técnicas comunes
o
8.1Tecnología del ADN recombinante
o
8.2Secuenciación
o
8.3Reacción en cadena de la polimerasa (PCR)
o
8.4Southern blot
o
8.5Chips de ADN
9Aplicaciones o
9.1Ingeniería genética
o
9.2Medicina forense
o
9.3Bioinformática
o
9.4Nanotecnología de ADN
o
9.5Historia, antropología y paleontología
10Véase también
11Referencias o
11.1Notas
o
11.2Bibliografía
12Enlaces externos
Historia de la genética Artículo principal: Historia de la genética
Friedrich Miescher , biólogo y médico suizo (1844-1895).
El ADN lo aisló por primera vez, durante el invierno de 1869, el médico suizoFriedrich Miescher mientras trabajaba en la Universidad de Tubinga. Miescher realizaba experimentos acerca de la composición química del pus de vendasquirúrgicas desechadas cuando notó un precipitado de una sustancia desconocida que caracterizó químicamente más tarde.2 3Lo llamó nucleína, debido a que lo había extraído a partir de núcleos celulares .4 Se necesitaron casi 70 años de investigación para poder identificar los componentes y la estructura de los ácidos nucleicos.
En 1919 Phoebus Leveneidentificó que un nucleótido está formado por una base nitrogenada, un azúcar y un fosfato.5 Levene sugirió que el ADN generaba una estructura con forma de solenoide (muelle) con unidades de nucleótidos unidos a través de los grupos fosfato. En 1930 Levene y su maestro Albrecht Kossel probaron que la nucleína de Miescher es un ácido desoxirribonucleico (ADN) formado por cuatro bases nitrogenadas (citosina (C), timina (T), adenina (A) yguanina (G), el azúcar desoxirribosa y un grupo fosfato, y que, en su estructura básica, el nucleótido está compuesto por un azúcar unido a la base y al fosfato.6 Sin embargo, Levene pensaba que la cadena era corta y que las bases se repetían en un orden fijo. En1937 William Astbury produjo el primer patrón de difracción de rayos X que mostraba que el ADN tenía una estructura regular .7
Maclyn McCarty con Francis Crick y James D. Watson. La función biológica del ADN comenzó a dilucidarse en 1928, con una serie básica de experimentos de la genética moderna realizados por Frederick Griffith, quien estaba trabajando con cepas «lisas» (S) o «rugosas» (R) de la bacteriaPneumococcus (causante de la neumonía), según la presencia (S) o no (R) de una cápsula azucarada, que es la que confiere virulencia (véase también experimento de Griffith). La inyección de neumococos S vivos en ratones produce la muerte de éstos, y Griffith observó que, si inyectaba ratones con neumococos R vivos o con neumococos S muertos por calor, los ratones no morían. Sin embargo, si inyectaba a la vez neumococos R vivos y neumococos S muertos, los ratones morían, y en su sangre se podían aislar neumococos S vivos. Como las bacterias muertas no pudieron haberse multiplicado dentro del ratón, Griffith razonó que debía producirse algún tipo de cambio o transformación de un tipo bacteriano a otro por medio de una transferencia de alguna sustancia activa, que denominó principio transformante . Esta sustancia proporcionaba la capacidad a los neumococos R de producir una cápsula azucarada y transformarse así en virulentas. En los siguientes 15 años, estos experimentos iniciales se replicaron mezclando distintos tipos de cepas bacterianas muertas por el calor con otras vivas, tanto en ratones ( in vivo) como en tubos de ensayo (in vitro).8 La búsqueda
del «factor transformante» que era capaz de hacer virulentas a cepas que inicialmente no lo eran continuó hasta 1944, año en el cua lOswald Avery, Colin MacLeod y Maclyn McCarty realizaron un experimento hoy clásico. Estos investigadores extrajeron la fracción activa (el factor transformante) y, mediante análisis químicos, enzimáticos y serológicos, observaron que no contenía proteínas, ni lípidos no ligados, ni polisacáridos activos, sino que estaba constituido principalmente por "una forma viscosa de ácido desoxirribonucleico altamente polimerizado", es decir, ADN. El ADN extraído de las cepas bacterianas S muertas por el calor lo mezclaron "in vitro" con cepas R vivas: el resultado fue que se formaron colonias bacterianas S, por lo que se concluyó inequívocamente que el factor o principio transformante era el ADN.9 A pesar de que la identificación del ADN como principio transformante aún tardó varios años en ser universalmente aceptada, este descubrimiento fue decisivo en el conocimiento de la base molecular de la herencia, y constituye el nacimiento de lagenética molecular . Finalmente, el papel exclusivo del ADN en la heredabilidad fue confirmado en 1952 mediante los experimentos de Alfred Hershey y Martha Chase, en los cuales comprobaron que elfago T2 transmitía su información genética en su ADN, pero no en su proteína 10 (véase también experimento de Hershey y Chase). En cuanto a la caracterización química de la molécula, Chargaff re alizó en 1940 algunos experimentos que le sirvieron para establecer las proporciones de las bases nitrogenadas en el ADN. Descubrió que las proporciones de purinas eran idénticas a las de pirimidinas, la «equimolecularidad» de las bases ([A]=[T], [G]=[C]) y el hecho de que la cantidad de G+C en una determinada molécula de ADN no siempre es igual a la cantidad de A+T y puede variar desde el 36 hasta el 70 por ciento del contenido total.6 Con toda esta información y junto con los datos de difracción de rayos Xproporcionados por Rosalind Franklin, James Watson y Francis Crick propusieron en 1953 el modelo de la doble hélice de ADN para representar la estructura tridimensional del polímero.11 En una serie de cinco artículos en el mismo número de Nature se publicó la evidencia experimental que apoyaba el modelo de Watson y Crick.12De éstos, el artículo de Franklin y Raymond Gosling fue la primera publicación con datos de difracción de rayos X que apoyaba el modelo de Watson y Crick,13 14 y en ese mismo número de Naturetambién aparecía un artículo sobre la estructura del ADN de Maurice Wilkins y sus colaboradores.15 Watson, Crick y Wilkins recibieron conjuntamente, en 1962, después de la muerte de Rosalind Franklin, el Premio Nobel en Fisiología o Medicina.16 Sin embargo, el debate continúa sobre quién debería recibir crédito por el descubrimiento. 17
Propiedades físicas y químicas
Estructura química del ADN: dos cadenas de nucleótidos conectadas mediante puentes de hidrógeno, que aparecen como líneas punteadas. El ADN es un largopolímero formado por unidades repetitivas, los nucleótidos.18 19Una doble cadena de ADN mide de 22 a 26 angstroms (2,2 a 2,6nanómetros) de ancho, y una unidad (un nucleótido) mide 3,3 Å (0,33 nm) de largo.20 Aunque cada unidad individual que se repite es muy pequeña, los polímeros de ADN pueden ser moléculasenormes que contienen millones de nucleótidos. Por ejemplo, el cromosoma humano más largo, el cromosoma número 1, tiene aproximadamente 220 millones de pares de bases.21 En los organismos vivos, el ADN no suele existir como una molécula individual, sino como una pareja de moléculas estrechamente asociadas. Las dos cadenas de ADN se enroscan sobre sí mismas formando una especie de escalera de caracol, denominada doble hélice. El modelo de estructura en doble hélice fue propuesto en1953 por James Watson y Francis Crick (el artículo «Molecular Structure of Nucleic Acids: A Structure for Deoxyribose Nucleic Acid» fue publicado el 25 de abril de 1953 en Nature), después de obtener una imagen de la estructura de doble hélice gracias a la refracción por rayos X hecha por Rosalind Franklin.22 El éxito de este modelo radicaba en su consistencia con las
propiedades físicas y químicas del ADN. El estudio mostraba, además, que lacomplementariedad de bases podía ser relevante en su replicación, y también la importancia de la secuencia de bases como portadora de información genética.23 24 25 Cada unidad que se repite, el nucleótido, contiene un segmento de la estructura de soporte (azúcar + fosfato), que mantiene la cadena unida, y una base, que interacciona con la otra cadena de ADN en la hélice. En general, una base ligada a un azúcar se denomina nucleósido y una base ligada a un azúcar y a uno o más grupos fosfatos recibe el nombre de nucleótido. Cuando muchos nucleótidos se encuentran unidos, como ocurre en el ADN, el polímero resultante se denomina polinucleótido.26
Componentes Estructura de soporte: La estructura de soporte de una hebra de ADN está formada por unidades alternas de grupos fosfato y azúcar (desoxirribosa).27 El azúcar en el ADN es una pentosa, concretamente, la desoxirribosa.
Ácido fosfórico:
Enlace fosfodiéster . El grupo fosfato(PO43-) une el carbono 5' del azúcar de unnucleósido con el carbono 3' del siguiente.
Su fórmula químicaes H3PO4. Cadanucleótido puede contener uno (monofosfato: AMP), dos (difosfato: ADP) o tres (trifosfato: ATP) grupos de ácido fosfórico, aunque como monómeros constituyentes de los ácidos nucleicossolo aparecen en forma de nucleósidos monofosfato.
Desoxirribosa:
Es un monosacáridode 5 átomos decarbono (unapentosa) derivado de la ribosa, que forma parte de la estructura de nucleótidos del ADN. Su fórmula es C 5H10O4. Una de las principales diferencias entre el ADN y el ARN es el azúcar , pues en el ARN la 2-desoxirribosa del ADN es reemplazada por una pentosa alternativa, la ribosa.25 Las moléculas de azúcar se unen entre sí a través de grupos fosfato, que forman enlaces fosfodiéster entre los átomos de carbono tercero (3′, «tres prima») y quinto (5′, «cinco prima») de dos anillos adyacentes de azúcar. La formación
de enlacesasimétricos implica que cada hebra de ADN tiene una dirección. En una doble hélice, la dirección de los nucleótidos en una hebra (3′ → 5′) es opuesta a la dirección en la otra hebra (5′ → 3′). Esta organización de las hebras de ADN se denominaantiparalela; son cadenas paralelas, pero con direcciones opuestas.
De la misma manera, los extremos asimétricos de las hebras de ADN se denominan extremo 5′ («cinco prima») yextremo 3′ («tres prima»), respectivamente.
Bases nitrogenadas:
Las cuatro bases nitrogenadas mayoritarias que se encuentran en el ADN son la adenina (A), la citosina (C), la guanina (G) y latimina (T). Cada una de estas cuatro bases está unida al armazón de azúcar-fosfato a través del azúcar para formar el nucleótido completo (base-azúcar-fosfato). Las bases soncompuestos heterocíclicos y aromáticos con dos o más átomosde nitrógeno, y, dentro de las bases mayoritarias, se clasifican en dos grupos: las bases púricas o purinas (adenina y guanina), derivadas de la purina y formadas por dos anillos unidos entre sí, y las bases pirimidínicas o bases pirimídicas o pirimidinas(citosina y timina), derivadas de la pirimidina y con un solo anillo.25 En los ácidos nucleicos existe una quinta base pirimidínica, denominada uracilo (U), que normalmente ocupa el lugar de la timina en el ARN y difiere de ésta en que carece de un grupo metilo en su anillo. El uracilo no se encuentra habitualmente en el ADN, solo aparece raramente como un producto residual de la degradación de la citosina por procesos de desaminación oxidativa.
Timina: 2, 4-dioxo, 5-metilpirimidina.
Timina:
En el código genético se representa con la letra T. Es un derivado pirimidínico con ungrupo oxo en las posiciones 2 y 4, y un grupo metil en la posición 5. Forma el nucleósido timidina(siempre desoxitimidina, ya que solo aparece en el ADN) y elnucleótido timidilato o timidina monofosfato (dTMP). En el ADN, la timina siempre seempareja con la adenina de la cadena complementaria mediante 2 puentes de hidrógeno, T=A. Su fórmula química es C 5H6N2O2 y su nomenclatura 2, 4-dioxo, 5-metilpirimidina.
Citosina: 2-oxo, 4-aminopirimidina.
Citosina:
En el código genético se representa con la letra C. Es un derivado pirimidínico, con un grupo amino en posición 4 y un grupo oxo en posición 2. Forma el nucleósido citidina(desoxicitidina en el ADN) y elnucleótido citidilato o (desoxi)citidina monofosfato (dCMP en el ADN, CMP en el ARN). La citosina siempre seempareja en el ADN con la guanina de la cadena complementaria mediante un triple enlace, C≡G. Su fórmula química es C 4H5N3O y su nomenclatura 2-oxo, 4 aminopirimidina. Su masa molecular es de 111,10 unidades de masa atómica. La citosina se descubrió en 1894, al aislarla del tejido del timo de carnero.
Adenina: 6-aminopurina.
Adenina:
En el código genético se representa con la letra A. Es un derivado de la purina con un grupo amino en la posición 6. Forma el nucleósido adenosina(desoxiadenosina en el ADN) y el nucleótido adenilato o (desoxi)adenosina monofosfato (dAMP, AMP). En el ADN siempre se empareja con la timina de la cadena complementaria mediante 2 puentes de hidrógeno, A=T. Su fórmula química es C 5H5N5 y su nomenclatura 6-aminopurina. La adenina, junto con la timina, fue descubierta en 1885 por el médico alemán Albrecht Kossel.
Guanina: 6-oxo, 2-aminopurina.
Guanina:
En el código genético se representa con la letra G. Es un derivado púrico con un grupo oxo en la posición 6 y un grupo amino en la posición 2. Forma el nucleósido (desoxi)guanosina y el nucleótido guanilato o (desoxi)guanosina monofosfato (dGMP, GMP). La guanina siempre se emparejaen el ADN con la citosina de la cadena complementaria mediante tres enlaces de hidrógeno, G≡C. Su fórmula química es C5H5N5O y su nomenclatura 6-oxo, 2-aminopurina. También existen otras bases nitrogenadas (las llamadas bases nitrogenadas minoritarias), derivadas de forma natural o sintética de alguna otra base mayoritaria. Lo son por ejemplo la hipoxantina, relativamente abundante en el tRNA, o la cafeína, ambas derivadas de la adenina; otras, como el aciclovir , derivadas de la guanina, son análogos sintéticos usados en terapia antiviral; otras, como una de las derivadas del uracilo, son antitumorales.
Las bases nitrogenadas tienen una serie de características que les confieren unas propiedades determinadas. Una característica importante es su carácter aromático, consecuencia de la presencia en el anillo de dobles enlaces en posición conjugada. Ello les confiere la capacidad de absorber luz en la zona ultravioleta delespectro en torno a los 260 nm, lo cual puede aprovecharse para determinar el coeficiente de extinción del ADN y hallar la concentración existente de los ácidos nucleicos. Otra de sus características es que presentan tautomería o isomería de grupos funcionales, debido a que un átomo de hidrógeno unido a otro átomo puede migrar a una posición vecina; en las bases nitrogenadas se dan dos tipos de tautomerías: tautomería lactama-lactima, donde el hidrógeno migra del nitrógeno al oxígeno del grupo oxo (forma lactama) y viceversa (forma lactima), y tautomeríaimina-amina primaria, donde el hidrógeno puede estar formando el grupo amina (forma amina primaria) o migrar al nitrógeno adyacente (forma imina). La adenina sólo puede presentar tautomería aminaimina, la timina y el uracilo muestran tautomería doble lactama-lactima, y la guanina y citosina pueden presentar ambas. Por otro lado, y aunque se trate de moléculas apolares, las bases nitrogenadas presentan suficiente carácter polar como para establecer puentes de hidrógeno, ya que tienen átomos muyelectronegativos (nitrógeno y oxígeno) que presentan carga parcial negativa, y átomos de hidrógeno con carga parcial positiva, de manera que se forman dipolos que permiten que se formen estosenlaces débiles. Se estima que el genoma humano haploide tiene alrededor de 3000 millones de pares de bases. Para indicar el tamaño de las moléculas de ADN se indica el número de pares de bases, y como derivados hay dos unidades de medida muy utilizadas, la kilobase (kb), que equivale a 1000 pares de bases, y la megabase (Mb), que equivale a un millón de pares de bases.
Apareamiento de bases Véase también: Par de bases
Un par de bases C≡G con trespuentes de hidrógeno.
Un par A=T con dos puentes de hidrógeno. Los puentes de hidrógeno se muestran como líneas discontinuas. La dóble hélice de ADN se mantiene estable mediante la formación de puentes de hidrógeno entre las bases asociadas a cada una de las dos hebras. Para la formación de un enlace de hidrógeno una de las bases debe presentar un "donador" de hidrógenos con un átomo de hidrógeno con carga parcial positiva (NH2 o -NH) y la otra base debe presentar un grupo "aceptor" de hidrógenos con un átomo cargadoelectronegativamente (C=O o N). Los puentes de hidrógeno son uniones más débiles que los típicosenlaces químicoscovalentes, como los que conectan los átomos en cada hebra de ADN, pero más fuertes que interacciones hidrófobas individuales,enlaces de Van der Waals, etc. Como los puentes de hidrógeno no son enlaces covalentes, pueden romperse y formarse de nuevo de forma relativamente sencilla. Por esta razón, las dos heb ras de la doble hélice pueden separarse como una cremallera, bien por fuerza mecánica o por alta temperatura.28 La doble hélice se estabiliza además por el efecto hidrofóbico y el apilamiento, que no se ven influidos por la secuencia de bases del ADN .29 Cada tipo de base en una hebra forma un enlace únicamente con un tipo de base en la otra hebra, lo que se denomina complementariedad de las bases . Así, las purinas forman enlaces con las pirimidinas, de forma que A se enlaza solo con T, y C solo con G. La organización de dos nucleótidos apareados a lo largo de la doble hélice se denomina apareamiento de bases. Este emparejamiento corresponde a la observación ya realizada por Erwin Chargaff (1905-2002),30 que mostró que la cantidad de adenina era muy similar a la cantidad de timina, y que la cantidad de citosina era igual a la cantidad de guanina en el ADN. Como resultado de esta complementariedad, toda la información contenida en la secuencia de doble hebra de la hélice de ADN está duplicada en cada hebra, lo cual es fundamental durante el proceso de replicación del ADN. En efecto, esta interacción reversible y específica entre pares de bases complementarias es crítica para todas las funciones del ADN en los organismos vivos.18 Como se ha indicado anteriormente, los dos tipos de pares de bases forman un número diferente de enlaces de hidrógeno: A=T forman dos puentes de hidrógeno, y C≡G forman tres puentes de hidrógeno (ver imágenes). El par de bases GC es
por tanto más fuerte que el par de bases AT. Como consecuencia, tanto el porcentaje de pares de bases GC como la longitud total de la doble hélice de ADN determinan la fuerza de la asociación entre las dos hebras de ADN. Las dobles hélices largas de ADN con alto contenido en GC tienen hebras que interaccionan más fuertemente que las dobles hélices cortas con alto contenido en AT .31 Por esta razón, las zonas de la doble hélice de ADN que necesitan separarse fácilmente tienden a tener un alto contenido en AT, como por ejemplo la secuencia TATAAT de la caja de Pribnow de algunospromotores.32 En el laboratorio, la fuerza de esta interacción puede medirse buscando la temperatura requerida para romper los puentes de hidrógeno, la temperatura de fusión (también denominado valor T m, del inglés melting temperature ). Cuando todas las pares de bases en una doble hélice se funden, las hebras se separan en solución en dos hebras completamente independientes. Estas moléculas de ADN de hebra simple no tienen una única forma común, sino que algunas conformaciones son más estables que otras.33
Otros tipos de pares de bases
Par de bases A=T de tipo Watson-Crick. En azul el donador de hidrógenos y en rojo el aceptor.
Par de bases A=T de tipo Watson-Crick reverso. En azul el donador de hidrógenos y en rojo el aceptor. Nótese que la pirimidina ha sufrido un giro de 180º sobre el eje del carbono 6. Existen diferentes tipos de pares de bases que se pueden formar según el modo como se forman los puentes de hidrógeno. Los que se observan en la doble hélice de ADN son los llamados pares de bases Watson-Crick, pero también existen otros posibles pares de bases, como los denominados Hoogsteen yWobble u oscilante, que pueden aparecer en circunstancias particulares. Además, para cada tipo existe a su vez el mismo par reverso, es decir, el que se da si se gira la base pirimidínica 180º sobre su eje.
Watson-Crick (pares de bases de la doble hélice): los grupos de la base púrica que intervienen en el enlace de hidrógeno son los que corresponden a las posiciones 1 y 6 (N aceptor y -NH2donador si la purina es una A) y los grupos de la base pirimidínica, los que se encuentran en las posiciones 3 y 4 (-NH donador y C=O aceptor si la pirimidina es una T). En el par de bases Watson-Crick reverso participarían los grupos de las posiciones 2 y 3 de la base pirimidínica (ver imágenes). Hoogsteen: en este caso cambian los grupos de la base púrica, que ofrece una cara diferente (posiciones 6 y 7) y que forman enlaces con los grupos de las pirimidinas de las posiciones 3 y 4 (como en Watson-Crick). También puede haber Hoogsteen reversos. Con este tipo de enlace pueden unirse A=U (Hoogsteen y Hoogsteen reverso) y A=C (Hoogsteen reverso). Wobble u oscilante: este tipo de enlace permite que se unan guanina y timina con un doble enlace (G=T). La base púrica (G) forma enlace con los grupos de las posiciones 1 y 6 (como en Watson-Crick) y la pirimidina (T) con los grupos de las posiciones 2 y 3. Este tipo de enlace no funcionaría con A=C, ya que quedarían enfrentados los 2 aceptores y los 2 donadores,
y solo se podría dar en el caso inverso. Encontramos pares de bases de tipo oscilante en el ARN, durante el apareamiento de codón y anticodón. Con este tipo de enlace pueden unirse G=U (oscilante y oscilante reverso) y A=C (oscilante reverso). En total, en su forma tautomérica mayoritaria, existen 28 posibles pares de bases nitrogenadas: 10 posibles pares de bases purina-pirimidina (2 pares Watson-Crick y 2 Watson Crick reverso, 1 par Hoogsteen y 2 pares Hoogsteen reverso, 1 par oscilante y 2 pares oscilante reverso), 7 pares homo purina-purina (A=A, G=G), 4 pares A=G y 7 pares pirimidina-pirimidina. Esto sin contar con los pares de bases que pueden formarse si también tenemos en cuenta las otras formas tautoméricas minoritarias de las bases nitrogenadas; éstos, además, pueden ser responsables de mutaciones puntuales por sustitución de tipo transición.
Estructura El ADN es una molécula bicatenaria, es decir, está formada por dos cadenas dispuestas de forma antiparalela y con las bases nitrogenadas enfrentadas. En su estructura tridimensional, se distinguen distintos niveles:34 35 1. Estructura primaria:
Secuencia de nucleótidos encadenados. Es en estas cadenas donde se encuentra la información genética, y dado que el esqueleto es el mismo para todos, la diferencia de la información radica en la distinta secuencia de bases nitrogenadas. Esta secuencia presenta un código, que determina una información u otra, según el orden de las bases.
2. Estructura secundaria:
Es una estructura en doble hélice. Permite explicar el almacenamiento de la información genética y el mecanismo de duplicación del ADN. Fue postulada por Watson y Crick, basándose en la difracción de rayos X que habían realizado Franklin y Wilkins, y en la equivalencia de bases de Chargaff, según la cual la suma de adeninas más guaninas es igual a la suma de timinas más citosinas. Es una cadena doble, dextrógira o levógira, según el tipo de ADN. Ambas cadenas son complementarias, pues la adenina y la guanina de una cadena se unen, respectivamente, a la timina y la citosina de la otra. Ambas cadenas son antiparalelas, pues el extremo 3´ de una se enfrenta al extremo 5' de la homóloga.
Existen tres modelos de ADN. El ADN de tipo B es el más abundante y es el que tiene la estructura descrita por Watson y Crick.
3. Estructura terciaria:
Se refiere a cómo se almacena el ADN en un espacio reducido, para formar los cromosomas. Varía según se trate de organismos procariotas o eucariotas:
2. En procariotas el ADN se pliega como una súper-hélice, generalmente en forma circular y asociada a una pequeña cantidad de proteínas. Lo mismo ocurre en orgánulos celulares como las mitocondrias y en loscloroplastos. 3. En eucariotas, dado que la cantidad de ADN de cada cromosoma es muy grande, el empaquetamiento ha de ser más complejo y compacto; para ello se necesita la presencia de proteínas, como las histonasy otras proteínas de naturaleza no histónica (en losespermatozoides estas proteínas son lasprotaminas).34 4. Estructura cuaternaria:
La cromatina presente en el núcleo tiene un grosor de 300 Å, pues la fibra de cromatina de 100 Å se enrolla formando una fibra de cromatina de 300 Å. El enrollamiento de los nucleosomas recibe el nombre de solenoide. Dichos solenoides se enrollan formando la cromatina del núcleo interfásico de la célula eucariota. Cuando la célula entra en división, el ADN se compacta más, formando así los cromosomas.
Estructuras en doble hélice
De izquierda a derecha, las estructuras de ADN A, B y Z. El ADN existe en muchas conformaciones.27 Sin embargo, en organismos vivos sólo se han observado las conformaciones ADN-A, ADN-B y ADN-Z. La conformación que adopta el ADN depende de su secuencia, la cantidad y dirección desuperenrollamiento que presenta, la presencia de modificaciones
químicas en las bases y las condiciones de la solución, tales como la concentración de iones de metales y poliaminas.36 De las tres conformaciones, la forma "B" es la más común en las condiciones existentes en las células .37 Las dos dobles hélices alternativas del ADN difieren en su geometría y dimensiones. La forma "A" es una espiral que gira hacia la derecha, más amplia que la "B", con una hendidura menor superficial y más amplia, y una hendidura mayor más estrecha y profunda. La forma "A" ocurre en condiciones no fisiológicas en formas deshidratadas de ADN, mientras que en la célula puede producirse en apareamientos híbridos de hebras ADN-ARN, además de en complejos enzima ADN.38 39 Los segmentos de ADN en los que las bases han sido modificadas por metilación pueden sufrir cambios conformacionales mayores y adoptar la forma "Z". En este caso, las hebras giran alrededor del eje de la hélice en una espiral que gira a mano izquierda, lo opuesto a la forma "B" más frecuente . 40 Estas estructuras poco frecuentes pueden ser reconocidas por proteínas específicas que se unen a ADN-Z y posiblemente estén implicadas en la regulación de latranscripción.41
Estructuras en cuádruplex
Estructura de un ADN en cuádruplex formada por repeticiones en los telómeros. La conformación de la estructura de soporte del ADN difiere significativamente de la típica estructura en hélice.42 En los extremos de los cromosomas lineales existen regiones especializadas de ADN denominadastelómeros. La función principal de estas regiones es permitir a la célula replicar los extremos cromosómicos utilizando la enzima telomerasa,
puesto que las enzimas que replican el resto del ADN no pueden copiar los extremos 3' de los cromosomas.43 Estas terminaciones cromosómicas especializadas también protegen los extremos del ADN, y evitan que los sistemas de reparación del ADNen la célula los procesen como ADN dañado que debe ser corregido.44 En las células humanas, los telómeros son largas zonas de ADN de hebra sencilla que contienen algunos miles de repeticiones de una única secuencia TTAGGG.45 Estas secuencias ricas en guanina pueden estabilizar los extremos cromosómicos mediante la formación de estructuras de juegos apilados de unidades de cuatro bases, en lugar de los pares de bases encontrados normalmente en otras estructuras de ADN. En este caso, cuatro bases guanina forman unidades con superficie plana que se apilan una sobre otra, para formar una estructura cuádruple-G estable.46 Estas estructuras se estabilizan formandopuentes de hidrógeno entre los extremos de las bases y laquelatación de un metal iónico en el centro de cada unidad de cuatro bases.47 También se pueden formar otras estructuras, con el juego central de cuatro bases procedente, o bien de una hebra sencilla plegada alrededor de las bases, o bien de varias hebras paralelas diferentes, de forma que cada una contribuye con una base a la estructura central. Además de estas estructuras apiladas, los telómeros también forman largas estructuras en lazo, denominadas lazos teloméricos o lazos-T ( T-loops en inglés). En este caso, las hebras simples de ADN se enroscan sobre sí mismas en un amplio círculo estabilizado por proteínas que se unen a telómeros .48 En el extremo del lazo T, el ADN telomérico de hebra sencilla se sujeta a una región de ADN de doble hebra porque la hebra de ADN telomérico altera la doble hélice y se aparea a una de las dos hebras. Esta estructura de triple hebra se denomina lazo de desplazamiento o lazo D (D-loop).46
Hendiduras mayor y menor
Animación de la estructura de una sección de ADN. Las bases se encuentran horizontalmente entre las dos hebras en espiral. Versión ampliada49
Doble hélice: a) Dextrógira, b) Levógira. La doble hélicees una espiraldextrógira, esto es, cada una de las cadenas denucleótidos gira a derechas; esto puede verificarse si nos fijamos, yendo de abajo a arriba, en la dirección que siguen los segmentos de las hebras que quedan en primer plano. Si las dos hebras giran a derechas se dice que la doble
hélice es dextrógira, y si giran a izquierdas,levógira (esta forma puede aparecer en hélices alternativas debido a cambios conformacionales en el ADN). Pero en la conformación más común que adopta el ADN, la doble hélice es dextrógira, girando cada par de bases respecto al anterior unos 36º.50 Cuando las dos hebras de ADN se enrollan una sobre la otra (sea a derechas o a izquierdas), se forman huecos o hendiduras entre una hebra y la otra, dejando expuestos los laterales de las bases nitrogenadas del interior (ver la animación). En la conformación más común que adopta el ADN aparecen, como consecuencia de los ángulos formados entre los azúcares de ambas cadenas de cada par de bases nitrogenadas, dos tipos de hendiduras alrededor de la superficie de la doble hélice: una de ellas, la hendidura o surco mayor, que mide 22 Å (2,2 nm) de ancho, y la otra, la hendidura o surco menor, que mide 12 Å (1,2 nm) de ancho.51 Cada vuelta de hélice, que es cuando ésta ha realizado un giro de 360º o lo que es lo mismo, de principio de hendidura mayor a final de hendidura menor, medirá por tanto 34 Å, y en cada una de esas vueltas hay unos 10,5 pb.
Hendiduras mayor y menor de la doble hélice. La anchura de la hendidura mayor implica que los extremos de las bases son más accesibles en ésta, de forma que la cantidad de grupos químicos expuestos también es mayor lo cual facilita la diferenciación entre los pares de bases A-T, T A, C-G, G-C. Como consecuencia de ello, también se verá facilitado el reconocimiento de secuencias de ADN por parte de diferentes proteínas sin la necesidad de abrir la doble hélice. Así, proteínas como los factores de transcripción que pueden unirse a secuencias específicas, frecuentemente contactan con los laterales de las bases expuestos en la hendidura mayor .52 Por el contrario, los grupos químicos que quedan expuestos en la hendidura menor son similares, de forma que el reconocimiento de los pares de bases es más difícil; por ello se dice que la hendidura mayor contiene más información que la hendidura menor .50
Sentido y antisentido
Artículo principal: Antisentido
Una secuencia de ADN se denomina " sentido" (en inglés, sense) si su secuencia es la misma que la secuencia de un ARN mensajeroque se traduce en una proteína. La secuencia de la hebra de ADN complementaria se denomina "antisentido" (antisense). En ambas hebras de ADN de la doble hélice pueden existir tanto secuencias sentido, que codifican ARNm, como antisentido, que no lo codifican. Es decir, las secuencias que codifican ARNm no están todas presentes en una sola de las hebras, sino repartidas entre las dos hebras. Tanto en procariotas como en eucariotas se producen ARN con secuencias antisentido, pero la función de esos ARN no está completamente clara .53 Se ha propuesto que los ARN antisentidoestán implicados en la regulación de la expresión génica mediante apareamiento ARN-ARN: los ARN antisentido se aparearían con los ARNm complementarios, bloqueando de esta forma su traducción.54 En unas pocas secuencias de ADN en procariotas y eucariotas (este hecho es más frecuente en plásmidos y virus), la distinción entre hebras sentido y antisentido es más difusa, debido a que presentan genes superpuestos.55 En estos casos, algunas secuencias de ADN tienen una función doble, codificando una proteína cuando se lee a lo largo de una hebra, y una segunda proteína cuando se lee en la dirección contraria a lo largo de la otra hebra. En bacterias, esta superposición puede estar involucrada en la regulación de latranscripción del gen,56 mientras que en virus los genes superpuestos aumentan la cantidad de información que puede codificarse en sus diminutos genomas.57
Superenrollamiento
Estructura de moléculas de ADN lineales con los extremos fijos y superenrolladas. Por claridad, se ha omitido la estructura en hélice del ADN.
El ADN puede retorcerse como una cuerda en un proceso que se denomina superenrollamiento del ADN (supercoiling , en inglés). Cuando el ADN está en un estado "relajado", una hebra normalmente gira alrededor del eje de la doble hélice una vez cada 10,4 pares de bases, pero si el ADN está retorcido las hebras pueden estar unidas más estrechamente o más relajadamente .58 Si el ADN está retorcido en la dirección de la hélice, se dice que el superenrollamiento es positivo, y las bases se mantienen juntas de forma más estrecha. Si el ADN se retuerce en la dirección opuesta, el superenrollamiento se llama negativo, y las bases se alejan. En la naturaleza, la mayor parte del ADN tiene un ligero superenrollamiento negativo que es producido por enzimasdenominadas topoisomerasas.59 Estas enzimas también son necesarias para liberar las fuerzas de torsión introducidas en las hebras de ADN durante procesos como la transcripción y lareplicación.60 Modificaciones químicas
citosina
5-metil-citosina timina
Estructura de la citosina con y sin el grupo metilo. Tras la desaminación, la 5-metilcitosina tiene la misma estructura que la timina.
Modificaciones de bases del ADN Véase también:Metilación
La expresión de los genes está influenciada por la forma en la que el ADN está empaquetado en cromosomas, en una estructura denominada cromatina. Las modificaciones de bases pueden estar implicadas en el empaquetamiento del ADN: las regiones que presentan una expresión génica baja o nula normalmente contienen niveles altos de metilación de las basescitosina. Por ejemplo, la metilación de citosina produce 5-metil-citosina, que es importante para la inactivación del cromosoma X.61El nivel medio de metilación varía entre organismos: el gusanoCaenorhabditis elegans carece de metilación de citosina, mientras que los vertebrados presentan un nivel alto —hasta 1 %— de su ADN contiene 5-metil-citosina.62 A pesar de la importancia de la 5-metil-citosina, ésta puede desaminarse para generar una base timina. Las citosinas metiladas son por tanto particularmente sensibles a mutaciones.63 Otras modificaciones de bases
incluyen la metilación de adenina en bacterias y la glicosilación de uracilopara producir la "base-J" en kinetoplastos.64 65
Daño del ADN Véase también: Mutación
Molécula de benzopireno, mutágeno presente por ejemplo en el humo del tabaco, ligada una hélice de ADN.66 El ADN puede resultar dañado por muchos tipos de mutágenos, que cambian la secuencia del ADN: agentes alquilantes, además deradiación electromagnéticade alta energía, como luzultravioleta y rayos X. El tipo de daño producido en el ADN depende del tipo de mutágeno. Por ejemplo, la luz UV puede dañar al ADN produciendo dímeros detimina, que se forman por ligamiento cruzado entre bases pirimidínicas.67 Por otro lado, oxidantes tales como radicales libres o elperóxido de hidrógenoproducen múltiples daños, incluyendo modificaciones de bases, sobre todo guanina, y roturas de doble hebra ( double-strand breaks).68 En una célula humana cualquiera, alrededor de 500 bases sufren daño oxidativo cada día.69 70 De estas lesiones oxidativas, las más peligrosas son las roturas de doble hebra, ya que son difíciles de reparar y pueden producir mutaciones puntuales, inserciones y deleciones de la secuencia de ADN, así como translocaciones cromosómicas.71 Muchos mutágenos se posicionan entre dos pares de bases adyacentes, por lo que se denominan agentes intercalantes. La mayoría de los agentes intercalantes son moléculas aromáticas y planas, como el bromuro de etidio, la daunomicina,
la doxorubicina y la talidomida. Para que un agente intercalante pueda integrarse entre dos pares de bases, éstas deben separarse, distorsionando las hebras de ADN y abriendo la doble hélice. Esto inhibe latranscripción y la replicación del ADN, causando toxicidad y mutaciones. Por ello, los agentes intercalantes del ADN son a menudo carcinógenos: el benzopireno, las acridinas, la aflatoxina y el bromuro de etidio son ejemplos bien conocidos.72 73 74 Sin embargo, debido a su capacidad para inhibir la replicación y la transcripción del ADN, estas toxinas también se utilizan enquimioterapia para inhibir el rápido crecimiento de las célulascancerosas.75 El daño en el ADN inicia una respuesta que activa diferentes mecanismos de reparación que reconocen lesiones específicas en el ADN, que son reparadas en el momento para recuperar la secuencia original del ADN. Asimismo, el daño en el ADN provoca una parada en el ciclo celular , que conlleva la alteración de numerosos procesos fisiológicos, que a su vez implica síntesis, transporte y degradación de proteínas (véase también Checkpoint de daños en el ADN). Alternativamente, si el daño genómico es demasiado grande para que pueda ser reparado, los mecanismos de control inducirán la activación de una serie de rutas celulares que culminarán en la muerte celular . Funciones biológicas Las funciones biológicas del ADN incluyen el almacenamiento de información (genes y genoma), la codificación de proteínas (transcripción y traducción) y su autoduplicación (replicación del ADN) para asegurar la transmisión de la información a las células hijas durante la división celular.
Genes y genoma Véanse también: Núcleo celular , Cromatina, Cromosoma y Genoma.
El ADN se puede considerar como un almacén cuyo contenido es la información (mensaje) necesaria para construir y sostener el organismo en el que reside, la cual se transmite de generación en generación. El conjunto de información que cumple esta función en un organismo dado se denomina genoma, y el ADN que lo constituye, ADN genómico. El ADN genómico (que se organiza en moléculas de cromatina que a su vez se ensamblan en cromosomas) se encuentra en el núcleo celular de los eucariotas, además de pequeñas cantidades en lasmitocondrias y cloroplastos. En procariotas, el ADN se encuentra en un cuerpo de forma irregular denominado nucleoide.76
El ADN codificante
ARN polimerasa T7 (azul) produciendo un ARNm (verde) a partir de un molde de ADN (naranja).77 Véase también:Gen
La información genética de ungenoma está contenida en los genes, y al conjunto de toda la información que corresponde a un organismo se le denomina su genotipo. Un gen es una unidad de herencia y es una región de ADN que influye en una característica particular de un organismo (como el color de los ojos, por ejemplo). Los genes contienen un "marco de lectura abierto" ( open reading frame) que puede transcribirse, además de secuencias reguladoras, tales comopromotores y enhancers, que controlan la transcripción del marco de lectura abierto. Desde este punto de vista, las obreras de este mecanismo son las proteínas. Estas pueden ser estructurales, como las proteínas de los músculos, cartílagos, pelo, etc., o funcionales, como lahemoglobina o las innumerables enzimas del organismo. La función principal de la herencia es la especificación de las proteínas, siendo el ADN una especie de plano o receta para producirlas. La mayor parte de las veces la modificación del ADN provocará una disfunción proteica que dará lugar a la aparición de alguna enfermedad. Pero en determinadas ocasiones, las modificaciones podrán provocar cambios beneficiosos que darán lugar a individuos mejor adaptados a su entorno. Las aproximadamente treinta mil proteínas diferentes en el cuerpo humano están constituidas por veinte aminoácidos diferentes, y una molécula de ADN debe especificar la secuencia en que se unen dichos aminoácidos. En el proceso de elaborar una proteína, el ADN de un gen se lee y se transcribe a ARN. Este ARN sirve como mensajero entre el ADN y la maquinaria que elaborará las proteínas y por eso recibe el nombre de ARN mensajero o ARNm. El
ARN mensajero sirve de molde a la maquinaria que elabora las proteínas, para que ensamble los aminoácidos en el orden preciso para armar la proteína. El dogma central de la biología molecular establecía que el flujo de actividad y de información era: ADN → ARN → proteína. No obstante, en la actualidad ha quedado demostrado que este "dogma" debe ser ampliado, pues se han encontrado otros flujos de información: en algunos organismos (virus de ARN) la información fluye de ARN a ADN; este proceso se conoce como "transcripción inversa o reversa", también llamada "retrotranscripción". Además, se sabe que existen secuencias de ADN que se transcriben a ARN y son funcionales como tales, sin llegar a traducirse nunca a proteína: son los ARN no codificantes, como es el caso de los ARN interferentes.34 35
El ADN no codificante El ADN del genoma de un organismo puede dividirse conceptualmente en dos: el que codifica las proteínas (los genes) y el que no codifica. En muchas especies, solo una pequeña fracción del genoma codifica proteínas. Por ejemplo, solo alrededor del 1,5 % del genoma humano consiste en exones que codifican proteínas (20 000 a 25 000 genes), mientras que más del 90 % consiste en ADN no codificante.78 El ADN no codificante (también denominado ADN basura o junk DNA) corresponde a secuencias del genoma que no generan una proteína (procedentes de transposiciones, duplicaciones, translocaciones y recombinaciones de virus, etc.), incluyendo losintrones. Hasta hace poco tiempo se pensaba que el ADN no codificante no tenía utilidad alguna, pero estudios recientes indican que eso es inexacto. Entre otras funciones, se postula que el llamado "ADN basura" regula la expresión diferencial de los genes.79 Por ejemplo, algunas secuencias tienen afinidad hacia proteínas especiales que tienen la capacidad de unirse al ADN (como los homeodominios, los complejos receptores de hormonas esteroides, etc.), con un papel importante en el control de los mecanismos de trascripción y replicación. Estas secuencias se llaman frecuentemente "secuencias reguladoras", y los investigadores suponen que solo se ha identificado una pequeña fracción de las que realmente existen. La presencia de tanto ADN no codificante en genomas eucarióticos y las diferencias en tamaño del genoma entre especies representan un misterio que es conocido como el "enigma del valor de C".80 Los elementos repetitivos también son elementos funcionales. Si no se considerasen así, se excluiría más del 50 % de los nucleótidos totales, ya que constituyen elementos de repetición. Recientemente, un grupo de investigadores de la Universidad de Yale ha descubierto una secuencia de ADN no codificante que sería la
responsable de que los seres humanos hayan desarrollado la capacidad de agarrar y/o manipular objetos o herramientas.81 Por otro lado, algunas secuencias de ADN desempeñan un papel estructural en los cromosomas: los telómeros y centrómeroscontienen pocos o ningún gen codificante de proteínas, pero son importantes para estabilizar la estructura de los cromosomas. Algunos genes no codifican proteínas, pero sí se transcriben en ARN: ARN ribosómico, ARN de transferencia y ARN de interferencia( ARNi, que son ARN que bloquean la expresión de genes específicos). La estructura de intrones y exones de algunos genes (como los de inmunoglobulinas y protocadherinas) son importantes por permitir los cortes y empalmes alternativos del pre- ARN mensajero que hacen posible la síntesis de diferentes proteínas a partir de un mismo gen (sin esta capacidad no existiría el sistema inmune, por ejemplo). Algunas secuencias de ADN no codificante representan pseudogenes que tienen valor evolutivo, ya que permiten la creación de nuevos genes con nuevas funciones.35Otros ADN no codificantes proceden de la duplicación de pequeñas regiones del ADN; esto tiene mucha utilidad, ya que el rastreo de estas secuencias repetitivas permite estudios de filogenia.
Transcripción y traducción Artículos principales: Transcripción (genética) y Traducción (genética).
En un gen, la secuencia de nucleótidos a lo largo de una hebra de ADN se transcribe a un ARN mensajero (ARNm) y esta secuencia a su vez se traduce a una proteína que un organismo es capaz de sintetizar o "expresar" en uno o varios momentos de su vida, usando la información de dicha secuencia. La relación entre la secuencia de nucleótidos y la secuencia de aminoácidos de la proteína viene determinada por el código genético, que se utiliza durante el proceso de traducción o síntesis de proteínas. La unidad codificadora del código genético es un grupo de tres nucleótidos (triplete), representado por las tres letras iniciales de las bases nitrogenadas (por ej., ACT, CAG, TTT). Los tripletes del ADN se transcriben en sus bases complementarias en el ARN mensajero, y en este caso los tripletes se denominan codones(para el ejemplo anterior, UGA, GUC, AAA). En el ribosoma cada codón del ARN mensajero interacciona con una molécula de ARN de transferencia (ARNt o tRNA ) que contenga el triplete complementario, denominado anticodón. Cada ARNt porta el aminoácido correspondiente al codón de acuerdo con el código genético, de modo que el ribosoma va uniendo los aminoácidos para formar una nueva proteína de acuerdo con las "instrucciones" de la secuencia del ARNm. Existen 64 codones posibles, por lo cual corresponde más de uno para cada aminoácido (por esta duplicidad de
codones se dice que el código genético es un código degenerado: no es unívoco); algunos codones indican la terminación de la síntesis, el fin de la secuencia codificante; estos codones de terminación o codones de parada son UAA, UGA y UAG (en inglés, nonsense codons o stop codons).34
Replicación del ADN
Esquema representativo de la replicación del ADN. Artículo principal: Replicación de ADN
La replicación del ADN es el proceso por el cual se obtienen copias o réplicas idénticas de una molécula de ADN. La replicación es fundamental para la transferencia de la información genética de una generación a la siguiente y, por ende, es la base de la herencia. El mecanismo consiste esencialmente en la separación de las dos hebras de la doble hélice, las cuales sirven de molde para la posterior síntesis de cadenas complementarias a cada una de ellas, que llevará por nombre ARNm. El resultado final son dos moléculas idénticas a la original. Este tipo de replicación se denomina semiconservativa debido a que cada una de las dos moléculas resultantes de la duplicación presenta una cadena procedente de la molécula "madre" y otra recién sintetizada.
Hipótesis sobre la duplicación del ADN En un principio, se propusieron tres hipótesis:
Semiconservativa: Según el experimento de Meselson-Stahl, cada hebra
sirve de molde para que se forme una hebra nueva, mediante la complentariedad de bases, quedando al final dos dobles hélices formadas por una hebra antigua (molde) y una nueva hebra (copia).
Conservativa: Tras la duplicación quedarían las dos hebras antiguas juntas
y, por otro lado, las dos hebras nuevas formando una doble hélice.
Dispersiva: Según esta hipótesis, las hebras resultantes estarían formadas
por fragmentos en doble hélice ADN antiguo y ADN recién sintetizado. Interacciones ADN-proteína Todas las funciones del ADN dependen de sus interacciones con proteínas. Estas interacciones pueden ser inespecíficas, o bien la proteína puede unirse de forma específica a una única secuencia de ADN. También pueden unirse enzimas, entre las cuales son particularmente importantes las polimerasas, que copian las secuencia de bases del ADN durante la transcripción y la replicación.
Proteínas que unen ADN Interacciones inespecíficas
Interacción de ADN con histonas (en blanco, arriba). Los aminoácidos básicos de estas proteínas (abajo a la izquierda, en azul) se unen a los grupos ácidos de los fosfatos del ADN (abajo a la derecha, en rojo). Las proteínas estructurales que se unen al ADN son ejemplos bien conocidos de interacciones inespecíficas ADN-proteínas. En los cromosomas, el ADN se encuentra formando complejos con proteínas estructurales. Estas proteínas organizan el ADN en una estructura compacta denominada cromatina. En eucariotas esta estructura implica la unión del ADN a un complejo formado por pequeñas proteínas básicas denominadas histonas, mientras que enprocariotas están involucradas una gran variedad de proteínas.8283 Las histonas forman un complejo de forma cilíndrica denominado nucleosoma, en torno al cual se enrollan casi dos vueltas de ADN de doble hélice. Estas interacciones inespecíficas quedan determinadas por la existencia de residuos básicos en las histonas, que forman enlaces iónicos con el esqueleto de azúcar-fosfato del ADN y, por tanto, son en gran parte independientes de la secuencia de bases.84 Estos aminoácidos básicos experimentan modificaciones químicas de metilación, fosforilación y acetilación,85que alteran la fuerza de la interacción
entre el ADN y las histonas, haciendo al ADN más o menos accesible a los factores de transcripción y por tanto modificando la tasa de transcripción.86 Otras proteínas que se unen a ADN de manera inespecífica en la cromatina incluyen las proteínas del grupo de alta movilidad (HMG, High Mobility Group ) que se unen a ADN plegado o distorsionado.87 Estas proteínas son importantes durante el plegamiento de los nucleosomas, organizándolos en estructuras más complejas para constituir los cromosomas 88 durante el proceso de condensación cromosómica. Se ha propuesto que en este proceso también intervendrían otras proteínas, formando una especie de "andamio" sobre el cual se organiza la cromatina; los principales componentes de esta estructura serían la enzimatopoisomerasa II α (topoIIalpha) y la condensina 13S.89 Sin embargo, el papel estructural de la topoIIalpha en la organización de los cromosomas aún es discutido, ya que otros grupos argumentan que esta enzima se intercambia rápidamente tanto en los brazos cromosómicos como en los cinetocoros durante lamitosis.90
Interacciones específicas Un grupo bien definido de proteínas que unen ADN es el conformado por las proteínas que se unen específicamente a ADN monocatenario o ADN de hebra sencilla (ssDNA). En humanos, la proteína A de replicación es la mejor conocida de su familia y actúa en procesos en los que la doble hélice se separa, como lareplicación del ADN, la recombinación o la reparación del ADN.91Estas proteínas parecen estabilizar el ADN monocatenario, protegiéndolo para evitar que forme estructuras de tallo-lazo (stem-loop) o que sea degradado por nucleasas.
El factor de transcripción represor del fago lambda unido a su ADN diana mediante un motivo hélice-giro-hélice (helix-turn-helix).92 Sin embargo, otras proteínas han evolucionado para unirse específicamente a secuencias particulares de ADN. La especificidad de la interacción de las proteínas con el ADN procede de los múltiples contactos con las bases de ADN, lo que les permite "leer" la secuencia del ADN. La mayoría de esas interacciones con las bases ocurre en lahendidura mayor , donde las bases son más accesibles.93 Las proteínas específicas estudiadas con mayor detalle son las encargadas de regular la transcripción, denominadas por ello factores de transcripción. Cada factor de transcripción se une a una secuencia concreta de ADN y activa o inhibe la transcripción de los genes que presentan estas secuencias próximas a sus promotores. Los factores de transcripción pueden efectuar esto de dos formas:
En primer lugar, pueden unirse a la polimerasa de ARN responsable de la transcripción, bien directamente o a través de otras proteínas mediadoras. De esta forma. se estabiliza la unión entre la ARN polimerasa y el promotor, lo que permite el inicio de la transcripción.94 En segundo lugar, los factores de transcripción pueden unirse aenzimas que modifican las histonas del promotor, lo que altera la accesibilidad del molde de ADN a la ARN polimerasa .95
Como los ADN diana pueden encontrarse por todo el genoma del organismo, los cambios en la actividad de un tipo de factor de transcripción pueden afectar a miles de genes.96 En consecuencia, estas proteínas son frecuentemente las dianas de los procesos detransducción de señales que controlan las respuestas a cambios ambientales o diferenciación y desarrollo celular.
La enzima de restricción EcoRV (verde) formando un complejo con su ADN diana.97
Enzimas que modifican el ADN
Nucleasas y ligasas Las nucleasas sonenzimas que cortan las hebras de ADN mediante la catálisis de la hidrólisis de losenlaces fosfodiéster . Las nucleasas que hidrolizan nucleótidos a partir de los extremos de las hebras de ADN se denominan exonucleasas, mientras que las endonucleasascortan en el interior de las hebras. Las nucleasas que se utilizan con mayor frecuencia en biología molecular son las enzimas de restricción, endonucleasas que cortan el ADN por determinadas secuencias específicas. Por ejemplo, la enzima EcoRV, que se muestra a la izquierda, reconoce la secuencia de 6 bases 5′ -GAT|ATC-3′, y hace un corte en ambas hebras en la línea vertical indicada, generando dos moléculas de ADN con los extremos romos. Otras enzimas de restricción generan sin embargo extremos cohesivos, ya que cortan de forma diferente las dos hebras de ADN. En la naturaleza, estas enzimas protegen a las bacterias contra las infecciones de fagos, al digerir el ADN de dicho fago cuando entra a través de la pared bacteriana, actuando como un mecanismo de defensa.98 En biotecnología, estas nucleasas específicas de la secuencias de ADN se utilizan en ingeniería genética para clonar f ragmentos de ADN y en la técnica de huella genética. Las enzimas denominadas ADN ligasas pueden reunir hebras de ADN cortadas o rotas.99 Las ligasas son particularmente importantes en la replicación de la hebra que sufre replicación discontinua en el ADN, ya que unen los fragmentos cortos de ADN generados en la horquilla de replicación para formar una copia completa del molde de ADN. También se utilizan en la reparación del ADN y en procesos de recombinación genética.99
Topoisomerasas y helicasas Las topoisomerasas son enzimas que poseen a la vez actividad nucleasa y ligasa. Estas proteínas varían la cantidad de ADN superenrollado. Algunas de estas enzimas funcionan cortando la hélice de ADN y permitiendo que una sección rote, de manera que reducen el grado de superenrollamiento. Una vez hecho esto, la enzima vuelve a unir los fragmentos de ADN.59 Otros tipos de enzimas son capaces de cortar una hélice de ADN y luego pasar la segunda hebra de ADN a través de la rotura, antes de reunir las hélices.100 Las topoisomerasas son necesarias para muchos procesos en los que interviene el ADN, como la replicación del ADNy la transcripción.60 Las helicasas son unas proteínas que pertenecen al grupo de losmotores moleculares. Utilizan energía química almacenada en los nucleósidos trifosfatos, fundamentalmente ATP, para romper puentes de hidrógeno entre bases y separar la doble hélice de ADN en hebras simples.101 Estas enzimas son esenciales para
la mayoría de los procesos en los que las enzimas necesitan acceder a las bases del ADN.
Polimerasas Las polimerasas son enzimas que sintetizan cadenas de nucleótidos a partir de nucleósidos trifosfatos. La secuencia de sus productos son copias de cadenas de polinucleótidos existentes, que se denominan moldes. Estas enzimas funcionan añadiendo nucleótidos al grupo hidroxilo en 3' del nucleótido previo en una hebra de ADN. En consecuencia, todas las polimerasas funcionan en dirección 5′ --> 3′ .102 En los sitios activos de estas enzimas, el nucleósido trifosfato que se incorpora aparea su base con la correspondiente en el molde: esto permite que la polimerasa sintentice de forma precisa la hebra complementaria al molde. Las polimerasas se clasifican de acuerdo al tipo de molde que utilizan:
En la replicación del ADN, una ADN polimerasa dependiente de ADN realiza una copia de ADN a partir de una secuencia de ADN. La precisión es vital en este proceso, por lo que muchas de estas polimerasas tienen una actividad de verificación de la lectura ( proofreading ). Mediante esta actividad, la polimerasa reconoce errores ocasionales en la reacción de síntesis, debido a la falta de apareamiento entre el nucleótido erróneo y el molde, lo que genera un desacoplamiento ( mismatch). Si se detecta un desacoplamiento, se activa una actividadexonucleasa en dirección 3′ --> 5′ y la base incorrecta se elimina.103 En la mayoría de los organismos las ADN polimerasas funcionan en un gran complejo denominadoreplisoma, que contiene múltiples unidades accesorias, comohelicasas.104 Las ADN polimerasas dependientes de ARN son una clase especializada de polimerasas que copian la secuencia de una hebra de ARN en ADN. Incluyen la transcriptasa inversa, que es una enzima viral implicada en la infección de células por retrovirus, y la telomerasa, que es necesaria para la replicación de los telómeros.105 43 La telomerasa es una polimerasa inusual, porque contiene su propio molde de ARN como parte de su estructura.44 La transcripción se lleva a cabo por una ARN polimerasa dependiente de ADN que copia la secuencia de una de las hebras de ADN en ARN. Para empezar a transcribir un gen, la ARN polimerasa se une a una secuencia del ADN denominada promotor , y separa las hebras del ADN. Entonces copia la secuencia del gen en un transcrito de ARN mensajero hasta que alcanza una región de ADN denomimada terminador , donde se detiene y se separa del ADN. Como ocurre con las ADN polimerasas dependientes de ADN en humanos, la ARN polimerasa II (la enzima que transcribe la