Contenido Checked

Codigo genetico

Temas relacionados: Biología

Acerca de este escuelas selección Wikipedia

Este contenido de Wikipedia ha sido seleccionada por SOS para su utilización en las escuelas de todo el mundo. Visite el sitio web de Aldeas Infantiles SOS en http://www.soschildren.org/

Una serie de codones en parte de una molécula de ARNm. Cada codón consta de tres nucleótidos, que representan un solo aminoácido .

El código genético es el conjunto de reglas por las cuales la información codificada en el material genético ( ADN o Las secuencias de ARN) es traducido en proteínas ( aminoácidos secuencias) por que viven las células . Específicamente, el código define un mapeo entre tri- secuencias de nucleótidos llamados codones, y aminoácidos; cada triplete de nucleótidos en una secuencia de ácido nucleico que especifica un único aminoácido. Debido a que la gran mayoría de genes están codificados con exactamente el mismo código (ver #RNA codón de mesa ), este código en particular se refiere a menudo como el código genético canónica o estándar, o simplemente el código genético, aunque de hecho hay muchos variantes de códigos; Así, el código genético canónico no es universal. Por ejemplo, en los seres humanos, la síntesis de proteínas en las mitocondrias se basa en un código genético que varía a partir del código canónico.

Es importante saber que no toda la información genética se almacena como el código genético. Todos los organismos de ADN 'contiene secuencias reguladoras, segmentos intergénicas, áreas estructurales cromosómicas, lo que puede contribuir en gran medida a fenotipo, pero operar utilizando una clara conjuntos de reglas que puede o no puede ser tan sencillo como el paradigma bien definido-codón-a-amino ácido que subyace en el código genético.

Descifrando el código genético

El código genético

Después de la estructura del ADN fue descifrada por James Watson , Francis Crick , Maurice Wilkins y Rosalind Franklin, serios esfuerzos para entender la naturaleza de la codificación de las proteínas comenzó. George Gamov postula que un código de tres letras debe ser empleado para codificar los 20 diferentes aminoácidos utilizados por las células vivas para codificar proteínas (3 porque es el más pequeño de tal manera que n 4 n es al menos 20). El hecho de que los codones tenían constan de tres bases de ADN se demostró primero en el Crick, Brenner et al. experimento. La primera elucidación de un codón de hecho por Marshall Nirenberg y Heinrich J. Matthaei en 1961 en el Institutos Nacionales de Salud. Utilizaron un sistema libre de células a traducir una secuencia poli-uracilo ARN (o UUUUU ... en términos bioquímicos) y descubrió que el polipéptido habían sintetizado consistía en sólo el aminoácido fenilalanina. Ellos por lo tanto deducirse de este poli-fenilalanina que el codón UUU especifica la fenilalanina amino-ácido. La extensión de este trabajo, Nirenberg y sus colaboradores fueron capaces de determinar la composición de nucleótidos de cada codón. Con el fin de determinar el orden de la secuencia, trinucleótidos estaban ligados a los ribosomas y radiactivamente etiquetados aminoacil-tRNA se utilizó para determinar qué amino ácido correspondió a la codón. El grupo de Nirenberg fue capaz de determinar las secuencias de 54 de los 64 codones. Los trabajos posteriores por Har Gobind Khorana identificó el resto del código, y poco después Robert W. Holley determinó la estructura de ARN de transferencia, la molécula de adaptador que facilita la traducción. Este trabajo se basa en los estudios anteriores de Severo Ochoa, quien recibió el premio Nobel en 1959 por su trabajo en la enzimología de la síntesis de ARN. En 1968, Khorana, Holley y Nirenberg también recibieron el Premio Nobel de Fisiología o Medicina por su trabajo.

La transferencia de información a través del código genético

La genoma de un organismo se inscribe en el ADN , o en algunos virus RNA. La porción del genoma que codifica para una proteína o un ARN se conoce como una gen. Los genes que codifican para las proteínas se componen de unidades de tri-nucleótidos llamados codones, cada uno de codificación para un solo aminoácido. Cada sub-unidad de nucleótido consiste en una fosfato, el azúcar desoxirribosa y una de las 4 nitrogenada bases de nucleótidos. La bases de purina adenina (A) y guanina (G) son más grandes y constan de dos anillos aromáticos. La bases de pirimidina citosina (C) y timina (T) son más pequeños y se componen de un solo anillo aromático. En la configuración de doble hélice, dos hebras de ADN están unidas entre sí por enlaces de hidrógeno en una disposición conocida como apareamiento de bases. Estos bonos casi siempre se forman entre una base de adenina en una hebra y una timina en la otra hebra, y entre una base de citosina en una cadena y una base guanina en el otro. Esto significa que el número de residuos de A y T será el mismo en una doble hélice dado al igual que el número de residuos G y C. En el ARN, la timina (T) se sustituye por uracilo (U), y la desoxirribosa está sustituido con ribosa.

Cada gen codificante de la proteína es transcribe en una molécula plantilla de la ARN polímero relacionado, conocido como ARN mensajero o ARNm. Esto a su vez es traducido en el ribosoma en un aminoácido de cadena o polipéptido. El proceso de traducción requiere ARN de transferencia específicas para los aminoácidos individuales con los aminoácidos unido covalentemente a ellos, trifosfato de guanosina como fuente de energía, y un número de factores de traducción. ARNt tiene anticodones complementarios a los codones de ARNm y puede ser "cargado" de forma covalente con aminoácidos en su terminal 3 'CCA. ARNt individuales están acusados de aminoácidos específicos de enzimas conocidas como sintetasas aminoacil tRNA que tienen alta especificidad para ambos sus aminoácidos afines y tRNAs. La alta especificidad de estas enzimas es una razón importante por la que se mantiene la fidelidad de la traducción de proteínas.

Hay combinaciones posibles 4³ = 64 codones diferente con un codón triplete de tres nucleótidos. En realidad, todos los 64 codones del código genético estándar están asignados, ya sea para los aminoácidos o dejan de señales durante la traducción. Si, por ejemplo, una secuencia de ARN, se considera UUUAAACCC y la marco de lectura se inicia con la primera U (por convención, 5 'a 3' ), hay tres codones, a saber, UUU, AAA y CCC, cada uno de los cuales especifica un aminoácido. Esta secuencia de ARN se traduce en una secuencia de aminoácidos, tres aminoácidos de longitud. Una comparación puede hacerse con la informática , donde el codón es el equivalente de una palabra, que es el "fragmento" estándar para la manipulación de datos (como un aminoácido de una proteína), y un nucleótido para una bit.

El código genético estándar se muestra en las siguientes tablas. La Tabla 1 muestra lo aminoácido cada uno de los 64 codones especifica. La Tabla 2 muestra lo codones especifican cada uno de los 20 aminoácidos estándar implicados en la traducción. Estos se llaman adelante y atrás tablas de codones, respectivamente. Por ejemplo, el codón de AAU representa el aminoácido asparagina y UGU y UGC representan cisteína (designaciones de tres letras estándar, Asn y Cys, respectivamente).

Mesa de ARN codón

La tabla muestra los codones 64 y el aminoácido para cada uno. La dirección del mRNA es 5 'a 3'.
2da base
U C La G
Primero
base
U

UUU (Phe / F) La fenilalanina
NVND (Phe / F) La fenilalanina
UUA (Leu / L) La leucina
UUG (Leu / L) leucina

UCU (Ser / S) Serina
UCC (Ser / S) Serina
UCA (Ser / S) Serina
UCG (Ser / S) Serina

UAU (Tyr / Y) Tirosina
UAC (Tyr / Y) Tirosina
UAA Ocre (Stop)
UAG Ámbar (Stop)

UGU (Cys / C) Cisteína
UGC (/ C Cys) cisteína
UGA Opal (Stop)
UGG (Trp / W) El triptófano

C

CUU (Leu / L) leucina
CUC (Leu / L) leucina
CUA (Leu / L) leucina
CUG (Leu / L) leucina

CCU (Pro / P) Proline
CCC (Pro / P) Proline
CCA (Pro / P) Proline
CCG (Pro / P) Proline

CAU (Su / H) La histidina
CAC (Su / H) Histidina
CAA (Gln / Q) Glutamina
CAG (Gln / Q) Glutamina

CGU (Arg / R) Arginina
CGC (Arg / R) arginina
CGA (Arg / R) arginina
CGG (Arg / R) arginina

La

AUU (Ile / I) Isoleucina
AUC (/ I Ile) Isoleucina
AUA (/ I Ile) Isoleucina
Agosto (Met / M) La metionina, Start

ACU (Thr / T) Treonina
ACC (Thr / T) treonina
ACA (Thr / T) Treonina
ACG (Thr / T) treonina

AAU (Asn / N) La asparagina
AAC (Asn / N) asparagina
AAA (Lys / K) Lisina
AAG (Lys / K) lisina

AGU (Ser / S) Serina
AGC (Ser / S) Serina
AGA (Arg / R) arginina
AGG (Arg / R) arginina

G

GUU (Val / V) Valina
GUC (Val / V) Valina
GUA (Val / V) Valina
GUG (Val / V) Valina

GCU (Ala / A) Alanina
GCC (Ala / A) alanina
GCA (Ala / A) alanina
GCG (Ala / A) alanina

GAU (Asp / D) El ácido aspártico
GAC (/ D Asp) El ácido aspártico
GAA (Glu / E) Ácido glutamico
GAG (/ E Glu) de ácido glutámico

GGU (Gly / G) Glicina
GGC (Gly / G) glicina
GGA (Gly / G) glicina
GGG (Gly / G) glicina

Mesa Inversa
Ala / A GCU, GCC, GCA, GCG Leu / L UUA, UUG, CUU, CUC, CUA, CUG
Arg / R CGU, CGC, CGA, CGG, AGA, AGG Lys / K AAA, AAG
Asn / N AAU, AAC Met / M Agosto
Asp / D GAU, GAC Phe / F UUU, NVND
Cys / C UGU, UGC Pro / P CCU, CCC, CCA, CCG
Gln / Q CAA, CAG Ser / S UCU, UCC, UCA, UCG, AGU, AGC
Glu / E GAA, GAG Thr / T ACU, ACC, ACA, ACG
Gly / G GGU, GGC, GGA, GGG Trp / W UGG
Su / H CAU, CAC Tyr / Y UAU, UAC
Ile / I AUU, AUC, AUA Val / V GUU, GUC, GUA, GUG
INICIO Agosto DETÉNGASE UAG, UGA, SAU

Características sobresalientes

El marco de lectura de una secuencia

Tenga en cuenta que un codón se define por el nucleótido inicial de la que se inicia la traducción. Por ejemplo, la cadena GGGAAACCC, si se lee desde la primera posición, contiene los codones de GGG, y CCC AAA; y si se lee desde la segunda posición, que contiene los codones GGA y AAC; si se lee a partir de la tercera posición, y GAA ACC. Codones parciales han sido ignoradas en este ejemplo. Cada secuencia de este modo se puede leer en tres marcos de lectura, cada uno de los cuales se producen una secuencia de aminoácidos diferente (en el ejemplo dado, Gly-Lys-Pro, Gly-Asp, o Glu-Thr, respectivamente). Con el ADN de doble cadena que hay seis posibles marcos de lectura, tres en la orientación hacia delante en una cadena y tres atrás (en la vertiente opuesta).

El marco real en el que una secuencia de proteína se traduce está definido por una codón de inicio, por lo general el primer codón AUG en la secuencia de ARNm. Las mutaciones que alteran el marco de lectura por inserciones o deleciones de un no-múltiplo de 3 bases de nucleótidos se conocen como mutaciones de cambio. Estas mutaciones pueden perjudicar la función de la proteína resultante, si se forma, por lo que son poco frecuentes en en las secuencias codificadoras de proteínas in vivo. A menudo tales proteínas mal formados son objeto de la degradación proteolítica. Además, una mutación por cambio de marco es muy probable que cause un codón de parada para ser leído que trunca la creación de la proteína (ejemplo ). Una razón de la rareza de mutaciones marco de cambios se heredan es que si la proteína está traduciendo es esencial para el crecimiento bajo las presiones selectivas del organismo enfrenta, la ausencia de una proteína funcional puede causar letalidad antes de que el organismo es viable.

Iniciar / detener los codones

La traducción comienza con una cadena de codón de iniciación (codón de inicio). A diferencia de los codones de parada, el codón sí sola no es suficiente para iniciar el proceso. Secuencias cercanas y También se requieren factores de iniciación para iniciar la traducción. El codón de inicio más común es AUG, que codifica para la metionina, por lo que la mayoría de las cadenas de aminoácidos comienzan con metionina.

El árbol codones de parada se han dado nombres: UAG está en ámbar, UGA es ópalo (a veces también llamado ocre) y UAA es ocre. "Amber" fue nombrado por los descubridores Richard Epstein y Charles Steinberg después de su amigo Harris Bernstein, cuyo apellido significa "ámbar" en alemán. Los otros dos codones de parada fueron nombrados 'ocre "y" opal "con el fin de mantener el" tema de color nombres ". Detener codones también se llaman codones de terminación y señal de liberación del polipéptido naciente del ribosoma debido a la unión de liberar factores en ausencia de tRNAs afines con anticodones complementarias a estas señales de parada.

La degeneración del código genético

El código genético tiene redundancia pero hay ambigüedad (ver las tablas de codones anteriormente para la correlación completa). Por ejemplo, aunque los codones GAA y GAG tanto especifican ácido glutámico (redundancia), ninguno de ellos especifica cualquier otro aminoácido (sin ambigüedad). Los codones que codifican un aminoácido pueden diferir en cualquiera de sus tres posiciones. Por ejemplo, el aminoácido ácido glutámico está especificado por GAA y GAG codones (diferencia en la tercera posición), el aminoácido leucina se especifica por UUA, UUG, CUU, CUC, CUA, los codones CUG (diferencia en la primera o tercera posición), mientras que el aminoácido serina se especifica mediante UCA, UCG, UCC, UCU, AGU, AGC (diferencia en la primera, segunda o tercera posición).

Una posición de un codón se dice que es un sitio degenerada de cuatro veces si cualquier nucleótido en esta posición especifica el mismo aminoácido. Por ejemplo, la tercera posición de la codones de glicina (GGA, GGG, GGC, GGU) es un sitio de cuatro veces degeneran, porque todas las sustituciones de nucleótidos en este sitio son sinónimos, es decir, que no cambian el aminoácido. Sólo la tercera posición de algunos codones pueden ser cuatro veces degeneran. Una posición de un codón se dice que es un sitio degenerada doble aunque sólo dos de los cuatro posibles nucleótidos en esta posición especifican el mismo aminoácido. Por ejemplo, la tercera posición de la codones de ácido glutámico (GAA, GAG) es un sitio degenerado doble, por lo que es la primera posición de la codones de leucina (UCA, UCC, CCU, CCC, CCA, CCG). En sitios degenerados al doble, los nucleótidos equivalentes son siempre o dos purinas (A / G) o dos pirimidinas (C / U), sustituciones tan sólo transversional (purina a pirimidina o pirimidina a purina) en sitios degenerados al doble son nonsynonymous. Una posición de un codón se dice que es un sitio no degenerado si cualquier mutación en esta posición da como resultado la sustitución de aminoácidos. Sólo hay un sitio degenerada triple donde el cambio de tres de los cuatro nucleótidos no tiene efecto sobre el aminoácido, mientras que el cambio de los posibles resultados cuarto de nucleótidos en una sustitución de aminoácido. Esta es la tercera posición de una codón de isoleucina: AUU, AUC, o AUA todo isoleucina codificar, pero codifica agosto metionina. En computación esta posición es a menudo tratada como un sitio degenerado doble.

Hay tres aminoácidos codificados por seis codones diferentes: serina, leucina, arginina. Sólo dos aminoácidos son especificados por un solo codón; uno de ellos es el ácido amino- metionina, especificado por el codón AUG, que también especifica el inicio de la traducción; el otro es triptófano, especificado por el codón UGG. La degeneración del código genético es lo que explica la existencia de mutaciones silenciosas.

La degeneración resultados porque un código de tripletes designa 20 aminoácidos y un codón de parada. Debido a que hay cuatro bases, se requiere que los codones de triplete para producir al menos 21 códigos diferentes. Por ejemplo, si hay dos bases por codón, entonces sólo 16 aminoácidos pueden ser codificados para (4² = 16). Debido a que se requieren al menos 21 códigos, entonces 4³ da 64 codones posibles, lo que significa que debe existir cierta degeneración.

Estas propiedades del código genético que sea más tolerante a fallos para mutaciones puntuales. Por ejemplo, en teoría, codones de cuatro veces degeneran pueden tolerar ninguna mutación puntual en la tercera posición, aunque codón uso sesgo restringe en la práctica en muchos organismos; codones degenerados al doble pueden tolerar una de las tres posibles mutaciones puntuales en la tercera posición. Desde mutaciones de transición (purina a purina o pirimidina a mutaciones de pirimidina) son más propensos que transversion (purina a pirimidina o viceversa) mutaciones, la equivalencia de las purinas o de pirimidinas en sitios doble degenerados añade una tolerancia a fallos más.

Agrupación de los codones de residuo de aminoácido volumen molar y hydropathy.

Una consecuencia práctica de la redundancia es que algunos errores en el código genético sólo causan una mutación silenciosa o un error que no afectaría a la proteína porque la hidrofilicidad o hidrofobicidad se mantiene por sustitución equivalente de aminoácidos; por ejemplo, un codón de Nun (donde N = cualquier nucleótido) tiende a codificar para aminoácidos hidrófobos. Rendimientos NCN residuos de aminoácidos que son de tamaño pequeño y moderado en hydropathy; NAN codifica tamaño promedio de residuos hidrofílicos; UNN codifica residuos que no son hidrófilos.

Aun así, mutaciones puntuales individuales todavía pueden causar proteínas disfuncionales. Por ejemplo, una mutado gen de la hemoglobina provoca la enfermedad de células falciformes . En la hemoglobina mutante un hidrófila glutamato (Glu) es sustituido por el hidrófobo valina (Val), que reduce la solubilidad de β-globina. En este caso, esta mutación causas la hemoglobina para formar polímeros lineales unidos por la interacción hidrófoba entre los grupos de valina que causan la deformación falciforme de eritrocitos. Enfermedad de células falciformes generalmente no es causada por una de novo mutación. Más bien, se selecciona en la malaria regiones (de una manera similar a la talasemia), como personas heterocigotos tienen una cierta resistencia a la malaria Parásito Plasmodium ( heterocigotos ventaja).

Estos códigos variables para los aminoácidos están permitidas porque de bases modificadas en la primera base de la anticodón del ARNt, y el par de bases formado se llama una bamboleo de pares de bases. Las bases modificadas incluyen inosina y el par de bases no-Watson-Crick UG.

Las variaciones en el código genético estándar

Mientras que pequeñas variaciones en el código estándar habían predicho anteriormente, ninguno fue descubierto hasta 1979, cuando los investigadores estudiar genes mitocondriales humanos descubrieron que utilizan un código alternativo. Muchos ligeras variantes se han descubierto desde entonces, incluyendo diversos códigos mitocondriales alternativos, así como variantes pequeños, tales como Mycoplasma la traducción del codón UGA como triptófano. En bacterias y arqueas, GUG y UUG son codones de inicio comunes. Sin embargo, en casos raros, ciertas proteínas específicas pueden utilizar iniciación alternativo (inicio) codones que no suelen utilizarse por esa especie.

En ciertas proteínas, aminoácidos no estándar se sustituyen por codones de parada estándar, dependiendo de las secuencias señal asociadas en el ARN mensajero: UGA puede codificar selenocysteine y UAG puede codificar pyrrolysine como se discute en los artículos pertinentes. Selenocysteine se considera actualmente como el aminoácido 21, y pyrrolysine es vista como la 22a. Una descripción detallada de las variaciones en el código genético se puede encontrar en la El sitio web NCBI.

A pesar de estas diferencias, todos los códigos conocidos tienen fuertes similitudes entre sí, y el mecanismo de codificación es el mismo para todos los organismos: codones de tres bases, tRNA, ribosomas, la lectura del código en la misma dirección y traducir el código de tres letras en un momento en secuencias de aminoácidos.

Las teorías sobre el origen del código genético

A pesar de las variaciones que existen, los códigos genéticos utilizados por todas las formas de vida conocidas en la Tierra son muy similares. Puesto que hay muchos códigos genéticos posibles que se cree que tienen una utilidad similar a la utilizada por la vida de la Tierra, la teoría de la evolución sugiere que se estableció el código genético muy temprano en la historia de la vida, con el análisis filogenético de ARN de transferencia sugiere que ARNt unas moléculas evolucionado antes de que el actual conjunto de aminoacil-tRNA sintetasas.

El código genético no es una asignación aleatoria de codones para los aminoácidos. Por ejemplo, los aminoácidos que comparten la misma ruta biosintética tienden a tener la misma primera base en sus codones, y los aminoácidos con propiedades físicas similares tienden a tener codones similares.

Hay tres temas que se ejecutan a través de las muchas teorías que tratan de explicar la evolución del código genético (y de ahí el origen de estos patrones). Uno se ilustra por la reciente aptámero experimentos que muestran que algunos aminoácidos tienen una afinidad química selectiva para la base de tripletes que codifican para ellos. Esto sugiere que el mecanismo de traducción actual, complejo que implica ARNt y enzimas asociadas pueden ser un desarrollo posterior, y que en un principio, las secuencias de proteínas fueron con plantilla directamente en secuencias de bases. Otra es que el código genético estándar que vemos hoy en día creció de una, el código anterior más simple a través de un proceso de "expansión biosintética". Aquí la idea es que la vida primordial "descubierto" nuevos aminoácidos (por ejemplo, como los subproductos del metabolismo) y más tarde volver incorporado-algunos de ellos en la maquinaria de la codificación genética. Aunque se ha encontrado mucha evidencia circunstancial que sugiere que un menor número de aminoácidos diferentes se utilizaron en el pasado que hoy en día, hipótesis precisas y detalladas sobre exactamente qué aminoácidos entraron en el código exactamente en qué orden ha demostrado ser mucho más controvertida. Una tercera teoría es que la selección natural ha llevado a las asignaciones de codones del código genético que minimicen los efectos de mutaciones.

Recuperado de " http://en.wikipedia.org/w/index.php?title=Genetic_code&oldid=224375753 "