Conteúdo verificado

Código genético

Disciplinas relacionadas: Biologia

Sobre este escolas selecção Wikipedia

Este conteúdo da Wikipedia foi escolhida pela SOS Children para adequação nas escolas de todo o mundo. Visite o site da SOS Children at http://www.soschildren.org/

Uma série de codões, em parte, de um molécula de ARNm. Cada codão consiste em três nucleótidos, representando um único aminoácido .

O código genético é o conjunto de regras pelo qual a informação codificada no material genético ( DNA ou Sequências de ARN) é traduzido em proteínas ( aminoácidos ) por seqüências que vivem células . Especificamente, o código define um mapeamento entre tri- sequências de nucleótidos chamados codões e aminoácidos; cada tripleto de nucleótidos numa sequência de ácido nucleico especifica de um único aminoácido. Uma vez que a grande maioria de os genes são codificados com o mesmo código (ver tabela #RNA codão ), este código particular é frequentemente referido como o código genético canónico ou padrão, ou simplesmente o código genético, embora, de facto, existem muitas variantes de códigos; Assim, o código genético canónico não é universal. Por exemplo, em humanos, a síntese de proteínas na mitocôndria depende de um código genético que varia a partir do código canónica.

É importante saber que nem toda a informação genética é armazenada como o código genético. DNA de todos os organismos contêm sequências regulatórias, segmentos intergênicos, áreas estruturais cromossômicas, o que pode contribuir grandemente para fenótipo, mas que operam usando um conjuntos distintos de regras que podem ou não estar tão simples como o paradigma bem definida códon-a-amino ácido que está na base do código genético.

Decifrando o código genético

O código genético

Depois de a estrutura do DNA foi decifrado por James Watson , Francis Crick , Maurice Wilkins e Rosalind Franklin, sérios esforços para compreender a natureza da codificação de proteínas começou. George Gamov postulado que um código de três letras deve ser empregue para codificar os 20 diferentes aminoácidos utilizados pelas células vivas para codificar proteínas (porque é o mais pequeno 3 n tal que n é 4, pelo menos, 20). O facto de codões que consistem de três bases do ADN foi demonstrada pela primeira vez na Crick, Brenner et ai. experimento. A primeira elucidação de um codão foi feito pela Marshall Nirenberg e Heinrich J. Matthaei em 1961 no National Institutes of Health. Eles usaram um sistema isento de células para traduza uma sequência poli-uracila RNA (ou UUUUU ... em termos bioquímicos) e descobriu que o polipéptido que tinham sintetizado consistia em apenas o aminoácido fenilalanina. Eles assim deduzir-se poli-fenilalanina que o codão UUU especificado o aminoácido fenilalanina-. Estendendo este trabalho, Nirenberg e os seus colegas de trabalho foram capazes de determinar a composição de nucleótidos de cada codão. A fim de determinar a ordem da sequência, trinucleótidos foram ligados aos ribossomas e marcado radioactivamente aminoacil-ARNt foi usada para determinar qual aminoácido correspondia ao codão. O grupo de Nirenberg foi capaz de determinar as sequências de 54 de 64 códons. Os trabalhos posteriores por Har Gobind Khorana identificou o resto do código, e pouco tempo depois Robert W. Holley determinada a estrutura de ARN de transferência, a molécula do adaptador que facilita a tradução. Este trabalho foi baseado em estudos anteriores por Severo Ochoa, que recebeu o prêmio Nobel em 1959 por seu trabalho sobre a enzimologia da síntese de RNA. Em 1968, Khorana, Holley e Nirenberg também recebeu o Prêmio Nobel de Fisiologia ou Medicina por seu trabalho.

Transferência de informações através do código genético

O genoma de um organismo é inscrito no ADN , ou em alguns vírus ARN. A porção do genoma que codifica para uma proteína ou um RNA é referido como um gene. Aqueles genes que codificam para proteínas são compostos por unidades de tri-nucleótidos chamados codões, cada um de codificação para um único aminoácido. Cada sub-unidade nucleotídica constituída por um fosfato, açúcar desoxirribose e uma das 4 azotado bases nucleotídicas. O bases de purina adenina (A) e guanina (G) são maiores e consistem em dois anéis aromáticos. O bases de pirimidina citosina (C) e timina (T) são menores e consistem em apenas um anel aromático. Na configuração de dupla hélice, dois filamentos de DNA são unidas umas às outras por ligações de hidrogénio em um arranjo conhecido como emparelhamento base. Estas ligações quase sempre formar entre uma base de adenina numa cadeia e uma timina na outra cadeia e entre uma base de citosina em uma cadeia e uma base guanina na outra. Isto significa que o número de resíduos de A e T será a mesma num dado dupla hélice, como também o número de resíduos G e C. No RNA, a timina (T) é substituído por uracilo (U), e a desoxirribose está substituída por ribose.

Cada gene que codifica a proteína está transcrito numa molécula de RNA molde do polímero relacionado, como conhecido mensageiro ARN ou ARNm. Este por sua vez é traduzidos na ribossomas num aminoácido ou cadeia polipéptido. O processo de tradução requer RNAs de transferência específicos para aminoácidos individuais com os ácidos aminados covalentemente ligados a eles, guanosina trifosfato como fonte de energia, e um número de factores de tradução. tRNAs tem anticódons complementares aos códons de mRNA e pode ser "carregado" de forma covalente com aminoácidos na sua 'terminal 3 CCA termina. ARNt individuais estão carregadas com aminoácidos específicos por enzimas conhecidas como sintetases de ARNt de aminoacilo, que têm uma grande especificidade para ambos os seus aminoácidos e ARNt cognatos. A alta especificidade destas enzimas é uma razão importante pela qual a fidelidade da tradução da proteína é mantida.

Existem 4³ = 64 combinações possíveis de codões diferente com um codão tripleto de três nucleótidos. Na realidade, todos os 64 codões do código genético padrão são atribuídos tanto para os ácidos aminados ou parar sinais durante a tradução. Se, por exemplo, uma sequência de RNA, é considerado UUUAAACCC eo -quadro de leitura começa com a primeira L (por convenção, 5 'para 3' ), há três codões, isto é, UUU, AAA CCC, e cada um dos quais especifica um aminoácido. Esta sequência de ARN irá ser traduzido numa sequência de aminoácidos, três aminoácidos de comprimento. A comparação pode ser efectuada com a ciência computador , em que o codão é o equivalente de um palavra, a qual é o "pedaço" padrão de manipulação de dados (como um aminoácido de uma proteína), e um nucleótido por um bits.

O código genético padrão é mostrado nas seguintes tabelas. A Tabela 1 mostra que o aminoácido cada um dos 64 codões especifica. A Tabela 2 mostra que os codões especificam cada um dos 20 aminoácidos padrão envolvidos na tradução. Estes são chamados de frente e verso, mesas códon, respectivamente. Por exemplo, o codão AAU representa o aminoácido asparagina, e UGU e UGC representam cisteína (designações de três letras padrão, Asn e Cys, respectivamente).

Mesa RNA códon

A tabela mostra os codões 64 e o aminoácido para cada. A direcção do ARNm é 5 'para 3'.
2 de base
U C A G
1
base
U

UUU (Phe / F) Fenilalanina
UUC (Phe / F) fenilalanina
UUA (Leu / L) Leucina
UUG (Leu / L) leucina

UCU (Ser / S) Serina
UCC (Ser / S) Serina
UCA (Ser / S) Serina
UCG (Ser / S) Serina

UAU (Tyr / Y) Tirosina
UAC (Tyr / Y) tirosina
UAA ocre (Stop)
UAG Âmbar (Stop)

UGU (Cys / C) Cisteína
UGC (/ C Cys) Cisteína
UGA Opal (Stop)
UGG (Trp / W) Triptofano

C

CUU (Leu / L) leucina
CUC (Leu / L) leucina
CUA (Leu / L) leucina
CUG (Leu / L) leucina

CCU (Pro / P) Prolina
CCC (Pro / P) prolina
CCA (Pro / P) prolina
CCG (Pro / P) prolina

CAU (His / H) Histidina
CAC (His / H) Histidine
CAA (Gln / Q) Glutamina
CAG (Gln / Q) Glutamina

CGU (Arg / R) Arginina
CGC (Arg / R) Arginina
CGA (Arg / R) Arginina
CGG (Arg / R) Arginina

A

AUU (Ile / I) Isoleucina
AUC (Ile / I) isoleucina
AUA (Ile / I) isoleucina
Agosto (Met / M) Metionina, Start

ACU (Thr / t) Treonina
ACC (Tre / T) Treonina
ACA (Thr / T) Treonina
ACG (Thr / T) Treonina

AAU (Asn / N) Asparagina
AAC (Asn / N) asparagina
AAA (Lys / K) Lisina
AAG (Lys / K) lisina

AGU (Ser / S) Serina
AGC (Ser / S) Serina
AGA (Arg / R) Arginina
AGG (Arg / R) Arginina

G

GUU (Val / V) Valina
GUC (Val / V) valina
GUA (Val / V) valina
GUG (Val / V) valina

GCU (Ala / A) Alanina
GCC (Ala / A) alanina
GCA (Ala / A) alanina
GCG (Ala / A) alanina

GAU (Asp / D) O ácido aspártico
GAC (/ D Asp) ácido aspártico
GAA (Glu / E) O ácido glutâmico
GAG (/ E Glu) O ácido glutâmico

GGU (Gly / L) Glycine
GGC (Gly / L) Glicina
GGA (Gly / L) Glicina
GGG (Gly / L) Glicina

Mesa Inverse
Ala / A GCU, GCC, GCA, GCG Leu / L UUA, UUG, CUU, CUC, CUA, CUG
Arg / R CGU, CGC, CGA, CGG, AGA, AGG Lys / K AAA, AAG
Asn / N AAU, AAC Met / M Agosto
Asp / D GAU, GAC Phe / F UUU, UUC
Cis / C UGU, UGC Pro / P CCU, CCC, CCA, CCG
Gln / Q CAA, CAG Ser / S UCU, UCC, UCA, UCG, AGU, AGC
Glu / E GAA, GAG Thr / t ACU, ACC, ACA, ACG
Gli / G GGU, GGC, GGA, GGG Trp / W UGG
Sua / H CAU, CAC Tyr / Y UAU, o UAC
Ile / I AUU, AUC, AUA Val / V GUU, GUC, GUA, GUG
INÍCIO Agosto PARE UAG, UGA, UAA

Características mais salientes

Leitura quadro de uma seqüência

Note-se que um codão é definida pelo nucleótido inicial a partir do qual começa a tradução. Por exemplo, a cadeia GGGAAACCC, se ler a partir da primeira posição, contém os codões GGG, CCC AAA e; e se ler a partir da segunda posição, que contém os codões GGA AAC e; se ler a partir da posição terceira, GAA e ACC. Códons parciais têm sido ignoradas neste exemplo. Cada sequência pode, assim, ser lido em três quadros de leitura, cada uma das quais produzem uma sequência de aminoácidos diferente (no exemplo dado, Gli-Lis-Pro, Gly-Asp, ou Glu-Thr, respectivamente). Com ADN de cadeia dupla, há seis possível três quadros de leitura, na orientação para a frente numa cadeia e três reversa (na cadeia oposta).

A estrutura real em que uma sequência de proteína é traduzido é definida por um codão de iniciação, geralmente o primeiro codão AUG na sequência de mRNA. As mutações que rompem a estrutura de leitura por inserções ou deleções de um não múltiplo de 3 bases nucleotídicas são conhecidos como mutações frameshift. Estas mutações podem afectar a função da proteína resultante, se for formada, e, portanto, são raras em em seqüências codificantes de proteínas in vivo. Muitas vezes, essas proteínas deformados são direcionados para degradação proteolítica. Além disso, um deslocamento do quadro de mutação é muito susceptível de causar um codão de paragem para ser lido, que trunca a criação da proteína (Exemplo ). Uma razão para a raridade de mutações mudança de quadro a ser herdados é que, se a proteína a ser traduzida é essencial para o crescimento sob as pressões selectivas do organismo enfrenta, ausência de uma proteína funcional pode causar letalidade antes de o organismo é viável.

Iniciar / parar códons

Tradução começa com uma cadeia codão de iniciação (codão de iniciação). Ao contrário de codões de paragem, o codão por si só não é suficiente para iniciar o processo. Sequências vizinhas e factores de iniciação também são necessários para iniciar a tradução. O codão de iniciação mais comum é agosto, que codifica para metionina, de modo que a maioria das cadeias de aminoácidos começa com metionina.

Os três códons de parada foram nomes dados: UAG é âmbar, UGA é opala (às vezes também chamado de ferrugem), e UAA é ocre. "Amber" foi nomeado por descobridores Richard Epstein e Charles Steinberg após a sua amigo Harris Bernstein, cujo sobrenome significa "âmbar" em alemão. Os outros dois códons de parada foram nomeados "ocre" e "opala", a fim de manter o "tema de cor os nomes". Pare de códons também são chamados códons de terminação e eles sinalizam liberação do polipeptídeo nascente do ribossoma devido à ligação do factores de libertação, na ausência de ARNt cognato com anticódons complementares a estes sinais de paragem.

A degenerescência do código genético

O código genético tem redundância, mas sem ambiguidade (veja as tabelas de códons acima para a correlação completa). Por exemplo, embora os codões GAA e GAG especificar tanto o ácido glutâmico (redundância), nenhum deles especifica qualquer outro aminoácido (sem ambiguidade). Os codões que codificam um aminoácido pode ser diferente em qualquer uma das suas três posições. Por exemplo, o aminoácido ácido glutâmico é especificado por GAA e GAG (codões diferença na terceira posição), o aminoácido leucina é especificado por UUA, UUG, CUU, CUC, CUA, CUG codões (diferença na primeira ou terceira posição), enquanto que o aminoácido serina é especificado pelo UCA, UCG, UCC, UCU, AGU, AGC (diferença na primeira, segunda ou terceira posição).

Uma posição de um codão é dito ser um sítio de quatro vezes degenerado se qualquer nucleótido nesta posição especifica o mesmo aminoácido. Por exemplo, a terceira posição do códons de glicina (GGA, GGG, GGC, GGU) é um site degenerada quádruplo, porque todas as substituições de nucleótidos deste site são sinônimo, ou seja, eles não mudam o aminoácido. Apenas o terceiro posições de alguns códons pode ser degenerada de quatro vezes. Uma posição de um codão é dito ser um local degenerada dupla se apenas dois dos quatro possíveis nucleótidos nesta posição especificar o mesmo aminoácido. Por exemplo, a terceira posição do códons de ácido glutâmico (GAA, GAG) é um site degenerada dupla, é assim a primeira posição da códons de leucina (UCA, UCC, CCU, CCC, CCA, CCG). Em locais degenerados duplas, os nucleótidos equivalentes são sempre ou dois purinas (A / G) ou dois pirimidinas (C / U), substituições por isso só transversional (purina a pirimidina ou purina pirimidina a) em sítios degenerados duplas são nonsynonymous. Uma posição de um codão é dito ser um local não degenerada se qualquer mutação nesta posição resulta em substituição de aminoácidos. Há apenas um local de degenerada tripla onde mudando três dos quatro nucleótidos não tem efeito sobre o aminoácido, enquanto que a alteração das quarto possíveis resultados de nucleótidos em uma substituição de aminoácido. Esta é a terceira posição de um isoleucina códon: AUU, AUC, ou AUA todos isoleucina codificar, mas codifica agosto metionina. Em computação esta posição é muitas vezes tratada como um local degenerada dupla.

Há três aminoácidos codificados por seis codões diferentes: serina, leucina, arginina. Apenas dois aminoácidos são especificados por um único codão; uma destas é a-aminoácido metionina, indicado pelo codão AUG, que também especifica o início da tradução; o outro é triptofano, especificado pelo códon UGG. A degenerescência do código genético é o que conta para a existência de mutações silenciosas.

A degenerescência resulta porque um código tripleto designa os 20 aminoácidos e um codão de paragem. Uma vez que existem quatro bases, os codões tripleto são necessários para produzir, pelo menos, 21 códigos diferentes. Por exemplo, se existiam duas bases por codão, em seguida, apenas 16 aminoácidos pode ser codificada por (4² = 16). Porque são necessários pelo menos 21 códigos, então 4³ dá 64 possíveis códons, o que significa que alguns degeneração deve existir.

Estas propriedades do código genético tornar mais tolerante a falhas durante mutações pontuais. Por exemplo, em teoria, os codões degenerados quatro vezes pode tolerar qualquer mutação de ponto na terceira posição, embora viés de utilização de codões restringe isso na prática em muitos organismos; codões degenerados duplas podem tolerar um dos três possíveis mutações pontuais na terceira posição. Desde mutações de transição (purina de purina ou pirimidina a mutações de pirimidina) são mais susceptíveis do que transversão (purina de pirimidina ou vice-versa) mutações, a equivalência de purinas ou de pirimidinas em que locais dupla degenerados acrescenta um novo tolerância a falhas.

Agrupamento de códons por resíduo de aminoácido volume molar e hydropathy.

A consequência prática de redundância é que alguns erros no código genético só causam uma mutação silenciosa ou um erro que não afetaria a proteína porque a hidrofilicidade ou hidrofobicidade é mantida por substituição de aminoácidos equivalente; por exemplo, um codão de FREIRA (onde n = qualquer nucleótido) tende a codificar para os aminoácidos hidrofóbicos. Rendimentos NCN resíduos de aminoácidos que são pequenos em tamanho e moderada em hydropathy; NAN codifica tamanho médio de resíduos hidrofílicos; UNN codifica resíduos que não sejam hidrófilos.

Mesmo assim, mutações pontuais pode ainda causar proteínas disfuncionais. Por exemplo, um mutante gene da hemoglobina faz com doença falciforme . No hemoglobina mutante um hidrófilo glutamato (Glu) é substituído pelo hidrofóbico valina (Val), o que reduz a solubilidade de β-globina. Neste caso, as causas desta mutação hemoglobina para formar polímeros lineares ligados pela interacção hidrofóbica entre os grupos valina causando deformação falciforme de eritrócitos. Doença de célula falciforme, geralmente não é causado por um de novo mutação. Em vez que é seleccionada para a malária regiões (de um modo semelhante ao talassemia), conforme pessoas heterozigotos têm alguma resistência à malária Parasita Plasmodium ( vantagem heterozigoto).

Estes códigos de aminoácidos variáveis são permitidas porque de bases modificadas na primeira base do anticodão do ARNt, e o par de bases formado é chamado de par de bases oscilação. As bases modificadas incluem inosina ea pares de bases não-Watson-Crick UG.

As variações no código genético padrão

Enquanto pequenas variações sobre o código padrão havia sido previsto anteriormente, nenhuma foi descoberto até 1979, quando os pesquisadores a estudar genes mitocondriais humanos descobriram que eles usaram um código alternativo. Muitas variantes ligeiras têm sido descobertos desde então, incluindo vários códigos mitocondriais alternativas, bem como variantes, tais como pequenas Mycoplasma tradução do codão UGA como triptofano. Em bactérias e archaea, GUG e UUG são códons de início comuns. No entanto, em casos raros, algumas proteínas específicas podem usar códons não são normalmente usados por essa espécie de iniciação alternativo (start).

Em certas proteínas, aminoácidos não padrão são substituídos por codões de paragem convencionais, dependendo de sequências de sinal associados no RNA mensageiro: UGA podem codificar selenocisteína e UAG pode codificar para pirrolisina como discutido nos artigos relevantes. Selenocisteína é agora visto como o aminoácido 21, e pyrrolysine é visto como o 22o. Uma descrição detalhada de variações no código genético pode ser encontrado no Web site NCBI.

Apesar destas diferenças, todos os códigos conhecidos têm fortes semelhanças com o outro, e o mecanismo de codificação é o mesmo para todos os organismos: três codões de base, ARNt, ribossomas, lendo o código na mesma direcção e traduzir o código de três letras de cada vez em sequências de aminoácidos.

Teorias sobre a origem do código genético

Apesar das variações que existem, os códigos genéticos utilizados por todas as formas de vida conhecidas na Terra são muito semelhantes. Desde há muitos códigos genéticos possíveis que são pensados para ter utilidade semelhante ao utilizado pela vida da Terra, a teoria da evolução sugere que o código genético foi estabelecido muito cedo na história da vida, com a análise filogenética de RNA de transferência sugere que tRNA as moléculas evoluiu antes do presente conjunto de aminoacil-ARNt-sintetases.

O código genético não é uma atribuição aleatória de codões para os aminoácidos. Por exemplo, aminoácidos que partilham a mesma via biossintética tendem a ter a mesma primeira base nos seus codões e aminoácidos com propriedades físicas semelhantes tendem a ter codões semelhantes.

Há três temas que funcionam através das muitas teorias que procuram explicar a evolução do código genético (e, portanto, a origem desses padrões). Uma é ilustrada por recente experimentos aptâmeros que mostram que alguns aminoácidos possuem uma afinidade química selectiva para a base de tripletos que codificam para eles. Isto sugere que o atual, complexo mecanismo de tradução envolvendo tRNA e enzimas associadas pode ser um desenvolvimento posterior, e que inicialmente, seqüências de proteína foram directamente modeladas em sequências de bases. Outra é que o código genético padrão que vemos hoje cresceu a partir de um código mais simples, mais cedo através de um processo de "expansão biossintética". Aqui a idéia é que a vida primordial "descobriu" novos aminoácidos (por exemplo, como subprodutos do metabolismo) e depois volta-incorporadas algumas delas na máquina de codificação genética. Embora muitas evidências circunstanciais foi encontrado para sugerir que menos aminoácidos diferentes foram usados no passado do que hoje, hipóteses precisas e detalhadas sobre exatamente quais os aminoácidos inserido o código exatamente que ordem provou muito mais controverso. Uma terceira teoria é que a seleção natural levou a atribuições códon do código genético que minimizem os efeitos da mutações.

Retirado de " http://en.wikipedia.org/w/index.php?title=Genetic_code&oldid=224375753 "