Codonverwendung

aus Wikipedia, der freien Enzyklopädie
(Weitergeleitet von Codon usage)

Codonverwendung (englisch Codon Usage), auch

Codon Bias

, beschreibt das Phänomen, dass Varianten des universellen genetischen Codes von verschiedenen Spezies unterschiedlich häufig verwendet werden. Bestimmte Codons des degenerierten Codes werden bevorzugt benutzt, was letztlich der tRNA-Konzentration innerhalb der Zelle entspricht. Die Codonverwendung spielt eine große Rolle bei der Regulation der Proteinbiosynthese. Selten verwendete Codons können die Translation bremsen, während häufig genutzte Codons die Translation beschleunigen können.

Anwendung – Codon-Optimierung

Die heterologe Genexpression wird in vielen biotechnologischen Anwendungen eingesetzt, einschließlich der Proteinproduktion, des Metabolic Engineering und bei mRNA-Impfstoffen. Da die tRNA-Pools zwischen verschiedenen Organismen variieren, kann die Transkriptions- und Translationsrate einer bestimmten kodierenden Sequenz weniger effizient sein, wenn sie in einem nicht-nativen Kontext platziert wird. So achtet man zum Beispiel bei der (aus Kostengründen häufig bevorzugten) gentechnischen Produktion menschlicher Proteine in Bakterien auf die Tatsache, dass das Bakterium, beispielsweise E. coli, über eine andere Codonverwendung verfügt als der Mensch. Damit die Bakterien das artfremde menschliche Gen ebenfalls schnell und effizient für die Translation ablesen können wie ihre eigenen Gene, wird es gentechnisch verändert. Das Resultat ist eine angepasste Gensequenz, die dem Codonverwendungs-Repertoire des Bakterienstamms weitgehend entspricht, aber noch für dasselbe Protein codiert.

Eine weitere Möglichkeit ist die Codon-Optimierung, wodurch bei der Herstellung eines rekombinanten Proteins die Expressionsrate gesteigert werden kann. Dabei werden bevorzugt diejenigen 20 Aminosäurecodons verwendet werden, deren tRNA im exprimierenden Organismus in größerer Menge vorhanden ist.[1] Außerdem kann die aus der Codonverwendung resultierende Faltung der mRNA eine Rolle spielen: Da die Sekundärstruktur des 5'-Endes der mRNA die Translationseffizienz beeinflusst, können synonyme Veränderungen in diesem Bereich der mRNA zu tiefgreifenden Auswirkungen auf die Genexpression führen. Die Codonverwendung in nicht-kodierenden DNA-Regionen kann daher eine wichtige Rolle für die RNA-Sekundärstruktur und die nachgeschaltete Proteinexpression spielen. Insbesondere kann eine ungünstige Sekundärstruktur an der Ribosomen-Bindungsstelle oder am Initiationscodon die Translation hemmen, und die mRNA-Faltung am 5'-Ende kann die Proteinexpression in hohem Maße beeinflussen.[2] Weiterhin kann die Faltung des gebildeten Proteins bereits während der Translation am Ribosom von der Translationsgeschwindigkeit abhängen, weshalb die Codonverwendung auch einen Einfluss auf die Konformation des kodierten Proteins haben kann.[3]

Codon Usage Tabelle

In folgender Tabelle ist die Häufigkeit der Nutzung eines bestimmten Codons pro 1000 Codons einer DNA-Sequenz gezeigt. Verglichen wurde der codon bias des E. coli Sicherheitstamms K12 mit dem der Bäckerhefe und dem des Menschen.[4]

Aminosäure Codon E. coli K12 S. cerevisiae H. sapiens Aminosäure Codon E. coli K12 S. cerevisiae H. sapiens
Valin (V) GUU 16,8 22,1 11,0 Alanin (A) GCU 10,7 21,2 18,4
GUC 11,7 11,8 14,5 GCC 31,6 12,6 27,7
GUA 11,5 11,8 7,1 GCA 21,1 16,2 15,8
GUG 26,4 10,8 28,1 GCG 38,5 6,2 7,4
Leucin (L) CUU 11,9 12,3 13,2 Prolin (P) CCU 8,4 13,5 17,5
CUC 10,5 5,4 19,6 CCC 6,4 6,8 19,8
CUA 5,3 13,4 7,2 CCA 6,6 18,3 16,9
CUG 46,9 10,5 39,6 CCG 26,7 5,3 6,9
Leucin (L) UUA 15,2 26,2 7,7 Serin (S) UCU 5,7 23,5 15,2
UUG 11,9 27,2 12,9 UCC 5,5 14,2 17,7
Phenylalanin (F) UUU 19,7 26,1 17,6 UCA 7,8 18,7 12,2
UUC 15,0 18,4 20,3 UCG 8,0 8,6 4,4
Isoleucin (I) AUU 30,5 30,1 16,0 Threonin (T) ACU 8,0 20,3 13,1
AUC 18,2 17,2 20,8 ACC 22,8 12,7 18,9
AUA 3,7 17,8 7,5 ACA 6,4 17,8 15,1
Methionin (M) AUG 24,8 20,9 22,0 ACG 11,5 8,0 6,1
Aminosäure Codon E. coli K12 S. cerevisiae H. sapiens Aminosäure Codon E. coli K12 S. cerevisiae H. sapiens
Asparaginsäure (D) GAU 37,9 37,6 21,8 Glycin (G) GGU 21,3 23,9 10,8
GAC 20,5 20,2 25,1 GGC 33,4 9,8 22,2
Glutaminsäure (E) GAA 43,7 45,6 29,0 GGA 9,2 10,9 16,5
GAG 18,4 19,2 39,6 GGG 8,6 6,0 16,5
Tyrosin (Y) UAU 16,8 18,8 12,2 Cystein (C) UGU 5,9 8,1 10,6
UAC 14,6 14,8 15,3 UGC 8,0 4,8 12,6
Stopp UAA 1,8 1,1 1,0 Stopp UGA 1,0 0,7 1,6
Stopp UAG 0,1 0,5 0,8 Tryptophan (W) UGG 10,7 10,4 13,2
Asparagin (N) AAU 21,9 35,7 17,0 Serin (S) AGU 7,2 14,2 12,1
AAC 24,4 24,8 19,1 AGC 16,6 9,8 19,5
Lysin (K) AAA 33,2 41,9 24,4 Arginin (R) AGA 1,4 21,3 12,2
AAG 12,1 30,8 31,9 AGG 1,6 9,2 12,0
Histidin (H) CAU 15,8 13,6 10,9 Arginin (R) CGU 21,1 6,4 4,5
CAC 13,1 7,8 15,1 CGC 26,0 2,6 10,4
Glutamin (Q) CAA 12,1 27,3 12,3 CGA 4,3 3,0 6,2
CAG 27,7 12,1 34,2 CGG 4,1 1,7 11,4

Codon Adaption Index (CAI)

Der

Codon Adaption Index

(CAI, „Codon-Adaptions-Index“) beschreibt, wie gut die Codons eines heterolog exprimierten Gens der Codonverwendung des Wirtsorganismus entsprechen. Ein CAI von 1,0 wäre optimal, ein CAI > 0,9 ist sehr gut, d. h., er erlaubt einen hohen Expressionslevel.

Weblinks

Einzelnachweise

  1. Daten aus der Codon Usage Database, die ihrerseits die NCBI-GenBank-Daten nutzt.