Codonverwendung
Codonverwendung (englisch Codon Usage), auch
, beschreibt das Phänomen, dass Varianten des universellen genetischen Codes von verschiedenen Spezies unterschiedlich häufig verwendet werden. Bestimmte Codons des degenerierten Codes werden bevorzugt benutzt, was letztlich der tRNA-Konzentration innerhalb der Zelle entspricht. Die Codonverwendung spielt eine große Rolle bei der Regulation der Proteinbiosynthese. Selten verwendete Codons können die Translation bremsen, während häufig genutzte Codons die Translation beschleunigen können.
Anwendung – Codon-Optimierung
Die heterologe Genexpression wird in vielen biotechnologischen Anwendungen eingesetzt, einschließlich der Proteinproduktion, des Metabolic Engineering und bei mRNA-Impfstoffen. Da die tRNA-Pools zwischen verschiedenen Organismen variieren, kann die Transkriptions- und Translationsrate einer bestimmten kodierenden Sequenz weniger effizient sein, wenn sie in einem nicht-nativen Kontext platziert wird. So achtet man zum Beispiel bei der (aus Kostengründen häufig bevorzugten) gentechnischen Produktion menschlicher Proteine in Bakterien auf die Tatsache, dass das Bakterium, beispielsweise E. coli, über eine andere Codonverwendung verfügt als der Mensch. Damit die Bakterien das artfremde menschliche Gen ebenfalls schnell und effizient für die Translation ablesen können wie ihre eigenen Gene, wird es gentechnisch verändert. Das Resultat ist eine angepasste Gensequenz, die dem Codonverwendungs-Repertoire des Bakterienstamms weitgehend entspricht, aber noch für dasselbe Protein codiert.
Eine weitere Möglichkeit ist die Codon-Optimierung, wodurch bei der Herstellung eines rekombinanten Proteins die Expressionsrate gesteigert werden kann. Dabei werden bevorzugt diejenigen 20 Aminosäurecodons verwendet werden, deren tRNA im exprimierenden Organismus in größerer Menge vorhanden ist.[1] Außerdem kann die aus der Codonverwendung resultierende Faltung der mRNA eine Rolle spielen: Da die Sekundärstruktur des 5'-Endes der mRNA die Translationseffizienz beeinflusst, können synonyme Veränderungen in diesem Bereich der mRNA zu tiefgreifenden Auswirkungen auf die Genexpression führen. Die Codonverwendung in nicht-kodierenden DNA-Regionen kann daher eine wichtige Rolle für die RNA-Sekundärstruktur und die nachgeschaltete Proteinexpression spielen. Insbesondere kann eine ungünstige Sekundärstruktur an der Ribosomen-Bindungsstelle oder am Initiationscodon die Translation hemmen, und die mRNA-Faltung am 5'-Ende kann die Proteinexpression in hohem Maße beeinflussen.[2] Weiterhin kann die Faltung des gebildeten Proteins bereits während der Translation am Ribosom von der Translationsgeschwindigkeit abhängen, weshalb die Codonverwendung auch einen Einfluss auf die Konformation des kodierten Proteins haben kann.[3]
Codon Usage Tabelle
In folgender Tabelle ist die Häufigkeit der Nutzung eines bestimmten Codons pro 1000 Codons einer DNA-Sequenz gezeigt. Verglichen wurde der codon bias des E. coli Sicherheitstamms K12 mit dem der Bäckerhefe und dem des Menschen.[4]
Aminosäure | Codon | E. coli K12 | S. cerevisiae | H. sapiens | Aminosäure | Codon | E. coli K12 | S. cerevisiae | H. sapiens |
Valin (V) | GUU | 16,8 | 22,1 | 11,0 | Alanin (A) | GCU | 10,7 | 21,2 | 18,4 |
GUC | 11,7 | 11,8 | 14,5 | GCC | 31,6 | 12,6 | 27,7 | ||
GUA | 11,5 | 11,8 | 7,1 | GCA | 21,1 | 16,2 | 15,8 | ||
GUG | 26,4 | 10,8 | 28,1 | GCG | 38,5 | 6,2 | 7,4 | ||
Leucin (L) | CUU | 11,9 | 12,3 | 13,2 | Prolin (P) | CCU | 8,4 | 13,5 | 17,5 |
CUC | 10,5 | 5,4 | 19,6 | CCC | 6,4 | 6,8 | 19,8 | ||
CUA | 5,3 | 13,4 | 7,2 | CCA | 6,6 | 18,3 | 16,9 | ||
CUG | 46,9 | 10,5 | 39,6 | CCG | 26,7 | 5,3 | 6,9 | ||
Leucin (L) | UUA | 15,2 | 26,2 | 7,7 | Serin (S) | UCU | 5,7 | 23,5 | 15,2 |
UUG | 11,9 | 27,2 | 12,9 | UCC | 5,5 | 14,2 | 17,7 | ||
Phenylalanin (F) | UUU | 19,7 | 26,1 | 17,6 | UCA | 7,8 | 18,7 | 12,2 | |
UUC | 15,0 | 18,4 | 20,3 | UCG | 8,0 | 8,6 | 4,4 | ||
Isoleucin (I) | AUU | 30,5 | 30,1 | 16,0 | Threonin (T) | ACU | 8,0 | 20,3 | 13,1 |
AUC | 18,2 | 17,2 | 20,8 | ACC | 22,8 | 12,7 | 18,9 | ||
AUA | 3,7 | 17,8 | 7,5 | ACA | 6,4 | 17,8 | 15,1 | ||
Methionin (M) | AUG | 24,8 | 20,9 | 22,0 | ACG | 11,5 | 8,0 | 6,1 | |
Aminosäure | Codon | E. coli K12 | S. cerevisiae | H. sapiens | Aminosäure | Codon | E. coli K12 | S. cerevisiae | H. sapiens |
Asparaginsäure (D) | GAU | 37,9 | 37,6 | 21,8 | Glycin (G) | GGU | 21,3 | 23,9 | 10,8 |
GAC | 20,5 | 20,2 | 25,1 | GGC | 33,4 | 9,8 | 22,2 | ||
Glutaminsäure (E) | GAA | 43,7 | 45,6 | 29,0 | GGA | 9,2 | 10,9 | 16,5 | |
GAG | 18,4 | 19,2 | 39,6 | GGG | 8,6 | 6,0 | 16,5 | ||
Tyrosin (Y) | UAU | 16,8 | 18,8 | 12,2 | Cystein (C) | UGU | 5,9 | 8,1 | 10,6 |
UAC | 14,6 | 14,8 | 15,3 | UGC | 8,0 | 4,8 | 12,6 | ||
Stopp | UAA | 1,8 | 1,1 | 1,0 | Stopp | UGA | 1,0 | 0,7 | 1,6 |
Stopp | UAG | 0,1 | 0,5 | 0,8 | Tryptophan (W) | UGG | 10,7 | 10,4 | 13,2 |
Asparagin (N) | AAU | 21,9 | 35,7 | 17,0 | Serin (S) | AGU | 7,2 | 14,2 | 12,1 |
AAC | 24,4 | 24,8 | 19,1 | AGC | 16,6 | 9,8 | 19,5 | ||
Lysin (K) | AAA | 33,2 | 41,9 | 24,4 | Arginin (R) | AGA | 1,4 | 21,3 | 12,2 |
AAG | 12,1 | 30,8 | 31,9 | AGG | 1,6 | 9,2 | 12,0 | ||
Histidin (H) | CAU | 15,8 | 13,6 | 10,9 | Arginin (R) | CGU | 21,1 | 6,4 | 4,5 |
CAC | 13,1 | 7,8 | 15,1 | CGC | 26,0 | 2,6 | 10,4 | ||
Glutamin (Q) | CAA | 12,1 | 27,3 | 12,3 | CGA | 4,3 | 3,0 | 6,2 | |
CAG | 27,7 | 12,1 | 34,2 | CGG | 4,1 | 1,7 | 11,4 |
Codon Adaption Index (CAI)
Der
(CAI, „Codon-Adaptions-Index“) beschreibt, wie gut die Codons eines heterolog exprimierten Gens der Codonverwendung des Wirtsorganismus entsprechen. Ein CAI von 1,0 wäre optimal, ein CAI > 0,9 ist sehr gut, d. h., er erlaubt einen hohen Expressionslevel.
Weblinks
Einzelnachweise
- ↑
- ↑
- ↑
- ↑ Daten aus der Codon Usage Database, die ihrerseits die NCBI-GenBank-Daten nutzt.