GC-Gehalt

aus Wikipedia, der freien Enzyklopädie
(Weitergeleitet von G+C-Gehalt)
Schematische Darstellung von Basenpaaren im DNA-Doppelstrang – die Wasserstoffbrücken zwischen A-T und G-C-Paaren sind gestrichelt gezeigt. In diesem Beispiel ist der GC-Gehalt 50 %.

Der GC-Gehalt ist ein Merkmal von Nukleinsäuremolekülen wie einer DNA oder RNA und gibt den Anteil von Guanin (G) und Cytosin (C) an der Gesamtheit der enthaltenen Nukleinbasen in Prozent an.

Bei einem DNA-Molekül bezieht sich das Maß auf die vier DNA-Basen Guanin, Cytosin, Adenin (A) und Thymin (T):

Da in einem DNA-Strang gewöhnlich nur diese vier Basen vorkommen, lässt sich aus dem GC-Gehalt der AT-Gehalt berechnen und umgekehrt:

Einem GC-Gehalt von beispielsweise 64 % entspricht somit ein AT-Gehalt von 36 %.

GC-Gehalt und Stabilität der DNA-Doppelhelix

Räumliches Modell einer DNA-Doppelhelix – Wasserstoffbrücken bilden sich zwischen passenden Basenpaaren im Doppelstrang aus

Die jeweils komplementären Basen sind im doppelsträngigen DNA-Molekül über Wasserstoffbrücken miteinander verbunden: A-T (bzw. T-A) und G-C (bzw. C-G). Die Paare von Adenin und Thymin bilden stets zwei Wasserstoffbrücken aus, die Paare von Guanin und Cytosin drei. Anders als zunächst angenommen,[1] ist der Energiegewinn durch Wasserstoffbrückenbindungen aber vernachlässigbar, da die Basen ähnlich gute Wasserstoffbrückenbindungen mit dem umgebenden Wasser eingehen können. Die Wasserstoffbrücken eines GC-Basenpaares tragen nur wenig zur Stabilität der Doppelhelix bei, während die Wasserstoffbrücken eines AT-Basenpaares sogar destabilisierend wirken.[2]

Hingegen wirken die Stapelwechselwirkungen (englisch stacking interactions) zwischen den aufeinanderfolgenden bzw. übereinanderliegenden Basen in der Doppelhelix stabilisierend: Zwischen den aromatischen Ringsystemen der heterocyclischen Basen entsteht eine dipol-induzierte Dipol-Wechselwirkung, welche energetisch günstig ist. Somit ist die Bildung des ersten Basenpaares aufgrund des geringen Energiegewinnes und des Entropieverlustes recht ungünstig, jedoch ist die Verlängerung der Helix (Elongation) energetisch günstig wegen des Unterschieds der Gibbs-Energie bei Stapelung gepaarter Basen.

Die Stapelwechselwirkungen sind allerdings sequenzabhängig und energetisch am günstigsten für gestapelte GC-Paare, während sie für gestapelte AT-Paare weniger günstig sind. Die Unterschiede in den Stapelwechselwirkungen erklären hauptsächlich die Tatsache, dass GC-reiche DNA-Abschnitte thermodynamisch stabiler sind als AT-reiche Sequenzen, während die Wasserstoffbrückenbildung hierfür eine untergeordnete Rolle spielt.[2]

Bestimmung des GC-Gehaltes

Der GC-Gehalt von DNA kann experimentell mit verschiedenen Methoden bestimmt werden. Der einfachste Weg ist, die sogenannte Schmelztemperatur (Tm-Wert) der DNA-Doppelhelix mithilfe eines Photometers zu messen: Die DNA absorbiert ultraviolettes Licht von einer Wellenlänge von 260 nm. Denaturiert („schmilzt“) der Doppelstrang beim Erhitzen in zwei Einzelstränge, steigt die Lichtabsorption um etwa 40 %. Diesen Effekt bezeichnet man als Hyperchromizität.
Der Tm-Wert wird definiert als die Temperatur, bei der 50 % der Doppelhelix in denaturiertem Zustand vorliegen. Der Tm-Wert eines DNA-Doppelstranges ist direkt abhängig von dessen GC-Gehalt. Je mehr GC-Bindungen ein DNA-Molekül enthält, desto höher liegt der Tm-Wert. Statt der ursprünglichen Doppelhelix liegen nun zwei singuläre Polynucleotidketten (zwei Einzelstränge) vor. Mit der fotometrisch bestimmten Schmelztemperatur kann der GC-Gehalt mit der empirischen Formel (Tm [°C] – 69,4 °C) × 2,44 errechnet werden.[3]

Ebenfalls abhängig ist dieser Wert von der Ionenstärke und der Art der vorhandenen Ionen im DNA-Lösungsmittel. Daher ist die Schmelztemperatur in Standard Saline Citrate zu bestimmen.

Wesentlich genauer ist die Bestimmung des GC-Gehaltes mithilfe der Gaschromatographie. Ist hingegen die Sequenz des DNA-Moleküls bekannt, kann der GC-Gehalt einfach mit der oben angegebenen Formel berechnet werden.

GC-Gehalt und Taxonomie

Der GC-Gehalt im Genom wird als taxonomisches Merkmal zur Einteilung der Organismen, insbesondere von Bakterien verwendet. Die Werte reichen hier von ca. 20 bis fast 80 %. Bakterien mit hohem GC-Gehalt findet man vor allem unter den Actinobacteria, aber auch Deltaproteobakterien wie Myxobakterien sind GC-reich. Thermophile Organismen weisen ebenfalls erhöhte GC-Gehalte auf, was sicher auf die größere Stabilität der G-C-Basenpaarung zurückzuführen ist.

GC-Gehalte einiger Modellorganismen:

Art Phylogenetische Gruppe GC-Gehalt
Streptomyces coelicolor
Myxococcus xanthus
Halobacterium sp.
Saccharomyces cerevisiae (Backhefe)
Arabidopsis thaliana (Ackerschmalwand)
Methanosphaera stadtmanae
Plasmodium falciparum (Malariaerreger)
Actinobacterium
Deltaproteobakterium
Archaeon
Ascomycet (Pilz)
Blütenpflanze
Archaeon
Protozoon
72 %
68 %
67 %
38 %
36 %
27 %
≈20 %

Zum Vergleich: Der durchschnittliche GC-Gehalt beim Menschen beträgt 41 % (siehe dazu auch CpG-Insel). Aufgrund der Struktur des genetischen Codes ist es für einen Organismus praktisch unmöglich, sein Genom ausschließlich aus zwei Basen (G-C oder A-T) aufzubauen und damit einen GC-Gehalt von 100 % oder 0 % zu erreichen. Die Anzahl möglicher Codons (8) reicht nicht aus, um alle Aminosäuren (20) in einem Zwei-Basen-Code zu verschlüsseln.

GC-Gehalte einzelner DNA-Abschnitte

Der Anteil der Basenpaare GC und AT variiert aber auch innerhalb eines Genoms.

AT-reiche (und daher GC-arme) Regionen findet man im Genom häufig an den Stellen, an denen die Doppelhelix leicht auflösbar sein muss, zum Beispiel an den Punkten, an denen die Replikation des DNA-Moleküls beginnt. Auch in menschlichen Chromosomen existieren Regionen mit GC-Gehalten, die deutlich von 50 % abweichen. Diese Abschnitte sind meist in die Aufrechterhaltung der räumlichen Struktur der Chromosomen einbezogen.

Außerdem ist der GC-Gehalt in den DNA-Abschnitten, die für ein Gen codieren, oft höher, als in anderen Regionen (zum Beispiel Introns, regulatorische Sequenzen). Diese Eigenschaft nutzt man aus, um in sequenzierten Genomen nach den eigentlichen Genen zu suchen: Genomsequenzen bestehen zunächst ausschließlich aus einer Abfolge von Millionen Basen. Die Annotation der eigentlichen Gene (das heißt, deren Start- und Endpunkt im Genom) erfolgt mit Hilfe von Computerprogrammen (z. B. GLIMMER), die GC-reiche Abschnitte finden und als mögliche Gene identifizieren.

Stößt man beim Studium eines Organismus auf funktionelle Gene, deren GC-Gehalt deutlich von dem der übrigen Gene abweicht, wird dies häufig als Hinweis darauf gewertet, dass diese Gene erst kürzlich durch horizontalen Gentransfer erworben wurden oder von einem Retrovirus stammen.

Siehe auch

Einzelnachweise

  1. J.D. Watson, F.H. Crick: Molecular structure of nucleic acids. A structure for deoxyribose nucleic acid. In: Nature. Bd. 171, 1953, Nr. 4356, S. 737–738, PMID 13054692, PDF
  2. a b Peter Yakovchuk, Ekaterina Protozanova, Maxim D. Frank-Kamenetskii: Base-stacking and base-pairing contributions into thermal stability of the DNA double helix. In: Nucleic Acids Research, 2006 34(2), S. 564–574, PMID 16449200, doi:10.1093/nar/gkj454.
  3. J. De Ley: Reexamination of the Association Between Melting Point, Buoyant Density, and Chemical Base Composition of Deoxyribonucleic Acid. In: J. Bact., 101 (3), 1970, S. 738–754.