Topologically associating domain
Eine Topologically associating domain (TAD, engl. „topologisch assoziierte Domäne“) ist eine selbst-interagierende genomische Region, d. h. DNA-Sequenzen innerhalb einer TAD wechselwirken physikalisch häufiger miteinander als mit Sequenzen außerhalb der TAD.[1] Diese dreidimensionalen Chromosomenstrukturen sind bei Tieren sowie bei einigen Pflanzen, Pilzen und Bakterien vorhanden. TADs können in der Größe von Tausenden bis Millionen von DNA-Basen variieren.
Die Funktionen von TADs sind nicht vollständig verstanden, aber in einigen Fällen führt die Störung von TADs zu Krankheiten, da die Veränderung der 3D-Organisation des Chromosoms die Genregulation stört. Die Mechanismen der TAD-Bildung sind ebenfalls komplex und noch nicht vollständig geklärt, obwohl eine Reihe von Proteinkomplexen und DNA-Elementen mit TAD-Grenzen assoziiert sind.
Entdeckung und Definition
TADs sind definiert als Regionen, deren DNA-Sequenzen vorzugsweise miteinander in Kontakt stehen. Sie wurden 2012 mit Hilfe der Chromosome Conformation Capture Technik einschließlich Hi-C[2][3][4] entdeckt. Die Weiterentwicklungen dieser Technologien, 4C und Hi-C, ermöglichten die genomweite Ermittlung aller interagierenden Genloki miteinander. TADs sind nachweislich in Fruchtfliegen (Drosophila), Mäusen und menschlichen Genomen vorhanden, aber nicht in der Hefe Saccharomyces cerevisiae.
TADs haben die Eigenschaft, dass innerhalb der Domänen chromosomale Wechselwirkungen mit hoher Frequenz stattfinden. Untereinander sind die Interaktionen zwischen den TADs nur noch schwach vorhanden.
Die Positionen von TADs werden durch die Anwendung eines Algorithmus auf Hi-C-Daten definiert. Beispielsweise werden TADs oft durch den sogenannten „Directionality Index“ bestimmt.[5] Dieser Richtungsindex wird für einzelne 40kb Abschnitte berechnet, indem die Sequenzierungen, die in diese Abschnitte fallen, gesammelt werden. Dann wird beobachtet, ob ihre gepaarten Sequenzfolgen vor oder hinter dem Abschnitt liegen (diese Paarungen sind erforderlich, um nicht mehr als 2Mb zu überspannen). Ein positiver Wert zeigt an, dass mehr gelesene Paare stromabwärts als stromaufwärts liegen, und ein negativer Wert zeigt das Gegenteil an. Mathematisch gesehen ist der Richtungsindex eine vorzeichenbehaftete Chi-Quadrat-Statistik.
Entstehungsmechanismen
Es ist bekannt, dass eine Reihe von Proteinen mit der TAD-Bildung assoziiert sind, darunter das Protein CTCF und der Proteinkomplex Cohesin.[6][7] Es ist nicht bekannt, welche Komponenten an den TAD-Grenzen benötigt werden; in Säugetierzellen konnte jedoch gezeigt werden, dass diese Grenzregionen ein vergleichsweise hohes Maß an CTCF-Bindungen aufweisen. Darüber hinaus treten einige Arten von Genen (wie Transfer-RNA-Gene und Haushaltgene) häufiger in der Nähe von TAD-Grenzen auf, als es der Zufall erwarten würde.[2][4]
Alle TADs sind auf Hi-C-Kontaktkarten als "Dreiecke" zu erkennen, welche die Regionen mit erhöhter Häufigkeit interner Kontakte beschreiben. Hierbei weisen die gebildeten Dreiecke in etwa 50 % der Fälle sehr starke Spitzen auf. TADs mit solchen Kontaktmustern bilden Chromatinschlaufen, wobei ihre Randelemente einander berühren. ChIP-Seq-Studien zeigten, dass sich berührende Chromatin-Regionen an der Basis der gebildeten Schlaufen durch CTCF-Proteine und Cohesin gebunden sind.[8]
Die Schlaufenbildung beginnt, wenn sich ein Cohesin-Komplex an die DNA heftet. Cohesin besteht aus zwei verbundenen, ringförmigen Untereinheiten, ähnlich wie Handschellen. Die DNA tritt durch einen Ring ein und durch den anderen wieder aus. Die Ringe gleiten in entgegengesetzter Richtung der DNA entlang. Dadurch bildet sich eine immer größer werdende DNA-Schlaufe. Erst wenn ein Ring an ein CTCF Molekül stößt, welches an die DNA gebunden ist, kann dieser Prozess gestoppt werden. Hierzu muss die Bindungssequenz für CTCF in Richtung auf das Innere der DNA-Schlaufe zeigen. Ansonsten gleitet der Cohesin-Ring darüber hinweg und die Schlaufe wächst weiter. Die Schlaufenbildung ist abgeschlossen, wenn beide Ringe des Cohesin-Komplexes eine nach innen gerichtete CTCF Sequenz erreicht haben.[7]
Neuere Modelle schlagen vor, dass TADs in einer Supercoiled-(Superspiralisierung)-DNA Struktur vorliegen und dies die Kontakte innerhalb eines TADs erhöht. Mit Hilfe von molekulardynamischen Simulationen konnte von Racko et al. gezeigt werden, dass der Cohesin-Komplex durch Superspiralisierung der DNA, die während der Transkription entsteht, in Richtung der TAD-Grenzen weitergeschoben wird. Diese Modelle erklären auch, was die treibende Kraft der Schleifenbildung sein kann und wie sichergestellt werden kann, dass Schleifen schnell und die richtige Richtung wachsen.
Darüber hinaus steht der durch Supercoiling gesteuerte Schleifenbildungsmechanismus im Einklang mit früheren Erklärungen, die vorschlagen, warum TADs, die von konvergenten CTCF-Bindungsstellen flankiert werden, stabilere Chromatinschleifen bilden als TADs, die von divergenten CTCF-Bindungsstellen flankiert werden.[8][9]
Eigenschaften
Konservierung
Es wurde berichtet, dass TADs zwischen verschiedenen Zelltypen (z. B. in Stammzellen und Blutzellen) und in Einzelfällen sogar zwischen Spezies relativ konstant sind.[10]
Beziehung zu Promoter-Enhancer-Kontakten
Die Mehrheit der beobachteten Interaktionen zwischen Promotoren und Enhancern überschreitet nicht die TAD-Grenzen. Das Entfernen einer TAD-Grenze (z. B. die Verwendung von CRISPR zum Löschen der relevanten Region des Genoms) kann es ermöglichen, neue Kontakte zwischen Promotor und Enhancer zu bilden. Dies kann die Genexpression in der Nähe beeinträchtigen – eine solche Fehlsteuerung verursacht nachweislich Gliedmaßenmissbildungen (z. B. Polydaktylie) bei Mensch und Maus.[10]
Computersimulationen haben gezeigt, dass transkriptionsbedingtes Supercoiling von Chromatinfasern erklären kann, wie TADs gebildet werden und wie sie sehr effiziente Wechselwirkungen zwischen Enhancer und ihren verwandten Promotoren im gleichen TAD gewährleisten können.[8]
Zusammenhang mit anderen strukturellen Merkmalen des Genoms
Es wurde berichtet, dass topologisch assoziierten Domänen die gleichen sind wie Replikationsdomänen. Dies sind Regionen des Genoms, die während der S-Phase der Zellteilung gleichzeitig kopiert (repliziert) werden.[11] Isolierte Nachbarschaften, DNA-Schlaufen, die aus CTCF/cohesingebundenen Regionen gebildet werden, sollen funktionell den TADs zugrunde liegen.[12]
Krankheiten
Eine Unterbrechung der TAD-Grenzen kann die Expression benachbarter Gene beeinträchtigen, was zu Krankheiten führen kann.[13]
So wurden beispielsweise genomische Strukturvarianten, die die TAD-Grenzen durchbrechen, als Ursache für Entwicklungsstörungen wie Fehlbildungen menschlicher Gliedmaßen gemeldet.[14][15] Darüber hinaus haben mehrere Studien gezeigt, dass die Unterbrechung oder Neuordnung der TAD-Grenzen Wachstumsvorteile für bestimmte Krebsarten wie die T-Zell-akute lymphatische Leukämie (T-ALL)[16], Gliome[17] und Darmkrebs[18] bieten kann.
Lamina-associated domains
Lamina-assoziierte Domänen (LADs) sind Teile des Chromatins, die stark mit der Lamina interagieren, einer netzwerkartigen Struktur an der inneren Membran des Kerns.[19] LADs bestehen hauptsächlich aus transkriptionell stillem Chromatin, das mit trimethyliertem Lys27 auf Histon H3 angereichert ist, das eine häufige posttranslationale Histonmodifikation von Heterochromatin ist.[20] LADs haben CTCF-Bindungsstellen an ihrer Peripherie.[19]