Benutzer:Dirk123456/Baustellenbaustelle 001/Baustelle-D/Baustelle-D.6
Ziel(e) der Baustelle
Ziel 1: Anfangs sollte Baustelle D.6 einen Diskussionsbeitrag zum „Ersten Prototyp“ vorbereiten, zu einem Vorschlag der Wikimedia Deutschland (bzw. zu einer Gruppe von Vorschlägen), die Suche nach Vorlagen zu verbessern.
Ziel 2: Im Laufe des Anwachsens meiner ausschweifenden Erörterungen wurde ein Punkt immer umfassender: die Darstellung eines Beispiels für komplexe Vorlagen. Das Beispiel ist eine sehr leistungsfähige Vorlage, die aber nicht einfach anwendbar ist.
Ziel 3: Im Mai 2020 war die Recherche zum ersten Prototyp abgeschlossen und der „Zweite Prototyp“ stand auf dem Programm. Der Beitrag dazu wurde in Baustelle D.7 vorbereitet und dann „gepostet“. Es verblieb das Ziel 2 ohne das Ziel 1, die Darstellung der komplexen Verhältnisse in einer leistungsfähigen, aber schwer anzuwendenden Vorlage.
Links hinsichtlich der Ziele der Baustelle
Prototyp 1 (Ziel 1, Antwort-Beitrag für Prototyp 1)
- Wikipedia:Technische_Wünsche/Topwünsche/Leichter_mit_Vorlagen_arbeiten #Prototypen
- Wikipedia:Technische_Wünsche/Topwünsche/Leichter_mit_Vorlagen_arbeiten #Prototyp_1:_Suchfilter_für_ausgezeichnete_Vorlagen
Start
- auf der Projektseite (26. März 2020): oldid=198134589#Prototyp: Suchfilter für ausgezeichnete Vorlagen und
- in der Diskussion (26. März 2020): oldid=198134215#1. Prototyp: Suchfilte für ausgezeichnete_Vorlagen
Ende
- auf der Projektseite (28. April 2020) durch Prototyp 2 de facto beendet: oldid=199381616#Prototyp 2: Verbesserte Syntaxhervorhebung und
- in der Diskussion (28. April 2020) durch oldid=199381618#Prototyp 2: Verbesserte Syntaxhervorhebung;
- letzer Beitrag in der Diskussion am 27. März 2020.
Baustelle D.6
Letzte Version mit den Zielen 1 und 2:
- Benutzer:Dirk123456/Baustellenbaustelle 001/Baustelle-D/Baustelle-D.6, oldid=199674579
Protokoll
Es wird Folgendes gegenüber der Vorversion oldid=199674579 gelöscht:
- "Beitrag" bis ausschließlich "Leistungsfähigkeit und Übersichtlichkeit" gelöscht.
- "A.1 Versuche zur Einbeziehung von allen relevanten Parametern" und "z" gelöscht ("z" war eine lediglich als Markierung gedacht).
- "Zum Schluss" gelöscht.
- "Eigenheiten des VE" bis ausschließlich "Drei Formen von Genname(n) -- Material" gelöscht.
- "Inhibitor_fam nicht in der Untervorlage" -- ausgelagert gelöscht.
"Verbannung" der Ziele 1 und 2 aus der Vorversion oldid=199674579; Fokussierung auf Ziel 3.
Eigentlicher Beitrag
Einleitung
Im September 2019 stieß ich (Benutzer:Dirk123456/ Disk) in einem Artikel über eine Protein-Gruppe (DNA-Methyltransferasen) auf eine Infobox, eine Einbindung der Vorlage „Infobox Protein“. Dort wollte ich einen Punkt zur Enzymklassifikation der DNA-Methyltransferasen editieren, der mir sub-optimal dargestellt erschien (einzeln stehendes Komma am Beginn eines Schriftzugs). Ich stellte dann fest, dass ich ohne tiefere Kenntnis über diese Vorlage keine nachhaltige Verbesserung der Infobox erreichen würde.
Da zuvor das Thema „Leichter mit Vorlagen arbeiten“ als Schwerpunkt der technischen Wünsche gewählt worden war (Juli 2019), konnte das konkrete Problem mit der Anwendung der Vorlage „Infobox Protein“ meiner Ansicht nach gut als Beispiel dienen, weshalb ich mich dafür entschied, die Arbeit am Problem zu dokumentieren.
Für eine solche Dokumentation verwendete ich primär ein Textbearbeitungsprogramm, da ich dort Screenshots und andere bildliche Darstellungen besser anwenden konnte, als mit Wikitext. Später habe ich diese Dokumentation auf eine Benutzerseite in der Wikipedia verlagert.
Ziele
Das Hauptziel dieser Ausarbeitung besteht darin, innerhalb der Wikipedia ein konkretes Beispiel für die Diskussion rund um das Thema „Leichter mit Vorlagen arbeiten“ zu haben.
Nicht wenige Schwierigkeiten, die bei der Beispiel-Vorlage („Infobox Protein“) auftreten, kommen in ähnlicher Form auch bei anderen Vorlagen vor.
Es ergeben sich einige Nebenziele. Die Themen, die an die Beispiel-Vorlage selbst gekoppelt sind, erfordern hier teilweise die Darstellung eben dieser Themen und der Zusammenhänge zur Vorlage „Infobox Protein“. Solche Themen sind z. B. die Darstellung von Proteinen und Proteingruppen, die Regeln der Enzymklassifikation und die Funktionalität von Infoboxen allgemein.
Text-Hervorhebungen und Anführungszeichen
Je nachdem, wie stark die Abgrenzung vom umgebenden Text sein soll, werden neben Textauszeichnungen (wie Fett, Kursiv, Unterstrichen usw.) verschiedene Anführungszeichen als Hervorhebung verwendet.
Code-Tags: Die häufigste hier angewendete Textauszeichnung dürfte Computercode
sein (Tags im Wikitext: <code>…</code>
). Die Code-Tags werden hier meist dazu verwendet, um Parameter-Namen und andere Code-Elemente kenntlich zu machen (z. B. EC-Nummer
).
„…“: Die „normalen“ deutschen Anführungszeichen werden in üblicher Weise verwendet; also dann, wenn keine zusätzliche, spezielle Hervorhebung angestrebt wird.
"…": Die einfachen Anführungszeichen werden hier vor allem für Code-Elemente gebraucht, zumeist für Parameter ( z. B. "EC-Nummer"). Weiterhin werden sie verwendet, wenn Anführungszeichen sprachneutral eingesetzt werden sollen (für Ausdrücke in deutschen und englischen Anwendungen) und wenn die Verwendung verschiedener Anführungszeichen unübersichtlich erscheint.
': Der Apostroph wird als solcher praktisch nur als Ersatzzeichen bei der Darstellung von Code verwendet. Das betrifft vor allem Wikitext (''
, '''
und ähnliches).
“…” und ‘…’: Die englischen Anführungszeichen werden im Zusammenhang mit der englischen Sprache verwendet.
»…«: Die Guillemets oder Spitzzeichen werden verwendet, um Anfang und Ende längerer Schriftzüge zu kennzeichnen, vor allem, wenn das Potential von Klammern, anderen Anführungszeichen und Ähnlichem ausgeschöpft ist.
›…‹: Die einfachen Guillemets ober „halben Spitzzeichen“ haben eine Sonderfunktion; sie schließen spezielle Ausdrücke ein, die hier „erfunden“ wurden und als Arbeitsbegriffe dienen. Das betrifft solche Wörter und Wortgruppen, wie:
- ›optischer Parameter‹,
- ›optisches Argument‹,
- ›Block A‹ bis ›Block H‹,
- ›Gehört-in‹-Sichtweise und
- ›Entspricht‹-Sichtweise.
Überblick – Leistungsfähigkeit der Vorlage Infobox_Protein
Nach meinem Erleben ist z. B. die Vorlage:Infobox Protein leistungsfähig, aber nicht einfach anzuwenden. Die Vorlage hat um die 40 Parameter und die resultierende Infobox (H:Infoboxen), eine komplexe Tabelle in der Normalansicht, kann bis zu acht Abschnitte aufweisen. Die Abschnitte entstehen durch Hervorhebung einer entsprechenden Tabellenzeile, die optisch als Überschrift wirkt.
Im einfachsten Fall wird ein Parameter mit seinem Wert mit gleichlautenden Schriftzügen in genau einer Tabellenzeile eingetragen, der Parameter links und der Wert rechts; so wird z. B. aus |Wirkstoffklasse=RNase-Hemmer
im Wikitext eine Tabellenzeile, die etwa so aussieht:
Wirkstoffklasse | RNase-Hemmer |
In anderen Fällen werden zusätzlich automatische Verknüpfungen erzeugt, so werden aus |DrugBank=DB00062
z. B. die „verlinkten“ Schriftzüge DrugBank und DB00062, die dann auf der linken bzw. rechten Seite angeordnet sind. Diese resultierenden Schriftzüge nenne ich hier ›optischer Parameter‹ und ›optisches Argument‹, um „Arbeitsbegriffe“ zu haben.
Der Grund für diese Begriffsabgrenzung ist, dass sich vor allem der ›optische Parameter‹ vom Parameter unterscheiden kann, von dem er abstammt. Ein Beispiel ist der Schriftzug „Sekundär- bis Quartärstruktur“ der vom Parameter Struktur
herrührt. Dieser ›optische Parameter‹ (also „Sekundär- bis Quartärstruktur“) teilt das Wort „Struktur“ mit anderen Schriftzügen („Vorhandene Strukturdaten:“ und „Masse/Länge Primärstruktur“), die ebenfalls ›optische Parameter‹ sind.
Die genaue Zuordnung lässt sich am einfachsten über den Wert des Parameters (das Argument) und die resultierende Anzeige (das ›optische Argument‹) herstellen, da sich diese beiden meist wenig unterscheiden: |Struktur=βαββαβ
führt zu „Sekundär- bis Quartärstruktur“ auf der linken und „βαββαβ“ auf der rechten Seite in der entsprechenden Tabellenzeile einer Infobox.
Es gibt aber auch ›optische Parameter‹ und ›optische Argumente‹, die auf mehreren Werten verschiedener Parameter beruhen. So bewirken die beiden Parameter↔Argument-Paare |Symbol=ALB
und |HGNCid=399
zusammen das „Anzeige-Paar“ mit den Schriftzügen „Gen-Name“ und „ALB“ in der resultierenden Infobox-Tabelle, wobei der Text von |Symbol=ALB
herrührt, was halbwegs offensichtlich ist, während die Verknüpfungen vom Parameter HGNCid
und seinem Wert 399
stammen, was eher versteckt ist. Der ›optische Parameter‹ „Gen-Name“ erhält eine interne Verknüpfung in die Wikipedia (Human Genome Organisation) und das ›optische Argumente‹ erhält eine Verknüpfung zu einer Datenbank (https://www.genenames.org/tools/search/#!/all?query=399).
Es gibt weitere Mehrfach-Zuordnungen. So kann das Auftreten des ›optischen Parameters‹ „MEROPS“ auf Peptidase_fam
oder auf Inhibitor_fam
beruhen.
Neben Überschriften gibt es auch so etwas, wie „übergeordnete Rubriken“, z. B. den Schriftzug „Externe IDs“, der links steht, während sich rechts eine Aufzählung befindet, in der allgemeinen Form:
- ›Optischer Parameter‹: ›optisches Argument‹ oder anders ausgedrückt:
- Einzel-Rubrik: Konkreter Inhalt
Es gibt vielfältige Abhängigkeiten, die nicht in jedem Fall einfach nachzuvollziehendes Verhalten der Parameter und ihrer Werte erzeugen.
Eine Code-Komponente mit vielen Abhängigkeiten ist beispielsweise der bereits erwähnte Parameter HGNCid
(HGNC: Human Genome Nomenclature; siehe Human Genome Organisation), der zwei bis drei verschiedene Abschnitte in der resultierenden Infobox beeinflussen kann. Setzt man einen Wert ein, dann wird eine Überschrift „Eigenschaften des menschlichen Proteins“ zwischen die Einleitung und die Eigenschaften gesetzt (auch bei einem unsinnigen Wert, z. B. |HGNCid=ß
). Ohne "HGNCid", wenn der Parameter in der Einbindung der Vorlage fehlt oder leer ist, verschmelzen Einleitung und Eigenschaften zu einem Abschnitt.
Um zwischen einzelnen Abschnitten und kombinierten Abschnitten – die durch das Ausbleiben einer Überschrift entstehen – zu unterscheiden, habe ich einen weiteren „Arbeitsbegriff“ eingeführt, den ›Block‹. Ein ›Block‹ ist ein Bereich innerhalb der Infobox Protein, der eine Überschrift haben kann, aber nicht muss, während ein Abschnitt in dem von mir hier angewendeten „Begriffssystem“ immer eine Überschrift hat.
Ich habe acht Blöcke ausfindig gemacht und diese ›Block A‹ bis ›Block H‹ genannt. Der erste Abschnitt, die Einleitung, kann also aus den beiden Blöcken ›Block A‹ und ›Block B‹ bestehen, wenn die entsprechenden Parameter angewendet werden oder auch nur aus ›Block A‹, je nachdem, ob "HGNCid" eine zusätzliche Überschrift bewirkt. Die Blöcke ›C‹ bis ›H‹ treten immer als einzelne Abschnitte in Erscheinung, d. h., sie haben immer eine eigene Überschrift. In einem Fall (bei ›Block F‹) kann die Überschrift variabel lauten: „Enzymklassifikation“, „Enzymklassifikationen“ oder „Inhibitorklassifikation“.
Einschub – „Überschriften, Abschnitte und die Blöcke A bis H“ ↙↙ |
Die meisten Parameter wirken sich jeweils in genau einem Block aus. Für die Überschrift des Blocks ist fast nie ein einzelner Parameter zuständig, sondern es sind dann nahezu alle, die auch entsprechende ›optische Parameter‹ in „ihrem“ Block aufweisen. Die Ausnahme ist ›Block B‹, dessen Überschrift durch nur einen Parameter (HGNCid) bedingt wird.
Es gibt – soweit ich das überblicke – zwei Parameter, die sich in mehreren Blöcken auswirken. Das ist zum einen UniProt
und zum anderen HGNCid
.
Der Parameter UniProt
kann sich mit ein und dieselbe Eingabe (z. B. |UniProt=P12345
) in zwei Blöcken auswirken:
- in ›Block C‹ (Überschrift „Bezeichner“) tritt der Schriftzug „UniProt:“ als ›optischer Parameter‹ auf, dessen ›optisches Argument‹ einer Verknüpfung zu einer Datenbank dient (z. B. „P12345“ → https://www.uniprot.org/uniprot/P12345), und
- in ›Block G‹ (Überschrift „Vorkommen“) bedingt der Parameter
UniProt
gegebenfalls eine Verknüpfung zu einer Datenbank (z. B. https://pbil.univ-lyon1.fr/cgi-bin/acnuc-ac2tree?query=P12345&db=HOGENOM), je nachdem ob und wie andere Parameter angewendet werden, die „Block-G-spezifisch“ sind (Homolog_db
,Homolog_fam
,Homolog_url
).
Der bereits erwähnte Parameter HGNCid
der das Ende von ›Block A‹ und den Anfang von ›Block B‹ definiert, weil er eine Überschrift zwischen beide Blöcke setzen kann, beeinflußt einen dritten Block, den ›Block C‹, der die Überschrift „Bezeichner“ trägt. Es bestehen Abhängigkeiten zwischen den Parametern "Symbol" (Gen-Symbol), "AltSymbols" (alternative Gen-Symbole) und "HGNCid".
Sowohl "Symbol" als auch "AltSymbols" (wie auch andere Parameter) können das Auftreten des Abschnitts mit der Überschrift „Bezeichner“ auslösen. Wenn die Überschrift „Bezeichner“ ausgelöst wird, dann kann ein Schriftzug zur Benennung einer Zeile in diesem Abschnitt der Infobox drei verschiedene Formen annehmen: Gen-Name(n), Gen-Name und Gen-Namen. Vereinfacht ausgedrückt ist "Symbol" für die Einzahl, "AltSymbols" für die Mehrzahl und "HGNCid" für Verknüpfungen zuständig.
Diese Auswirkungen eines einzelnen Parameters an mehreren Stellen hat Vor- und Nachteile.
Der größte Vorteil dürfte sein, dass mit relativ wenig Text viel erreicht werden kann. Der Code |HGNCid=399
innerhalb der Vorlagen-Einbindung {{Infobox Protein
...}}
- deklariert einen Satz von Protein-Eigenschaften als „Eigenschaften des menschlichen Proteins“ (mithilfe der entsprechenden Überschrift),
- verknüpft den Schriftzug „Gen-Name“ oder „Gen-Namen“ zum Artikel Human Genome Organisation (HUGO) und
- verknüpft den Wert des Parameters "Symbol" (z. B.
|Symbol=399
) als Verknüpfungstext zu einer Datenbank für HUGO-Gennamen: https://www.genenames.org/tools/search/#!/all?query=399.
Der größte Nachteil der vielfältigen Abhängigkeiten dürfte sein, dass diese schwer zu beschreiben sind.
Es werden, falls ich nicht etwas übersehen habe, sieben Parameter durch HGNCid
direkt beeinflusst: fünf durch die Überschrift „Eigenschaften des menschlichen Proteins“ (Groesse
, Struktur
, Kofaktor
, Precursor
, Isoformen
) von ›Block B‹ und die zwei genannten (Symbol
, AltSymbols
) in ›Block C‹.
Im Grunde genommen wird auch der ›Block A‹ durch HGNCid
beeinflusst, da die An- oder Abwesenheit der ›Block-B‹-Überschrift („Eigenschaften des menschlichen Proteins“) dazu führt, dass die fünf ›Block-A‹-Parameter (Name
, Bild
, Bild_legende
, Andere Namen
, PDB
) mal allein und mal zusammen mit den ›Block-B‹-Parametern den ersten Abschnitt, die Einleitung der Infobox, gestalten. Das macht dann alles zusammen zwölf zusätzliche Parameter (neben "HGNCid" selbst), bei denen in der Dokumentation zu den Abhängigkeiten von HGNCid
etwas stehen müsste.
Die Untersuchung als detaillierte Erzählung
Start der Analyse – EC-Nummer und Kategorie
Dass es recht komplexe Zusammenhänge zwischen den Parametern geben kann, habe ich anhand der beiden Parameter "EC-Nummer
" und "Kategorie
" herausgefunden, die ich in der Vorlagen-Einbindung innerhalb des Artikels DNA-Methyltransferasen entdeckte. Dort fand ich in der „Infobox Protein“ eine Zeile vor, die etwa so aussah (2019-09):
EC, Kategorie | , Methyltransferase |
Das Komma am Anfang eines Schriftzugs irritierte mich und deshalb sah ich mir die Infobox genauer an – der Code für diese Infobox ist links, die resultierende Infobox ist rechts dargestellt:
Vorlage-Einbindung: |
Resultierende Infobox (nachgestaltete Tabelle):
|
Es fällt auf, dass ein Parameter auf verschiedene Arten leer sein kann:
- „richtig leer“, dann folgt dem Gleichheits-Zeichen nichts und
- „eigentlich leer“, dann folgt dem Gleichheits-Zeichen nur ein Kommentar: "
<!--2.1.1.- -->
", der von der auswertenden Software ignoriert wird.
Für die auswertende Software sieht der Code an der entsprechenden Stelle wahrscheinlich ungefähr so aus:
{{...|EC-Nummer=|...}}
und
für einen Leser – wie mich – ungefähr so:
{{...|EC-Nummer = <!--2.1.1.- -->|...}}
.
Zu der Zeit (2019-09) als ich das erste Mal auf diesen Code der Vorlagen-Einbindung stieß, wusste ich noch nicht, wie "EC-Nummer" und "Kategorie" zusammenarbeiten und dachte, ich könnte in der Infobox etwas ähnliches, wie das Folgende unterbringen:
EC, Kategorie | Die DNA-Methyltransferasen sind eine Gruppe von Enzymen mit mehreren EC-Nummern (EC 2.1.1.37; EC 2.1.1.72; EC 2.1.1.113), Methyltransferase |
Das ging nicht ohne Weiteres. Deshalb habe ich Experimente durchgeführt oder besser gesagt, „herumprobiert“, um über die beiden Parameter ("EC-Nummer" und "Kategorie") und die „Infobox Protein“ als ganzes mehr zu lernen. Ich lernte dabei z. B.:
- dass mehrere Parameter gleichermaßen für die Überschrift „Enzymklassifikation“ zuständig sind,
- dass man einen Parameter mehrfach eingeben kann und der Wert des letzten Eintrags relevant ist (der Code: »...|EC-Nummer = A |Kategorie = Methyltransferase |EC-Nummer = B |...« ergibt den Text: »B, Methyltransferase«),
- dass bei externen Verknüpfungen nicht alle angegebenen Wörter gleichermaßen wirken, weil nur das erste Wort für das Linkziel genutzt wird (der Code: »...|EC-Nummer = eins zwei drei |...« wird zum Text: »zwei drei eins zwei drei«, weil folgender Wikitext entsteht: »[https://www.brenda-enzymes.org/php/result_flat.php4?ecno=eins zwei drei eins zwei drei]«).
Letztlich war mir nicht klar, ob die Programmierung von „Vorlage:Infobox Protein“ zwischen abwesenden und leeren Parametern unterscheidet. Ich dachte, dass ich vielleicht den Programm-Code selbst mal ansehe.
Einschub – „Kommentiertes Code-Segment“ ↙↙ |
Die Formulierungen der Form: {{#if: ... {{Parameter|}}}...
deuteten darauf hin, dass jeweils ein Parameter erwartet wurde, der weder abwesend noch leer ist. Allerdings ist der Code auch mit Syntaxhervorhebung nicht unbedingt übersichtlich (|}}}{{{
, |}}}|
, }}}]]}} }}
usw.), so dass ich nicht mit mit Bestimmtheit voraussagen konnte, ob es für die beiden Parameter EC-Nummer
und Kategorie
egal ist, ob sie "Abwesend" oder "Leer" sind.
Systematische Testung von EC-Nummer und Kategorie
Deshalb hatte ich eine Untersuchung mit den Zuständen "Abwesend" (0), "Leer" (1) und "Befüllt" (2) durchgeführt – für die zwei Parameter EC-Nummer und Kategorie. Das ergibt 32 = 9
Kombinationen. Diese wurden von 2*0 + 1*0 = 0
bis 2*3 + 1*3 = 8
nummeriert. Das sah etwa so aus:
- 0 – Beide Parameter, EC-Nummer und Kategorie, sind abwesend:
{{Infobox Protein|Name=Name_0}}
- ...
- 4 – Beide Parameter leer:
{{Infobox Protein|Name=Name_4|EC-Nummer=|Kategorie=}}
- 7 – EC-Nummer befüllt; Kategorie leer:
{{Infobox Protein|Name=Name_7|EC-Nummer=1.2.3.4|Kategorie=}}
- 8 – Beide Parameter befüllt:
{{Infobox Protein|Name=Name_8|EC-Nummer=1.2.3.4|Kategorie=Kategorisch}}
Daraus ließ sich nach visueller Prüfung der neun Infoboxen in der Normalansicht ableiten, dass die beiden Zustände "Abwesend" und "Leer" zumindest für diese beiden Parameter (EC-Nummer und Kategorie) keinen Unterschied ergeben.
Das EC-Nummern-System und das Komma zwischen EC, Kategorie
Die ursprüngliche Frage, was man mit einer Protein-Gruppe macht (DNA-Methyltransferasen), die nach dem EC-Nummern-System selbst keine einzelne EC-Nummer hat, sondern mehrere Mitglieder, von denen jedes eine EC-Nummer besitzt, war damit noch nicht geklärt.
Alle drei Mitglieder (EC 2.1.1.37; EC 2.1.1.72; EC 2.1.1.113) gehören zwar in die gleiche Gruppe, die “sub-subclass Methyltransferases”, also in die Unter-Unterklasse Methyltransferasen, so dass man eine „Kategorie“ hätte; die vorangestellte Nummer dieser Unter-Unterklasse – EC 2.1.1
oder 2.1.1.-
oder auch EC 2.1.1.-
– entspricht aber einer anderen Gruppe, den „Methyltransferasen“ und eben nicht den „DNA-Methyltransferasen“, für die die „Infobox Protein“ im konkreten Fall übersichtliche Informationen liefern soll.
Es ergeben sich die Fragen,
- wie das EC-Nummern-System „im Original“ aufgebaut ist,
- wie dieses System in der hier betrachteten Vorlage umgesetzt wird und
- wie sich das auf die Anwendung der Vorlage in Wikipedia-Artikeln auswirkt.
Die Empfehlungen zum EC-Nummern-System
Die heute oft verwendete, griffige Bezeichnung „EC-Nummern-System“ oder „EC-System“ führt zur Tätigkeit einer früheren Kommission, zur Enzyme Commission (EC). Heute liegt die Pflege dieses Systems in der Hand der IUBMB, bzw. ihres Nomenklatur-Komitees (NC-IUBMB). Das EC-System hat offiziell einen langen Namen, das in der Übersetzung etwa:
- „Empfehlungen zur Nomenklatur und Klassifizierung von Enzymen anhand der von ihnen katalysierten Reaktionen“
lautet. Es sind also Empfehlungen für den Fall, dass Enzyme nach chemischen Gesichtspunkten katalogisiert werden sollen. Das System hat vier Hierarchie-Ebenen mit Nummern und Benennungen. Es ähnelt in gewisser Weise einem gegliederten Dokument mit nummerierten Überschriften; allerdings sind beim EC-System die Nummern wichtiger als die Benennungen, weil sie eindeutiger sind.
Die Empfehlungen zu den vier Ebenen des EC-Nummern-Systems laufen – wie auch ihre häufig gefundenen Umsetzungen – darauf hinaus,
- dass Ebenen von der höchsten Ebene zur untersten Ebene
- von oben nach unten oder
- von links nach rechts angeordnet werden.
- Innerhalb einer Ebene steht
- die EC-Nummer vorn und
- ein zutreffender Name (wenn angegeben) unmittelbar dahinter.
- Die Ebenen werden stark voneinander abgegrenzt,
- die EC-Nummer hat als eindeutigere Komponente Vorrang
- gegenüber einer Benennung.
Hier sind Beispiele für die Umsetzung in Datenbanken gezeigt:
Einschub – „Beispiele für die Umsetzung des EC-Nummern-Systems“ ↙↙ |
Enzymklassen, Enzymeinträge und Kategorien
Letzlich ist jede der vier Ebenen im EC-Nummern-System eine „Kategorie“, da nicht nur die drei höheren Ebenen, die Enzymklassen (Klasse, Unterklasse und Unter-Unterklasse) jeweils Mitglieder beherbergen, sondern auch die unterste Ebene, die sogenannten Enzymeinträge oder Seriennummern. Nach den „Empfehlungen zur Nomenklatur und Klassifizierung von Enzymen anhand der von ihnen katalysierten Reaktionen“, welche von einem Nomenkalturausschuss (NC-IUBMB) im Auftrag des IUBMB gegeben werden, gehören alle Enzyme, die innerhalb von DNA die Nukleinbase Cytosin an der Position 5 methylieren (DNA-Methylierung) zur Seriennummer EC 2.2.1.37
mit der Benennung (akzeptierter Name) "DNA (cytosine-5-)-methyltransferase
". Das sind sehr viele verschiedene Enzyme in allen möglichen Lebewesen.
EC, Kategorie – ein optischer Doppel-Parameter
In der Vorlage „Infobox Protein“ werden die beiden Parameter "EC-Nummer" und "Kategorie" zusammen abgearbeitet, wie der Programmcode zeigt.
Einschub – „Kommentiertes Code-Segment“ ↙↙ |
In der resultierenden Infobox wird links wird ein Schriftzug generiert, der zu beiden Parametern passen soll und rechts einer, der zu beiden Argumenten passen soll. Um diese Beziehung zu verdeutlichen, nenne ich dieses Paar aus den beiden Parametern "EC-Nummer" und "Kategorie" hier einen „Doppel-Parameter“. Entsprechend sind die beiden Werte ein „Doppel-Wert“ oder „Doppel-Argument“. Die resultierenden Anzeige-Elemente nenne ich folglich „optischer Doppel-Parameter“ (Schriftzug "EC, Kategorie") und „optisches Doppel-Argument“.
Einschub – Doppel-Parameter schematisch ↙↙ |
EC, Kategorie – Hierarchie-Ebenen und Sichtweisen
Der „optische Doppelparameter“ erklärt sich nicht unbedingt selbst; man kann die Formulierung „EC, Kategorie“ auf verschiedene Art und Weise verstehen.
Zum einen wäre „EC“ eine EC-Nummer und „Kategorie“ die Benennung einer Kategorie, in welche die zuvor genannte EC-Nummer hinein gehört und zum anderen könnte man die Formulierung „EC, Kategorie“ durchaus so verstehen, dass „EC“ die Nummer sein soll und „Kategorie“ die Bezeichnung der zugeordneten Gruppe, die all die Enzyme umfasst. Es gäbe also zwei Sichtweisen in Bezug auf den Schriftzug „EC, Kategorie“:
- die ›Gehört-in‹-Sichtweise – die EC-Nummer gehört in die Kategorie und
- die ›Entspricht‹-Sichtweise – die EC-Nummer entspricht der Kategorie.
Gegen die ›Gehört-in‹-Sichtweise spricht, dass die Reihenfolge der Hierarchie-Ebenen bei Anwendung des EC-Systems unüblich ist und gegen die die ›Entspricht‹-Sichtweise ist einzuwenden, dass das Wort „Kategorie“ selbst andeutet, dass es sich um eine eine übergeordnete Ebene handelt.
Für die ›Gehört-in‹-Sichtweise spricht, dass man sie in entsprechenden Wikipedia-Artikeln häufig findet. Die ›Entspricht‹-Sichtweise ist seltener zu finden; es gibt sie aber.
Der Volltändigkeit halber wäre noch eine dritte (wenngleich abwegige) Sichtweise anzuführen: die Kategorie läge eine Hierarchie-Ebene unterhalb der EC-Nummer. „EC“ würde dann mit der EC-Nummer eine Gruppe von Proteinen ansprechen und die Mitglieder würden die „Kategorie“ bilden. Die Eingabe mehrerer Mitglieder ist allerdings nicht möglich, da der Wert des Parameters "Kategorie" automatisch zum gleich benannten Wikipedia-Artikel verknüpft wird.
Es folgen Beispiele, die in der Wikipedia gefunden wurden:
Einschub – „Beispiele – Sichtweisen zu Hierarchie-Ebenen von Kategorie und EC-Nummer“ ↙↙ |
Kategorien im EC-Nummern-System und in der Wikipedia
In der Wikipedia könnte man, wenn man das Wort Kategorie liest, auch an die Wikipedia:Kategorien denken. In der deutschen Wikipedia überlappen die Unterkategorien der Kategorie:Enzym zum Teil mit den Enzym-Klassen der ersten Hierarchie-Ebene des EC-Nummern-Systems der IUBMB. Allerdings habe ich in den „Infobox Protein“-Anwendungen entsprechender Artikel bisher keinen Eintrag mit einem entsprechenden Einbindungs-Code gefunden, z. B. ähnlich wie dieser: … |EC-Nummer = 2.1.1.37 |Kategorie = Kategorie:Methyltransferase | …
.
So wie es in der deutschen Wikipedia die Kategorie:Enzym gibt, gibt es in der englischen Wikipedia eine ähnliche Category:Enzymes by function (die eine “subcategory” von Category:Enzymes ist, Mai 2020).
Die englischen Vorlagen (templates) "enzyme", "Infobox protein" und "Infobox protein family" auf der einen Seite und die deutschen Vorlagen "Infobox Enzym" (die am 7. Jan. 2009 gelöscht wurde) und "Infobox Protein" teilen (teilten) wohl einige Eigenschaften, weisen (wiesen) aber auch viel Divergenz auf.
Ein vergleichbares Wort, wie "Kategorie", also "Category", "EC_category" oder ähnliches, habe ich in den Infoboxen englischer Enzym-Artikel bisher nicht gefunden (Mai 2020).
In der englischen Wikipedia wurde versucht, das EC-Nummern-System mit seinen Enzymklassen und Enzymeinträgen so abzubilden, dass es sowohl dem Wikipedia-System mit Kategorien und Artikeln als auch den Empfehlungen hinsichtlich der zur Nomenklatur und Klassifizierung mit Nummern und Benennungen entsprechen kann:
Die oberste Einteilungsebene des EC-Systems (z. B. Hydrolases oder Transferases für die ‘EC 1: Hydrolases’ oder ‘EC 2: Transferases’) ist nur durch den Namen, aber nicht durch die EC-Nummer erreichbar, während die darunter liegenden Enzymklassen eher durch die jeweilige EC-Nummer, als durch die Benennung erreichbar sind (z. B. "EC 2.1", aber nicht "Transferring one carbon groups"). Die Enzymklassen (Hierachie-Ebenen 1 bis 3) wurden in Wikipedia-Kategorien erfasst, während die Enzymeinträge (Hierachie-Ebene 4) oft als Weiterleitungen der jeweiligen EC-Nummer auf mehr oder weniger passende Artikel angelegt sind.
In der deutschen Wikipedia gibt es keine „Kategorie:EC 2.1“, „Kategorie:Transferring one carbon groups“ oder „Kategorie:Eine Kohlenstoff-Gruppe übertragend“, so dass die Möglichkeit weitestgehend entfallen würde, den Parameter "Kategorie" gleichermaßen als Wikipedia-Kategorie und als Kategorie im EC-Nummern-System zu betrachten.
Unter-Vorlagen, auch für EC-Nummern
Egal, ob man mit der ›Gehört-in‹- oder der ›Entspricht‹-Sichtweise auf eine „Infobox Protein“ schaut; bei einer Proteingruppe, die drei EC-Nummern hat (wie das bei den DNA-Methyltransferasen der Fall ist), wäre die Angabe mehrerer EC-Nummern hilfreich. Dafür kann man die sogenannte Unter-Vorlage Vorlage:Infobox_Protein/MoreEC nutzen.
Es gibt drei Parameter in der Vorlage:Infobox Protein, MoreEC1
, MoreEC2
und MoreEC3
, die auf jeweils gleiche Weise diese Unter-Vorlage Vorlage:Infobox_Protein/MoreEC einbeziehen können, um so drei weitere „Enzymklassifikationen“ zu bekommen. Diese Mehrzahlform, die dann statt der Einzahl (Enzymklassifikation) als Überschrift auftaucht, irritiert etwas, da die gleiche Enzymklassifikation – nämlich die nach dem EC-Nummern-System – nur mehrfach angewendet wird.
Es sind sechs Parameter in der Unter-Vorlage, Vorlage:Infobox_Protein/MoreEC vorhanden (EC-Nummer
, Kategorie
, Peptidase_fam
, Reaktionsart
, Substrat
, Produkte
), die es sämtlichst auch mit gleichen Namen in der übergeordneten Vorlage:Infobox Protein gibt. Das Verhalten ist ähnlich; wahrscheinlich werden alle genannten sechs Parameter-Namen im gleichen Abschnitt angezeigt. Den ›optischen Doppel-Parameter‹ (Schriftzug „EC, Kategorie“) gibt mehrfach im selben Abschnitt der Infobox, durch die übergeordnete Vorlage und die (mehrfache) Einbeziehung der Unter-Vorlage. Der jeweilige Schriftzug „EC, Kategorie“ muss als eine Art Unter-Überschrift dienen, den zwischen den Angaben zu unterschiedlichen EC-Nummern gibt es sonst keine weiteren optischen Abgrenzungen.
Zur Zeit meiner ersten experimentellen Anwendungen der „Mehr-als-eine-EC-Nummer-Parameter“ (MoreEC1 bis 3) in der Vorlage:Infobox Protein der entsprechenden Unter-Vorlage war mir noch nicht klar, welche Vielfalt die Überschriften der Abschnitte aufweisen können und welche es überhaupt gibt (2019-10). Ich nahm zur Kenntnis, dass es eine weitere Unter-Vorlage gibt (Vorlage:Protein Orthologe) und das auch Parameter-Werte weitere Vorlagen enthalten können (z. B. |PDB = {{PDB2|1YY1}}, {{PDB2|ABCD}}
), ging aber davon aus, das ich das für meine spezifischen Betrachtungen nicht brauche.
Möglichst alle Parameter
Langsam wurde klar, dass die Beziehung möglichst aller Parameter zueinander untersucht werden müsste – oder wenigsten der wichtigsten – wenn ersteres nicht gehen würde.
Der Hauptgrund war, dass ganz grundsätzlich die Anzeige-Elemente in der Infobox (Schriftzüge mit Formatierungen und Verknüpfungen) den Eingabe-Elementen einer Vorlage-Einbindung (den Parameter und Werten) zugeordnet werden sollten. Weiterhin hatte ich den Verdacht, dass einige Zusammenhänge in der Vorlage:Infobox Protein nicht notwendigerweise meiner eigenen Denkweise entsprechen könnten, weswegen es besser wäre, sie zu erkunden.
Ich wollte deshalb die Beispiele im Abschnitt „Parameter-Details“ der Vorlage „Infobox Protein“ entnehmen, um daraus eine „allumfassende Vorlage-Einbindung“ zu erstellen (2019-12).
Es wurde während der Analyse immer deutlicher, dass man sich hinsichtlich der möglichen Änderung von Komponenten auf einen Referenz-Zeitpunkt beziehen müsste.
Das Team Technische Wünsche der Wikimedia Deutschland (WP:WMDE) hatte auf der Seite „Häufigst genannte Probleme“ unter dem Abschnitt „Weitere Probleme“ zum Thema Zeitabhängigkeit Folgendes notiert:
- „Ruft man eine alte Version eines Artikels auf, so wird er nicht mit den damaligen Versionen der genutzten Vorlagen angezeigt, sondern mit den aktuellen. Dadurch ist es nicht möglich, sicher zu sein wie der Artikel damals aussah.“ (oldid=194822419#Weitere_Probleme, Version am 11. Dezember 2019)
Stichtag und Referenzzeitpunkt
Da meine Untersuchungen Ende September 2019 begannen, habe ich den 29. September 2019 als Stichtag und 12:00 Uhr mittags (Mitteleuropäische Sommerzeit) als Referenzzeitpunkt gesetzt. Die genaue Uhrzeit spielt meist keine Rolle, da am Stichtag weder die hier betrachtete Vorlage, noch die relevanten Unter-Vorlagen, noch die Vorlage-Dokumentationen geändert worden sind.
Der Referenz-Artikel, „DNA-Methyltransferasen“, wurde zwar noch am Stichtag geändert, nicht aber die in diesem Artikel relevante Vorlage-Einbindung der „Infobox Protein“. Außerdem erfolgte die erste Änderung des Artikels am Stichtag deutlich später als zur Referenzzeit (nach 18:00 Uhr: oldid=192711864). Die Referenz-Version für den Artikel, „DNA-Methyltransferasen“, ist diejenige, die am 29. Sep. 2019 mittags bestand hatte (oldid=187579075, Version vom 15. April 2019).
Die Referenzversion der Vorlage mit dem entsprechenden Programmcode hat eine zeitliche Reichweite vom 19. Dezember 2018 bis zum 27. Dezember 2019; die Referenzversion der Dokumentation auf der entsprechenden Unterseite hat eine Gültigkeit vom 3. April 2018 bis zum 27. Dezember 2019. Beide Referenzversionen – die des Programmcodes und die der Dokumentation – gelten also auch für den Stichtag, den 29. September 2019, und sie haben eine „resultierende zeitliche Reichweite“ vom 19. Dezember 2018 bis zum 27. Dezember 2019.
Achtung! — Heute bindet die damalige Programm-Version („eigentliche Vorlage“) den Text der heutigen Dokumentation ein!
Das wird hier schematisch in einer allgemeinen Form (1.) und konkret am Beispiel des Abschnitts "Parameter-Details" (2.) dargestellt:
[
Damaliger Programm-Code] <== bindet [
heutige Doku ein, die] ≠ ungleich [
der damaligen Doku ist.]
[
oldid=183851377#Parameter-Details] <== [
Vorlage:Infobox Protein/Doku#Parameter-Details] ≠ [
oldid=175729659#Parameter-Details]
Einschub – „Die Referenzversionen im Einzelnen“ ↙↙ |
Verschiedene Zahlen von Parametern
Nach einigen Versuchen der Anwendung von Parametern und Beispielen aus zwei Abschnitten der „Doku“ (Infobox Protein/Doku oldid=175729659#Parameter-Details, oldid=175729659#Kopiervorlage) hatte ich eine Vorlage-Einbindung, die – ohne Mitzählen von Unter-Vorlagen – 40 Parameter enthielt. Einige Parameter von den 43 Parameter-Namen unter „Parameter-Details“ und von den 41 Namen unter „Kopiervorlage“ waren nicht gültig – "Bild2" und "Bild_legende2" (aus „Kopiervorlage“) sowie "AltSymbol" (aus „Parameter-Details“). Zwei Parameter, MoreEC2
und MoreEC3
, wurden heraus genommen, da sie die gleiche Unter-Vorlage einbezogen, wie MoreEC1
, so dass kein anderes Verhalten zu erwarten war.
Ich habe für Parameter von Unter-Vorlagen eindeutige Benennungen „erfunden“, um sie von den Parametern von der Vorlage „Infobox Protein“ (Programm-Code: oldid=183851377; Doku: oldid=175729659) unterscheiden zu können:
Tritt ein Parameter-Name, z. B. "Kategorie", in einer Vorlage-Einbindung zweimal auf, dann heißt der Parameter in der übergeordneten Vorlage einfach nur Kategorie
, während der Parameter in der untergeordneten Vorlage auch den Namen des übergeordneten Parameters (z. B. MoreEC1
) enthält: MoreEC1‑>Kategorie
.
Im folgenden Beispiel-Code-Segment wird das gezeigt:
{{Infobox Protein |... | Kategorie = ... |MoreEC1 = {{Infobox Protein/MoreEC |... |Kategorie = ... |... }} ...|...}}
Die zuerst aufgeführten Parameter heißen Kategorie
und MoreEC1
, während ich den Parameter in der Vorlage-Verschachtelung als MoreEC1‑>Kategorie
bezeichne.
Für die Unter-Vorlage "Infobox Protein/MoreEC" (Programm-Code und Doku: oldid=177045241) wurden nur zwei Parameter ausgewählt – MoreEC1‑>Name
und MoreEC1‑>Kategorie
.
Für die Unter-Vorlage "Protein Orthologe" (Programm-Code: oldid=177045241; Doku oldid=165298437) wurden nicht alle möglichen 20, sondern nur 6 Parameter, vor allem Pflichtparameter, einbezogen – z. B. Orthologe‑>Spezies1
und Orthologe‑>Spezies2
.
Das Beispiel einer „Riesenvorlage“ mit über 40 direkten und „untergeordneten“ Parametern wurde an entsprechender Stelle eingebunden (Benutzerseite als Baustelle) und das Ergebnis – die als Infobox bezeichnete HTML-Tabelle in der Normalansicht – analysiert. Der erstaunlichste Aspekt war für mich, dass der Abschnitt „Enzymklassifikation“ jetzt „Inhibitorklassifikation“ hieß.
Die resultierende Tabelle in der Normal-Ansicht wurde in einen Schreib-Programm und einem Tabellenkalkulations-Programm weiter verarbeitet.
Die subjektiv als „atomar“ erscheinenden Schriftzüge wurden strukturiert, nummeriert und katalogisiert. Es erwies sich als sinnvoll, den Parametern möglichst markante und einmalige, wenn auch sachlich sinnlose Werte zuzuordnen, um sie als Schriftzüge in der Infobox wiederzufinden: z. B. |CASergänzend="CASergänzend" freier Text
.
Zeichenketten
Anfangs unterschied ich zwischen allgemeinen und konkreten Schriftzügen, später wurde daraus ein Konzept
- mit Eingabe-Elementen – den Parametern und Argumenten (Parameter-Werten) – und
- mit Anzeige-Elementen – den Überschriften, ›optischen Parametern‹ und ›optischen Argumenten‹ –
auf der einen Seite sowie
- mit allgemeinen Elementen – den Parametern, Überschriften und ›optischen Parametern‹ – und
- mit konkreten Elementen – den Argumenten (Parameter-Werten) und ›optischen Argumenten‹ –
auf der anderen Seite.
Den Hintergrund dieser Überlegungen bildete meine Absicht, eine alphabetisch sortierte Tabelle zu erstellen, die alles enthält, was Buchstaben hat und bei Anwendung der Vorlage „Infobox Protein“ wiederkehrender Natur ist. Deshalb habe ich einen weiteren „Arbeitsbegriff“ eingeführt, die ›konstante, atomare Zeichenkette‹, die einen allgemein verwendeten, nicht mehr verkürzbaren Textteil darstellt.
Das soll mit einem Beispiel verdeutlicht werden, bei dem ein zugrunde liegender Wikitext |OMIM=103600
in einer Vorlage-Einbindung den Schriftzug „OMIM: 103600“ in der resultierenden Infobox hervorruft: "OMIM
" wäre in diesem Fall eine ›konstante, atomare Zeichenkette‹. Der Schriftzug in der Infobox hat einen allgemeinen Teil, nämlich „OMIM: “ und einen konkreten Teil, nämlich „103600“. Der zugrunde liegende Wikitext hat ebenfalls einen allgemeinen und einem konkreten Teil; den Parameter OMIM
mit seinem konkreter Wert 103600
. Die beiden allgemeinen, in gleicher Form wiederkehrenden (also ›konstanten‹) Komponenten der „Infobox Protein“ – das Anzeige-Element „OMIM: “ und das Eingabe-Element OMIM
– beinhalten eine gemeinsame, nicht mehr sinnvoll teilbare Zeichenkette, die also ›atomar‹ ist, nämlich "OMIM
".
Doppelpunkten mit Leerzeichen, die der optischen Abgrenzung dienen, habe ich einen Sonderstatus eingeräumt, es sind zwar Zeichenketten, werden aber als Hervorhebungen betrachtet, ähnlich wie die Umrandungen von Tabellenzellen. Es gibt ein Komma dass im Zusammenhang mit den Parametern EC-Nummer
und Kategorie
in die Infobox geschrieben wird; eigentlich sind es zwei Kommas. Dieses Komma findet sich zum einen innerhalb einer ›konstanten, atomaren Zeichenkette‹ – nämlich „EC, Kategorie“ – und zum zweiten vor dem Schriftzug, der durch den Wert des Parameters Kategorie
hervorgerufen wird. Im zweiten Fall wird dieses Komma weniger als Teil eines Schriftzugs, sondern eher als Hervorhebung betrachtet.
Die Tabelle mit den allgemeinen Zeichenketten, die in der „Infobox Protein“ angewendet werden oder auftreten können, könnte also ungefähr so aussehen:
Zeichenketten | Anzeige- und Eingabe-Elemente |
---|---|
... | |
EC, Kategorie | Anzeige-Element, ›optischer Parameter‹: "EC, Kategorie" ... |
... | |
Kategorie | Eingabe-Element, Parameter: "Kategorie"; siehe ... |
... | |
OMIM | 1. Anzeige-Element, ›optischer Parameter‹: "OMIM:"; siehe ... |
2. Eingabe-Element, Parameter: "OMIM"; siehe ... | |
... |
Da ich unmöglich alle Varianten durchtesten konnte, die es geben könnte, entschied ich mich, den hauptsächlich zugrunde liegenden Programm-Code systematischer zu durchforsten (Vorlage „Infobox Protein“, Programm-Code: oldid=183851377). Ich habe den Quell-Code kopiert und in einem Schreibprogramm und einen Tabellenkalkulations-Programm weiter „verarbeitet“. Ähnlich wie bei den ›konstanten, atomaren Zeichenketten‹ ging es darum, alles zu erfassen, was allgemein auftreten kann. Ein Vorteil dieser Vorgehensweise gegenüber dem Testen ist, dass auch Code erkannt werden kann, der sich in einer konkreten Anwendung möglicherweise nicht auswirkt.
Der Code wurde mit „Suchen und Ersetzen“ schrittweise in möglichst sinnvolle Einzelteile zerlegt und zeilenweise geordnet. Anschließend wurde mit „Duplikate entfernen“ die Redundanz reduziert und dadurch das Vorkommen geprüft. Die Vorgehensweise erforderte einige „Handarbeit“ meinerseits, z. B., weil „Suchen und Ersetzen“ innerhalb eines Schreib-Programms kein professionelles Analyse-Werkzeug innerhalb einer Entwicklungsumgebung (IDE) ist.
So konnte ich beispielsweise durch „Abhacken“ der Zeilen hinter "]]
" zwar ganz gut die internen Verknüpfungen zu Wikipedia-Seiten isolieren, aber nur umständlich herausfinden, wo ein einzelnes "en
" herkam. Durch Rückverfolgung von Zeilennummern sah ich dann, dass dies die Endung eines Links war, nämlich von [[Isoform]]en
.
Die Quell-Code-Analyse zeigte, dass zwei Parameter, die zuvor als ungültig (unbekannt) getestet worden sind – „Bild2“ und „Bild_legende2“ – durchaus im Quell-Code auftreten.
Der Grund dafür, dass der Programm-Inhalt für die Parameter „Bild2“ und „Bild_legende2“ nicht wie erwartet abgearbeitet wird, ist eine Code-Bereich, der dem „eigentlichen“ Programm-Code folgt und der „Parameterwartung“ genannt wird. In diesem Bereich werden „Bild2“ und „Bild_legende2“ nicht aufgeführt.
Einschub – „Die Bereiche im Programm-Code der Vorlage“ ↙↙ |
Ein weiterer, bereits zuvor als ungültig eingestufter Parameter-Name, der in der Dokumentation gefunden wurde, ist „AltSymbol“. Für diese Parameter-Bezeichnung habe ich im Code eine gültige Schreibweise gefunden: AltSymbols
.
Es gibt – soweit ich das überblicken kann – innerhalb der Vorlage „Infobox Protein“ in den betrachteten Versionen fünf Bereiche, in denen Parameter-Namen auftauchen: drei in der Dokumentation und zwei im Programm-Code.
In der Dokumentation (oldid=175729659) waren drei Abschnitte vorhanden, in denen Listen oder Tabellen mit Parameter-Namen gefunden werden konnten. Im Abschnitt "Kopiervorlage" gibt es eine Vorlage-Syntax mit 41 Namen als Kopiervorlage für die Einbindung in Artikeln, im Abschnitt "Vorlagenparameter" stehen 43 Namen mit ihren „Features“, z. B. Datentypen, und im Abschnitt "Parameter-Details" steht eine Tabelle mit Erklärungen und Beispielen.
Im Programm-Code (oldid=183851377) habe ich zwei Bereiche entdeckt, in denen Parameter-Namen auftauchen: den „eigentlichen“ Programm-Code (43 Namen), der die Anweisungen für das Schreiben einer Infobox als Tabelle mit Wikitext enthält und den ich fürderhin "Programmablauf-Bereich" nenne und den Bereich "Parameterwartung" (41 Namen), in dem definiert wird, welche Parameter-Namen Gültigkeit haben.
Insgesamt habe ich 44 Parameter-Benennungen gefunden. Die meisten Parameter-Namen, 40 an der Zahl, sind konsistent, d. h., sie tauchen in allen oben genannten Bereichen auf. Es gibt drei bis vier Namen, die inkonsistent angewendet wurden: die beiden Namen „Bild2“ und „Bild_legende2“ und ein dritter Name, der in einer ungültigen Schreibweise, „AltSymbol“ und einer gültigen Schreibweise, AltSymbols
auftaucht.
Überschriften, Abschnitte, Blöcke und die Zuordnung von Parametern
Sowohl bei der Betrachtung der Zeichenketten in Vorlage-Einbindungen und den resultierenden Infoboxen, als auch der Zeichenketten im Programm-Code und der Dokumentation wurde deutlich, dass die Einteilung von Abschnitten nach Überschriften nicht ausreicht, da deren Auftreten und die konkret genutzten Namen variieren können. Erst die „Erfindung“ der ›Blöcke‹, einer Art potentieller Abschnitte, machte es mir möglich, die Parameter den Abschnitten zuzuordnen, indem ich die ›Blöcke‹ als Vermittler genutzt habe:
- Parameter ↔ ›Block‹ ↔ Überschrift/ Abschnitt
Eigentlich hatte ich vor der Analyse folgende Verhältnisse erwartet:
- Parameter ←n:1→ Überschrift/ Abschnitt
Es sieht aber wohl eher so aus:
- Parameter ←m:n→ Überschrift/ Abschnitt
Mit ihrem ›Block‹ als Vermittler haben sowohl Parameter als auch Überschriften und Abschnitte eine „gemeinsame Anlaufstelle“; wobei die Adresse erst einmal nur für die Überschriften bzw. für die Abschnitte eindeutig ist:
- Parameter ←m:n→ ›Block‹ ←1:n→ Überschrift/ Abschnitt
Von den 42 Parametern, die unterm Strich in der Vorlage „Infobox Protein“ anwendbar waren (Programm-Code: oldid=183851377), wenn man von Unter-Vorlagen absieht, sind 40 eindeutig „ihrem ›Block‹“ zuzuordnen, während zwei Parameter die Ausnahme bilden:
- Regel: Eindeutiger Parameter ←n:1→ ›Block‹ ←1:n→ Überschrift/ Abschnitt
- Ausnahme: Mehrdeutiger Parameter ←m:n→ ›Block‹ ←1:n→ Überschrift/ Abschnitt
Durch die Art meiner Analyse ist folgende Aussage sehr sicher:
- (Zahl aller Parameter) = 42 = (Zahl der eindeutigen Parameter) + (Zahl der mehrdeutigen Parameter)
Ich kann auch mit guter Glaubwürdigkeit die Aussage treffen, dass 40 Parameter bezüglich ihrer Wirkung in den ›Blöcken‹ eindeutig sind – allerdings nicht mit 100-%-iger Sicherheit.
Einschub – „Parameter-Namen an unterschiedlichen Stellen“ ↙↙ |
Extra-Analysen für mehrdeutig wirksame Parameter
Es ist relativ schwer, herauszufinden, welche Parameter mehrdeutig wirksam sind, d. h. in verschiedenen Bereichen einer Infobox eine Auswirkung zeigen, die ich ›Blöcke‹ genannt habe. Da der Programmablauf-Code streng prozedural abläuft, ließe sich auswerten, an welcher Stelle eine Tabellenzeile mit Überschrift (a) geschrieben und an welcher nächsten Stelle die nächste Überschrift (b) geschrieben wird:
Erscheint ein Parameter-Name dann in den Bedingungen für die Ausgabe von a oder zwischen den jeweiligen Bedingungen für die Ausgabe von a und b, dann hat er wahrscheinlich in Abschnitt a eine Auswirkung. (Andersherum entsprechend: erscheint ein Parameter-Name weder in den Bedingungen für die Ausgabe von a noch zwischen den jeweiligen Bedingungen für die Ausgabe von a und b, dann hat er wahrscheinlich in Abschnitt a keine Auswirkung.)
Allerdings gibt es variable Überschriften-Namen und rein theoretisch könnte man das Schreiben von Tabellenzeilen mit demselben Überschriften-Namen in verschiedenen Stellen auslösen, was meines Wissens in der Vorlage „Infobox Protein“ nicht gemacht wurde. Aber ich habe auch mal gedacht, dass jeder Parameter nur in einem Abschnitt wirkt.
Im Allgemeinen habe ich die ›optischen Argumente‹ in der Infobox den Argumenten (den Werten der Parameter) in der Vorlage-Einbindung gegenüber gestellt und diese bei ausreichender Ähnlichkeit „gematcht“. Dadurch konnten auch der jeweils passende Parameter und der entsprechende ›optische Parameter‹ gefunden werden:
Parameter ← Parameter-Wert ≈ ›optisches Argument‹ → ›optischer Parameter‹
Da Überschriften augenscheinlich jeweils von mehreren Parametern abhingen, aber nicht von den konkreten Parameter-Werten, wurde mit einer visuellen Zuordnung der Anzeige-Elemente, der ›optischen Parameter‹ eines Abschnitts zur entsprechenden Überschrift begonnen:
›optischer Parameter‹ ↔ Überschrift
Beim Parameter HGNCid war es anders. Es blieb ein Element übrig, das erst einmal nicht zugeordnet werden konnte: ein Anzeige-Element, die Überschrift „Eigenschaften des menschlichen Proteins“. Unterhalb dieser Überschrift gab es zwar ›optische Parameter‹, die eine Überschrift namens „Eigenschaften des Proteins“ plausibel gemacht hätten, andererseits standen in der Infobox auch an anderer Stelle solche Eigenschaften.
Es ging also speziell um ein Protein, eines, das nur beim Menschen vorkommt und außerdem trat die Überschrift nicht immer auf. Es musste also irgendwo einen Parameter geben, dessen Anwesenheit die Überschrift bedingt. Im betreffenden Abschnitt hatte ich aber keinen passenden ›optischer Parameter‹ gefunden. Daher nahm ich an, dass dieser „vorausgesagte Parameter“ vom Typ Boolean wäre (also Ja / Nein) und kein ›optisches Argument‹ im Schlepptau hätte, sondern nur die bedingte Überschrift: wenn Ja, dann gäbe es die Überschrift und wenn Nein, dann nicht.
Die Suche nach der Zeichenkette „Eigenschaften des menschlichen Proteins“ im Programm-Code zeigte dann den Parameter "HGNCid" als Verursacher an:
|-
{{#if:{{{HGNCid|}}}|
! colspan="3" style="background:#90EE90;" {{!}} Eigenschaften des menschlichen Proteins
}}
|-
Das bedeutet etwa Folgendes:
- Schreibe einen Zeilenumbruch (
|-
). - Starte ein Anfrage, ob (
{{#if:
) "HGNCid" irgendeinen Parameter-Wert hat ({{{HGNCid|}}}
); wenn ja, dann (|
), - lege eine Tabellenzelle an (
!
), die sich über drei Spalten erstreckt (colspan="3"
) und einen grünen Hintergrund hat (style="background:#90EE90;"
) und schreibe in diese Zeile ({{!}}
) einen Text (Eigenschaften des menschlichen Proteins
). - Schließe die Anfrage ab (
}}
). - Schreibe einen Zeilenumbruch (
|-
).
Also alles wie gedacht: der Parameter "HGNCid" wirkt quasi wie eine boolsche Variable, also eine, die zwei Werte – Ja oder Nein – annehmen kann, nur, dass hier nicht der Wert selbst, sondern die Anwesenheit eines Parameters entscheidet. Hat "HGNCid" irgendeinen Parameter-Wert, dann wird eine Überschrift geschrieben und wenn kein Wert vorhanden ist (abwesender oder leerer Parameter), dann wird auch keine Überschrift eingefügt.
Merkwürdig blieb allerdings, dass die Dokumentation im Abschnitt „Parameter-Details“ beim Parameter "HGNCid" (oldid=175729659#Parameter-Details) in der Tabellenspalte „Möglicher Wert“ als Beispiel 399
angab, statt "Ja/ Nein" oder etwas ähnliches. Über eine bedingte Überschrift stand nichts in der Tabellenzeile zu "HGNCid" im Abschnitt „Parameter-Details“. Stattdessen wurde für den Parameter "HGNCid" erklärt, dass dieser eine externe Verknüpfung zu einer Datenbank herstellen würde. Für diese Datenbank, HUGO Gene Nomenclature Committee, wurde eine Verknüpfung zu einem Wikipedia-Artikel angegeben („HGNC“), den es allerdings nicht (mehr) gab/ gibt.
Ich testete den Parameter einzeln: abwesend, leer (|HGNCid=
), mit dem Beispiel-Wert (|HGNCid=399
) und mit einem sinnlosen Wert (|HGNCid=ß
).
Es blieb dabei: kein Parameter-Wert bedeutete keine Überschrift und irgendein Parameter-Wert für HGNCid
bedeutete, dass die Überschrift „Eigenschaften des menschlichen Proteins“ in der Infobox auftrat; sonst machte der Parameter nichts weiter.
Ich mutmaßte, dass das widersprüchliche Verhalten des Programm-Codes in Bezug zur Dokumentation der Vorlage „Infobox Protein“ (Programm-Code: oldid=183851377; Doku: oldid=175729659) darauf zurückzuführen sei, dass übersehen wurde, die Dokumentation anzupassen, nach dem der Code überarbeitet wurde.
Ich weis nicht mehr genau, wie ich zuerst erkannt habe, dass HGNCid
in Bezug zum Parameter Symbol
stand, wahrscheinlich in Zusammenhang mit der späten „Entdeckung“ des Parameters AltSymbols
, der ebenfalls mit Symbol
zusammenwirkt. (AltSymbols
wurde nur im Programm-Code gefunden, da der Parameter-Name in der Dokumentation in einer ungültigen Schreibweise, „AltSymbol“, stand.) Wenn man bei der Betrachtung einzelner Parameter von AltSymbols
ausgeht, erkennt man unschwer, dass der Parameter Symbol
dazu gehört. Das ergibt sich aus dem Namen selbst und dadurch, dass es dann nahe liegt, die Dokumentations-Angaben zu der anderen Schreibweise („AltSymbol“) und zum Parameter Symbol
als zutreffend zu betrachten.
Wenn man einen Parameter einzeln testet, kann man nicht erkennen, welche anderen Parameter diesen Parameter beeinflussen; daher muss man diesen Parameter, beispielsweise Symbol
, mit allen in Frage kommenden anderen Parametern zusammen testen. Wenn man Symbol
in einem Test zusammen mit sehr vielen anderen Parametern – unter anderem HGNCid
– anwendet, erkennt man nicht ohne Weiteres, dass der Parameter-Wert von HGNCid
das ›optische Argument‹ von Symbol
modifiziert. Die Wirkung ist sehr versteckt, da HGNCid
sich nur auf ein Verknüpfungsziel auswirkt. Man erkennt das letztlich mit meinen Mitteln nur, indem man den entsprechenden Link anklickt und im URL den Parameter-Wert von HGNCid
erkennt, im verwendeten Beispiel die Zahl 399
: "https://www.genenames.org/tools/search/#!/all?query=399".
Nachdem nun klar war, dass Symbol
, AltSymbols
und HGNCid
eine Funktionseinheit bildeten, habe ich eine systematische Testserie durchgeführt. Die Untersuchung war ähnlich angelegt, wie eine vorausgegangene mit zwei anderen Parametern ("EC-Nummer" und "Kategorie") und drei Zuständen (Abwesend, Leer, Befüllt).
Eine Anwendung von drei Zuständen auf drei Parameter hätte wohl 27 Infoboxen ergeben (33 = 27
). Um die Zahl geringer zu halten, habe ich nur zwei Zustände einbezogen – "Abwesend" und "Befüllt". Das würde nur 23 = 8
Kombinationen ergeben und zusätzlich habe ich die Kombination „Alle Parameter abwesend“ weg gelassen – also waren es sieben Kombinationen (23−1 = 7
). Für die Zuordnung der genauen Abhängigkeiten habe ich jeden Parameter nummeriert (Symbol: 1, AltSymbols: 2 und HGNCid: 3) und mit der jeweils anderen Nummer kombiniert. Die Nummern entsprechen dem Zustand "Befüllt" und das Weglassen der Nummer dem Zustand "Abwesend", so dass sich sieben Kombinationen mit entsprechenden „Namen“ für die Vorlage-Einbindungen und die Infoboxen ergaben (1, 2, 3, 1+2, 1+3, 2+3 und 1+2+3).
Für die Kenntnis über das Verhalten des Parameters UniProt
habe ich keine vollständige Analyse angewendet, sondern „herum probiert“. Die potentiellen Kandidaten für einen Zusammenhang zu "UniProt" wurden nacheinander in einer Vorlagen-Einbindung ausgetauscht, um dann das jeweilige Ergebnis – die Tabelle, welche die „Infobox Protein“ darstellt – zu betrachten.
Trotz der komplexen Zusammenhänge habe ich versucht, möglichst alle ›konstanten, atomaren Zeichenketten‹ (also die allgemeinen Eingabe- und Anzeige-Elemente), die mit der „Infobox Protein“ im Zusammenhang stehen, in einer Tabelle aufzulisten.
Einschub – „Konstante, atomare Zeichenketten“ ↙↙ |
Weitere Gedanken zu den Untersuchungen
Versionskontrolle
Wenn irgendwo Software weiterentwickelt wird, dann gibt es häufig Betaversionen, die man irgendwo testen kann, wo es nicht weh tut, wenn man sich dafür interessiert. Auch bei den stabilen Versionen ist es meist so, dass man sich gegen die allerneuste Version entscheiden kann, wenn man etwas mit einer älteren begonnen hat. Bei größeren Veränderungen wird versucht das Alte und das Neue parallel existieren zu lassen. Beispielsweise ließen sich die alten *.doc-Dateien durch die Word-Anwendungen von Microsoft weiter nutzen, nachdem die *.docx-Dateien dazu kamen.
Bei hochdynamischen Sachen – z. B. automatischen Updates – ist das anders, da „wird gegessen, was auf den Tisch kommt“. Die meisten Hersteller bemühen sich darum, dass die Änderungen kaum das Arbeitsergebnis des Anwenders betreffen.
In der Wikipedia ist das Arbeitsergebnis in vielen Fällen eine Artikel-Version, die in der Normalansicht einen Enzyklopädie-Eintrag darstellt. Der größte Teil des zugrunde liegenden Textes ist Wikitext, der nach festen Regeln funktioniert: wenn ich heute »''kursiv'' und '''fett'''«
reinschreibe, dann wird das auch morgen »kursiv und fett« angezeigt.
In vielen Artikeln besteht ein nicht unerheblicher Teil des Wikitextes aus der Einbindung von Vorlagen – aus komplexen Anweisungen, die den Wikitext zu etwas anderem machen, als einer reinen Auszeichnungssprache. Eine Artikelschreiberin muss dadurch nicht bloß den überschaubaren Wikicode-Regeln lernen (H:Wikisyntax), sondern auch die „Parameter-Nutzungs-Codes“ der jeweiligen Vorlagen – mehr noch – auch die zur jeweiligen Zeit aktuellen Gegebenheiten der jeweiligen Vorlage (und ein Artikelschreiber muss das auch).
Ganz so schlimm, wie in dem vorausgehenden Satz dargestellt, ist es nicht, da sich die Vorlagen nicht jeden Tag ändern. Außerdem werden einige Vorlagen-Einbindungen auch „betreut“: der VE (VisualEditor: WP:VE, H:VE) macht aus Parametern und Werten Felder und speziell durch das Feature “ Belegen
wird die Verwaltung der komplexen <ref...>{{...}}</ref>
-Anweisungen beim Schreiben handhabbar.
Dennoch halte ich es gegenwärtig – aus Gründen der zeitlichen Stabilität – für problematisch, Vorlagen zu verbessern, da der Name der Vorgängerversion beibehalten wird. Wenn jemand eine Vorlage in einem Artikel einbindet, dann optimiert er dies auf die Normalansicht des Artikels zur Zeit der Einbindung. Verbessert jemand danach die Vorlage, kann sie/ er den/ die Artikel zwar anpassen, die Vorgängerversion des Artikels wird aber vermutlich suboptimal bis falsch angezeigt:
Programm-Version | Version der Einbindung | Anzeige-Ergebnis im Artikel |
---|---|---|
Alt | Alt | Gut. Eine bestehende Vorlage (Programm-Version: Alt) wurde so in einem Artikel eingebunden (Version der Einbindung: Alt), dass in diesem Artikel in der Normalansicht alles einigermaßen passt (Artikel-Version: Alt). |
Neu | Alt | Schlecht. Der neue Vorlage-Programm-Code (Programm-Version: Neu) passt nicht gut zum alten Wikitext im Artikel (Version der Einbindung: Alt). |
Neu | Neu | Sehr gut. Der Artikel wurde angepasst. Der Wikitext im Artikel, welcher die Einbindung der Vorlage gewährleistet (Version der Einbindung: Neu), setzt nun den zuvor veränderten Programm-Code (Programm-Version: Neu) um. |
Man mag jetzt sagen, dass die Übergänge, in denen der alte Vorlage-Einbindungs-Code mit dem neuen Vorlage-Programm-Code nicht gut zusammenarbeitet, nur drei Minuten dauert; aber es gibt nicht selten mehr als einen Artikel, in dem die jeweilige Vorlage eingebunden wurde. Um ein Beispiel zu nennen, wurden für die Vorlage „Infobox Protein“ am 4. Juli 2020 1679 Artikel gefunden, in denen diese Vorlage eingebunden war. Ein Artikel hatte sechs Einbindungen (Signalerkennungspartikel), ein anderer Artikel hatte fünf Einbindungen (Pertussis-Toxin), kein Artikel hatte vier Einbindungen, 11 Artikel hatten drei Einbindungen (z. B. Endothelin), 43 Artikel (43=56-13) hatten zwei Einbindungen und 1679-43-11-0-1-1 Artikel hatten genau eine Einbindung.
Weiterhin ist es so, dass man in älteren Artikelversionen teilweise nicht mehr erkennen kann, was damals eigentlich gewollt wurde, da viele Vorlagen geändert worden, die ihrerseits auf Vorlagen zurückgreifen, die geändert oder gelöscht worden sind.
Wenn man sich mit den Zusammenhängen zwischen den Parametern einer einzelnen Vorlage auseinander gesetzt hat, dann kann es sein, dass die gewonnenen Erkenntnisse durch die Verbesserungen einer Vorlage mit der Zeit obsolet werden. Es ist auch schwierig, eine bestimmte Version der Dokumentation einer Vorlage der jeweiligen Version des Programm-Codes der Vorlage zuzuordnen, da diese beiden Sachen zumeist – wie sich das gehört – an verschiedenen Stellen untergebracht sind.
Unter #Es gibt zahlreiche historisch gewachsene Altlasten steht zwar :
- „...Namen von Vorlagen oder deren Parametern können praktisch nicht mehr geändert werden...“.
Ich denke aber, dass die Namen von Parametern durchaus geändert werden könnten, wenn nicht die alten Vorlagen geändert, sondern neue Vorlagen erstellt werden würden, die etwas anders heißen. Es wird immer so sein, dass eine Maßnahme von heute die Altlast von morgen sein wird. (-; Und glaubt mir, morgen kommt ganz schnell... ;-)
Ich denke, wir sollten dem Alten das Neue hinzu gesellen, statt es radikal zu ersetzen. Es gibt immer Übergangszeiten, die man möglichst smart überbrücken muss.
- Kleiner Vergleich aus der Biologie: Manch ein Krebs wirft seine alte, schützende Hülle zwar weg, wenn er eine größere braucht, er hat dann aber unter der alten Hülle schon was „vorbereitet“. Die Übergangszeit als weicher, angreifbarer „Butterkrebs“ ist dadurch überschaubar und der Krebs kann sich zurückziehen, solange bis seine neue Hülle ausgehärtet ist.
Die Wikipedia ist immer online, deshalb ist Zurückziehen, solange eine Vorlage überarbeitet wird, keine Option. Die alte Version muss weiter Dienst tun. Würde man eine Vorlage zur weiteren Optimierung außerhalb der „Produktiv-Umgebung“ überarbeiten und dann dort testen wollen, könnte man sie zwar wieder mit dem gleichen Namen in die „Produktiv-Umgebung“ zurück bringen, wenn das Ziel erreicht wäre, die bereits genannten Nachteile blieben aber.
Ein Kompromiss wäre, dass man eine z. B. hinsichtlich der VE-Kompatibilität anzupassende Vorlage anders nennt, als das möglicherweise in einigen Punkten leistungsfähigere Vorbild.
So könnte der „Vorlage:Infobox Protein“ eine neue „Vorlage:VE Infobox Protein“ (der Name ist nur ein Beispiel) zur Seite gestellt werden, wobei letztlich beide Vorlagen ungefähr das gleiche machen, nämlich eine Infobox für die Eigenschaften eines Proteins zur Verfügung zu stellen. Der Unterschied wäre nur, dass die bewährte „Vorlage:Infobox Protein“ es einem Kompaktcodeprofi einfacher macht, damit direkt den prägnanten Quelltext zu lesen, während ein Liebhaber der Normalansicht wohl eher die umständliche, VE-angepasste „Vorlage:VE Infobox Protein“ nehmen würde, in der wohl jedes Anzeige-Element der resultierenden Infobox einzeln durch ein Eingabe-Element in Vorlage (Parameter+Wert) unterlegt sein müsste.
Unter Wikipedia:Technische Wünsche → Topwünsche → Leichter mit Vorlagen arbeiten → Häufigst genannte Probleme → #Es gibt zahlreiche historisch gewachsene Altlasten steht:
- „...Namen von Vorlagen oder deren Parametern können praktisch nicht mehr geändert werden...“.
Es ist auch schwierig, einen Optimierungs-Gedanken an die Community heranzutragen, wenn sich die Gegebenheiten, auf die sich die Ausführungen beziehen, zwischenzeitlich geändert haben.
Anhang des Beitrags
Überschriften, Abschnitte und die Blöcke A bis H
Eine Anwendung der „Infobox Protein“ (Version von Vorlage:Infobox_Protein: oldid=183851377) kann acht Bereiche enthalten, die ich ›Blöcke‹ genannt habe und die zumeist in etwa Abschnitten entsprechen.
Blöcke A bis H | Mögliche Überschriften | Angenommene Funktion | A bis H↔ |
---|---|---|---|
Block A | Entspricht zumeist dem Wert des Parameters "Name" | Titel der jeweiligen Infobox Protein und Einleitung. | A↔ |
Block B | Keine Überschrift oder „Eigenschaften des menschlichen Proteins“ | Fortsetzung der Einleitung durch weitere Eigenschaften oder neuer Abschnitt mit speziellen Eigenschaften, nämlich denen der menschlichen Protein-Variante. | B↔ |
Block C | „Bezeichner“ | Aufzählung von Symbolen und Identifikationsnummern mit ihren Fundorten in externen Datenbanken. | C↔ |
Block D | „Arzneistoffangaben“ | Angaben zum Protein, wenn es ein Arzneistoff ist. | D↔ |
Block E | „Transporter-Klassifikation“ | Angaben zum Protein, wenn es ein Membranprotein mit Transportfunktion ist. | E↔ |
Block F | „Enzymklassifikation“ oder „Enzymklassifikationen“ oder „Inhibitorklassifikation“ | Angaben zum Protein, wenn es ein Enzym ist. | F↔ |
Block G | „Vorkommen“ | Angaben zum Vorkommen und Fehlen des Proteins in Lebewesen. | G↔ |
Block H | „Orthologe“ | Angaben zu sogenannten orthologen Proteinen, d. h. verwandten Gen- bzw. Proteinvarianten in verschiedenen Lebewesen als Tabelle. | H↔ |
Kommentiertes Code-Segment
Code-Ausschnitt der Vorlage:Infobox_Protein (oldid=183851377), welcher sich mit dem Teil der Infobox beschäftigt, in dem die Parameter EC-Nummer und Kategorie zur Anwendung kommen.
Code | Beschreibung |
... | Der vorausgehende Code kümmert sich nicht um die Parameter "EC-Nummer" und/ oder "Kategorie" und wird deshalb ausgelassen. |
|- | Zeilenumbruch für die Wikitext-Tabelle. |
{{#if: {{{EC-Nummer|}}}{{{Kategorie|}}} {{{Peptidase_fam|}}}{{{Inhibitor_fam|}}} {{{Reaktionsart|}}}{{{Substrat|}}}{{{Produkte|}}} {{{MoreEC1|}}}{{{MoreEC2|}}}{{{MoreEC3|}}} | |
Prüfung der aufgeführten Parameter. Wenn mindestens einer dieser Parameter auftritt, dann ... |
! colspan="3" style="background:#90EE90;" {{!}} {{#if: {{{Inhibitor_fam|}}}|Inhibitorklassifikation| {{#if: {{{MoreEC1|}}}{{{MoreEC2|}}} {{{MoreEC3|}}}|Enzymklassifikationen|Enzymklassifikation}}}} |
... werden die Formatierungsangaben der Tabellenzelle geschrieben; es wird auf Inhibitor_fam geprüft und gegebenfalls „Inhibitorklassifikation“ eingetragen. Ansonsten wird noch ausgewertet, ob MoreEC1 bis 3 auftreten und wenn das so ist, wird „Enzymklassifikationen“ eingetragen. Wenn weder Inhibitor_fam, noch MoreEC1 bis 3 auftreten, wird „Enzymklassifikation“ eingetragen. |
{{!}}- | Zeilenumbruch für die Wikitext-Tabelle. |
Nachdem diese Überschriftenzeile der Infobox geschrieben wurde, werden die beiden Parameter EC-Nummer und Kategorie ausgewertet. Zutreffende Code-Segmente werden in runden Klammern angegeben: | |
{{#if: {{{EC-Nummer|}}}{{{Kategorie|}}}| | Wenn ({{#if:) mindestens einer der beiden Parameter auftritt ({{{EC-Nummer|}}}{{{Kategorie|}}}), dann (|) ... |
{{!}} [[EC-Nummer|EC, Kategorie]] | ... wird eine neue Tabellenzelle eröffnet ({{!}}) und ein Verknüpfungstext geschrieben ([[EC-Nummer|EC, Kategorie]]), der „EC, Kategorie“ lautet und den Artikel EC-Nummer als Linkziel hat. Die Tabellenzelle ist die erste einer Zeile, da bereits eine Zeilenumbruch geschrieben wurde (siehe weiter oben). |
{{!}} colspan="2" style="text-align:center;" {{!}} {{#if:{{{EC-Nummer|}}}|<span class="plainlinks">[https://www.brenda-enzymes.org/php/result_flat.php4?ecno={{{EC-Nummer}}} {{{EC-Nummer}}}]</span>}}{{#if: {{{Kategorie|}}}|, [[{{{Kategorie}}}]]}} }} | Es wird eine zweite Tabellenzelle eröffnet ({{!}}), die ein Verbund von zwei Zellen werden soll (colspan="2") und deren Text zentriert werden soll (style="text-align:center;"). Diesen Formatierungsanweisungen soll der eigentliche Text folgen ({{!}}), dessen Inhalt an Bedingungen geknüpft wird ({{#if:...}}). Und zwar soll beim Auftreten von EC-Nummer ({{{EC-Nummer|}}}|) ein formatierter (<span ...>...</span>), externer Link ([https://...]) geschrieben werden, der einen allgemeinen (www.brenda-enzymes.org/php/result_flat.php4?ecno=) und einen speziellen Teil ({{{EC-Nummer}}}) beinhaltet. Dieser spezielle Teil entpricht, wie auch der Verknüpfungstext ({{{EC-Nummer}}}), der EC-Nummer. Die Verknüpfung wird wie eine interne Wikipedia-Verknüpfung formatiert (class=“plainlinks“) und nicht wie eine externe Verknüpfung, die sie eigentlich ist. Falls der Parameter Kategorie auftritt ({{#if: {{{Kategorie|}}}|), werden ein Komma und ein geschütztes Leerzeichen angehängt (, ) und es folgt die Wikipedia-intern verknüpfte „Kategorie“-Angabe ([[{{{Kategorie}}}]]). |
{{!}}- | Umbruch der Tabellenzeile |
... | Es folgt weiterer Code, der die beiden Parameter "EC-Nummer" und "Kategorie" nicht unmittelbar einbezieht. |
Beispiele für die Umsetzung des EC-Nummern-Systems
Unter BRENDA wurde ein Schema gefunden (2019-11), das – wenn man einige graphische Elemente weg lässt – in etwa so aussah, wie rechts dargestellt. |
| ||||||||||||||||||||
Unter MetaCyc wurde eine Zeichenkette gefunden (2019-11), die die Hierarchieverhältnisse versinnbildlicht, wie rechts dargestellt. | Parent class: EC-Numbers → 2 -- Transferases → 2.1 -- Transferring one-carbon groups → 2.1.1 -- Methyltransferases |
Doppel-Parameter schematisch
Allgemeine Form | Konkretes Beispiel | ||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
|
Beispiele – Sichtweisen zu Hierarchie-Ebenen von Kategorie und EC-Nummer
Die Beispiele 1.a), 1.b) und 1.c) wurden im Zeitraum der Gültigkeit der Referenzversionen geprüft (siehe #Die Referenzversionen im Einzelnen) und die Beispiele 2.a) sowie 2.b) wurden später gefunden. Zwischen 1. [ 1.a), … ] und 2. [ 2.a), … ] traten zwar Änderungen am Programmcode der Vorlage auf (Vorlage:Infobox_Protein, Referenzversion vom 19.12.2018 und nächste Version vom 27.12.2019, Versionsvergleich: diff=195259690&oldid=183851377), diese Änderungen betreffen die dargestellten Aspekte der Beispiel-Infoboxen jedoch nicht. Somit sind alle Beispiele vergleichbar.
Hierarchie-Ebene der Kategorie | Beispiele für Infoboxen (schematisch)
oldid= Artikelversion | |||||||
---|---|---|---|---|---|---|---|---|
1. Übergeordnete Ebene
Wenn die Kategorie als übergeordnete Ebene betrachtet wird, dann gehört die angegebene EC-Nummer in diese Kategorie (›Gehört-in‹-Sichtweise).
|
1.a) |
oldid=170072500 (17.10.2017) | ||||||
1.b) |
oldid=192342265 (17.9.2019) | |||||||
1.c) |
oldid=193718634 (3.11.2019) | |||||||
2. Gleiche Ebene
Wenn die Kategorie als ergänzende Benennung zur EC-Nummer betrachtet wird, dann entspricht sie der Nummer und hat die gleiche Hierarchie-Ebene (›Entspricht‹-Sichtweise).
Die ›Entspricht‹-Sichtweise wurde in beiden hier gezeigten Fällen dort verwirklicht, wo der Titel der jeweiligen Infobox jeweils eine Gruppe von Proteinen präsentiert, die keine „Kategorie“ in EC-System ist; also weder eine Klasse, Unterklasse oder Unter-Unterklasse, noch ein Enzym-Eintrag bzw. eine Seriennummer. Die Mitglieder beider Gruppen – sowohl die der DNA-Methyltransferasen als auch die der Glycosidasen – gehören jeweils in genau eine Unter-Unterklasse des EC-Systems. |
2.a) |
oldid=197225232 (27.2.2020) | ||||||
2.b) |
oldid=196940224 (18.2.2020) | |||||||
3. Untergeordnete Ebene
In diesem Fall wäre "Kategorie" ein einzelnes Beispiel innerhalb der Gruppe von Proteinen, die durch die EC-Nummer präsentiert wird, sozusagen eine Unterkategorie. Das ist vermutlich die unwahrscheinlichste Sichtweise, die eine Leserin oder ein Leser auf die Kategorie haben kann. Daher habe ich dazu kein Beispiel gefunden. |
Die Referenzversionen im Einzelnen
Die folgenden Tabellen stellen die relevanten Versionen in Bezug zur Referenzzeit bzw. zum Stichtag zusammen; die Referenzversionen enthalten:
- aus dem Artikel-Namensraum
- den Beispiel-Artikel (DNA-Methyltransferasen) und
- aus dem Vorlagen-Namensraum
- die Vorlage, um die hier geht (Vorlage:Infobox Protein),
- die Unter-Vorlagen (Vorlage:Infobox Protein/MoreEC und Vorlage:Protein Orthologe) sowie
- die separaten Dokumentationen der Vorlagen (Vorlage:Infobox Protein/Doku und Vorlage:Protein Orthologe/Doku).
Name – Vorlage und Artikel | Vorlagen-Einbindung wie am Stichtag (29. Sep. 2019) | Gültigkeit "bis" und Nachfolge-Version der Vorlage-Einbindung | Aktueller Link |
---|---|---|---|
Vorlage-Einbindung der „Infobox Protein“ im Artikel „DNA-Methyltransferasen“ | ab 15. April 2019, oldid=187579075 – Artikel-Version gültig am Stichtag zur Referenzzeit;
es gibt weitere Artikel-Versionen mit derselben Vorlage-Einbindung – späteste am 3. Nov. 2019, oldid=193718634 |
bis 27. Februar 2020, ab da oldid=197225232 – Artikel-Version mit einer geänderten Vorlage-Einbindung | DNA-Methyltransferasen |
Name – Vorlage oder Dokumentation | Gültigkeit "ab", Version am Stichtag (29. Sep. 2019) | Gültigkeit "bis" und Nachfolge-Version | Aktueller Link |
---|---|---|---|
Infobox Protein | ab 19. Dez. 2018, oldid=183851377 | bis 27. Dez. 2019, ab da oldid=195259690 | Vorlage:Infobox Protein |
Infobox Protein/Doku | ab 3. April 2018, oldid=175729659 | bis 27. Dez. 2019, ab da oldid=195259871 | Vorlage:Infobox Protein/Doku |
Infobox Protein/MoreEC | ab 13. Sep. 2013, oldid=122513315 | später als 29. April 2020 | Vorlage:Infobox Protein/MoreEC |
Protein Orthologe | ab 1. Mai 2018, oldid=177045241 | bis 16. März 2020, ab da oldid=197818503 | Vorlage:Protein Orthologe |
Protein Orthologe/Doku | ab 7. Mai 2017, oldid=165298437 | später als 29. April 2020 | Vorlage:Protein Orthologe/Doku |
Die Bereiche im Programm-Code der Vorlage
Rechts: Code-Auschnitte aus der Vorlage „Infobox Protein“.
Vorlage:Infobox_Protein, Version: https://de.wikipedia.org/w/index.php?oldid=183851377; gültig zwischen 19. Dez. 2018 und 27. Dez. 2019, also auch zur Referenzzeit (Stichtag 29. Sep. 2019). |
... ausgelassener Text ...
... ausgelassener Text ...
|
Parameter-Namen an unterschiedlichen Stellen
Überblick zum Aufbau der Tabelle:
- In der Tabelle werden alle 44 in der Vorlage „Infobox Protein“ gefundenen Parameter-Bezeichnungen (Programmcode oldid=183851377, Dokumentation oldid=175729659) alphabetisch sortiert dargestellt (Spalte Namen) und sind mit einem Index versehen (Spalte Idx, 1 bis 44).
- Das jeweilige Vorkommen von Namen wird in den verschiedenen Abschnitten der Dokumentation (Spalten Kv, Vp und Pd; ) und in den verschiedenen Bereichen des Programmcodes (Spalten Pa und Pw) der Vorlage angegeben.
- Dazu steht im jeweiligen Spaltenkopf die Anzahl der im zugeordneten Abschnitt bzw. Bereich gefundenen Namen und in den einzelnen Zellen steht ein Index, der auf dem ersten Vorkommen des jeweiligen Namens im jeweiligen Abschnitt oder Bereich basiert. Eine solche Reihenfolge wird als Index-Zahl größer null (>0) angegeben; beim Fehlen eines Namens ersetzt eine rot markierte Zahl Null (0) diesen Index.
- Die Parameternamen werden hinsichtlich ihrer Gültigkeit und ihres Vorkommens bewertet (Spalte Q) und es wird jeweils auf zutreffende Abschnitte in der Infobox verwiesen (Spalte Blöcke).
Tabelle:
Parameter-Namen an unterschiedlichen Stellen | ||||||||
Idx – Index, alphabetische Sortierung der Parameternamen (44 Namen) | ||||||||
Namen – Alle gültigen und ungültigen Parameternamen (44 Namen) | ||||||||
Kv – Abschnitt "Kopiervorlage" (41 Namen) | ||||||||
Vp – Abschnitt "Vorlagenparameter" (43 Namen) | ||||||||
Pd – Abschnitt "Parameter-Details" (43 Namen) | ||||||||
Pa – Programmablauf (43 Namen) | ||||||||
Pw – Parameterwartung (41 Namen) | ||||||||
Q – Qualität, eindeutig (1), fraglich (0,5), ungültig (0) | ||||||||
Idx | Namen | Kv | Vp | Pd | Pa | Pw | Q | Blöcke – Wirkung in den Blöcken A bis H |
1 | AltSymbol | 0 | 0 | 15 | 0 | 0 | 0 | Wäre Block C (C↔) |
2 | AltSymbols | 13 | 15 | 0 | 15 | 13 | 0,5 | Block C (C↔) |
3 | Andere Namen | 4 | 6 | 6 | 6 | 4 | 1 | Block A (A↔) |
4 | ATC-Code | 21 | 23 | 21 | 23 | 21 | 1 | Block D (D↔) |
5 | Bild | 2 | 2 | 2 | 2 | 2 | 1 | Block A (A↔) |
6 | Bild_legende | 3 | 3 | 3 | 4 | 3 | 1 | Block A (A↔) |
7 | Bild_legende2 | 0 | 5 | 5 | 5 | 0 | 0 | Wäre Block A (A↔) |
8 | Bild2 | 0 | 4 | 4 | 3 | 0 | 0 | Wäre Block A (A↔) |
9 | CAS | 19 | 21 | 22 | 17 | 19 | 1 | Block C (C↔) |
10 | CASergänzend | 20 | 22 | 23 | 22 | 20 | 1 | Block C (C↔) |
11 | CID | 18 | 20 | 20 | 21 | 18 | 1 | Block C (C↔) |
12 | DrugBank | 22 | 24 | 24 | 24 | 22 | 1 | Block D (D↔) |
13 | EC-Nummer | 26 | 28 | 26 | 28 | 26 | 1 | Block F (F↔) |
14 | GeneCards | 14 | 16 | 16 | 20 | 14 | 1 | Block C (C↔) |
15 | Groesse | 6 | 8 | 8 | 9 | 6 | 1 | Block B (B↔) |
16 | HGNCid | 11 | 13 | 14 | 8 | 11 | 1 | Blöcke A (A↔), B (B↔) und C (C↔) |
17 | Homolog_db | 36 | 38 | 38 | 41 | 36 | 1 | Block G (G↔) |
18 | Homolog_fam | 37 | 39 | 39 | 40 | 37 | 1 | Block G (G↔) |
19 | Homolog_url | 38 | 40 | 40 | 42 | 38 | 1 | Block G (G↔) |
20 | Inhibitor_fam | 29 | 31 | 29 | 31 | 32 | 1 | Block F (F↔) |
21 | Isoformen | 10 | 12 | 12 | 13 | 10 | 1 | Block B (B↔) |
22 | Kategorie | 27 | 29 | 27 | 29 | 30 | 1 | Block F (F↔) |
23 | Kofaktor | 7 | 9 | 10 | 11 | 7 | 1 | Block B (B↔) |
24 | MGIid | 17 | 19 | 19 | 19 | 17 | 1 | Block C (C↔) |
25 | MoreEC1 | 33 | 35 | 33 | 35 | 27 | 1 | Block F (F↔) |
26 | MoreEC2 | 34 | 36 | 34 | 36 | 28 | 1 | Block F (F↔) |
27 | MoreEC3 | 35 | 37 | 35 | 37 | 29 | 1 | Block F (F↔) |
28 | Name | 1 | 1 | 1 | 1 | 1 | 1 | Block A (A↔) |
29 | OMIM | 15 | 17 | 17 | 18 | 15 | 1 | Block C (C↔) |
30 | Orthologe | 41 | 43 | 43 | 43 | 41 | 1 | Block H (H↔) |
31 | PDB | 5 | 7 | 7 | 7 | 5 | 1 | Block A (A↔) |
32 | Peptidase_fam | 28 | 30 | 28 | 30 | 31 | 1 | Block F (F↔) |
33 | Precursor | 8 | 10 | 11 | 12 | 8 | 1 | Block B (B↔) |
34 | Produkte | 32 | 34 | 32 | 34 | 35 | 1 | Block F (F↔) |
35 | Reaktionsart | 30 | 32 | 30 | 32 | 33 | 1 | Block F (F↔) |
36 | Struktur | 9 | 11 | 9 | 10 | 9 | 1 | Block B (B↔) |
37 | Substrat | 31 | 33 | 31 | 33 | 34 | 1 | Block F (F↔) |
38 | Symbol | 12 | 14 | 13 | 14 | 12 | 1 | Block C (C↔) |
39 | Taxon | 39 | 41 | 41 | 38 | 39 | 1 | Block G (G↔) |
40 | Taxon_Ausnahme | 40 | 42 | 42 | 39 | 40 | 1 | Block G (G↔) |
41 | TCDB | 24 | 26 | 36 | 26 | 24 | 1 | Block E (E↔) |
42 | TranspText | 25 | 27 | 37 | 27 | 25 | 1 | Block E (E↔) |
43 | UniProt | 16 | 18 | 18 | 16 | 16 | 1 | Blöcke C (C↔) und G (G↔) |
44 | Wirkstoffklasse | 23 | 25 | 25 | 25 | 23 | 1 | Block D (D↔) |
Legende zur Tabelle:
Hervorhebungen:
- Fett im Tabellenkopf – Abkürzung, Spaltenname
- Hellgrau unterlegte Zellen – Besonderheit: ungültiger Name oder Verwechslungsgefahr oder Zuordnung eines Parameters zu mehreren Blöcken
- Roter Parameter-Name – ungültiger Name
- Rote Null (0) – fehlender Index (abwesende Parameter-Bezeichnung im jeweiligen Abschnitt/ Bereich, Spalte Kv, Vp, Pd, Pa oder Pw) bzw. ungültiger Namen (Spalte Q).
Tabellenspalten:
- Idx – Index, alphabetische Sortierung der Parameter-Namen
- Index für 44 alphabetisch sortierte Bezeichnungen (Namen), die sich in der Vorlage Infobox Protein auf Parameternamen beziehen.
- Namen – Alle gültigen und ungültigen Parameternamen (44 Namen)
- Alle Bezeichnungen, die in der Dokumentation und im Programmcode als Parameternamen auftauchen (Referenz-Versionen).
- Kv – Abschnitt "Kopiervorlage" (41 Namen)
- Enthält alle gültigen Namen (41) für die Parameter und keine ungültigen Namen – ähnlich wie Pw.
- Vp – Abschnitt "Vorlagenparameter" (43 Namen)
- Enthält alle 41 gültigen Namen sowie zwei ungültige (Bild2 und Bild_legende2) – ähnlich wie Pa.
- Pd – Abschnitt "Parameter-Details" (43 Namen)
- Enthält 40 von 41 gültigen Namen, eine unkorrekte Schreibweise ("AltSymbol" statt AltSymbols) und zwei weitere ungültige Namen (Bild2 und Bild_legende2).
- Pa – Programmablauf (43 Namen)
- Enthält alle 41 gültigen Namen sowie zwei ungültige (Bild2 und Bild_legende2) – ähnlich wie Vp.
- Pw – Parameterwartung (41 Namen)
- Enthält alle gültigen Namen (41) für die Parameter und keine ungültigen Namen – ähnlich wie Kv.
- Q – Qualität, eindeutig (1), fraglich (0,5), ungültig (0)
- Die „Qualität“ eines Parameter-Namens wird hier jeweils als 1 (100 %) gewertet, wenn er überall gleich lautet und gültig ist, als 0 (0 %), wenn er ungültig ist und in einem Fall (AltSymbols) als 0,5 (50 %, „halbgut“), da der gültige Namen an einer Stelle in der Dokumentation anders geschrieben wurde.
- Blöcke – Wirkung in den Blöcken A bis H
- Für jeden Parameternamen wird seine Zugehörigkeit zu den ›Blöcken‹ angegeben. In den meisten Fällen ist das genau ein ›Block‹ unter den Blöcken A bis H. Bei ungültigen Parameternamen wird der mutmaßliche Block genannt („Wäre ...“). In zwei Fällen sind mehrere Blöcke relevant.
Auswirkungsorte der Parameter
Die meisten der 41 Parameter, die zur Referenzzeit wirksam waren, hatten genau eine Stelle der Auswirkung in der Anzeige einer Infobox (das galt für 39 Parameter). Zwei Parameter hatten mehrere Stellen der Auswirkung; einer hatte zwei Stellen (UniProt) und ein anderer hatte drei Stellen (HGNCid). Es ergaben sich 44 Stellen der Auswirkung. Kein Parameter hatte mehrere Stellen der Auswirkung in ein und demselben Block (Blöcke A bis H).
Die folgende Tabelle enthält die Auswirkungsorte der Parameter
- i — Index; Stelle des Auftretens einer Anzeige innerhalb der Infobox, die auf den jeweiligen Parameter zurückgehen kann. Es wurden 44 Stellen identifiziert, die entsprechend ihres Auftretens von oben nach unten und von links nach rechts sortiert wurden.
- Name des Parameters —
- Der Parameter wirkt an: —
- n — Anzahl der Stellen (maximal drei Stellen), an denen der Parameter wirkt.
- Stellen. —
- Die —
- x-te — erste bis maximal dritte Auswirkung
- Auswirkung des Parameters erfolgt in Block: —
- A bis H —
- Siehe Stelle: — Es folgt die Verknüpfung zur detaillierten Beschreibung des Parameters im jeweiligen Block.
- #PRMA.BL-<A bis H>.<Bezeichnung des Parameters> — Verknüpfung (#) zur Stelle der Parameter-Auswirkung (PRMA) in Block A, B, C, D, E, F, G oder H (.BL-<A bis H>) innerhalb der detaillierten Beschreibung zum Parameter-Namen, welcher durch eine angepasste Bezeichnung angegeben wurde (.<Bezeichnung des Parameters>).
Keine Anker
i | Name des Parameters | Der Parameter wirkt an: | n | Stellen. | Die | x-te | Auswirkung des Parameters erfolgt in Block: | A bis H | Siehe Stelle: | #PRMA.BL-<A bis H>.<Bezeichnung des Parameters> |
---|---|---|---|---|---|---|---|---|---|---|
1 | Name | Der Parameter wirkt an: | 1 | Stellen. | Die | 1. | Auswirkung des Parameters erfolgt in Block: | A | Siehe Stelle: | #PRMA.BL-A.Name |
2 | Bild | Der Parameter wirkt an: | 1 | Stellen. | Die | 1. | Auswirkung des Parameters erfolgt in Block: | A | Siehe Stelle: | #PRMA.BL-A.Bild |
3 | Bild_legende | Der Parameter wirkt an: | 1 | Stellen. | Die | 1. | Auswirkung des Parameters erfolgt in Block: | A | Siehe Stelle: | #PRMA.BL-A.Bildlegende |
4 | Andere Namen | Der Parameter wirkt an: | 1 | Stellen. | Die | 1. | Auswirkung des Parameters erfolgt in Block: | A | Siehe Stelle: | #PRMA.BL-A.AndereNamen |
5 | PDB | Der Parameter wirkt an: | 1 | Stellen. | Die | 1. | Auswirkung des Parameters erfolgt in Block: | A | Siehe Stelle: | #PRMA.BL-A.PDB |
6 | HGNCid | Der Parameter wirkt an: | 3 | Stellen. | Die | 1. | Auswirkung des Parameters erfolgt in Block: | A | Siehe Stelle: | #PRMA.BL-A.HGNCid |
7 | HGNCid | Der Parameter wirkt an: | 3 | Stellen. | Die | 2. | Auswirkung des Parameters erfolgt in Block: | B | Siehe Stelle: | #PRMA.BL-B.HGNCid |
8 | Groesse | Der Parameter wirkt an: | 1 | Stellen. | Die | 1. | Auswirkung des Parameters erfolgt in Block: | B | Siehe Stelle: | #PRMA.BL-B.Groesse |
9 | Struktur | Der Parameter wirkt an: | 1 | Stellen. | Die | 1. | Auswirkung des Parameters erfolgt in Block: | B | Siehe Stelle: | #PRMA.BL-B.Struktur |
10 | Kofaktor | Der Parameter wirkt an: | 1 | Stellen. | Die | 1. | Auswirkung des Parameters erfolgt in Block: | B | Siehe Stelle: | #PRMA.BL-B.Kofaktor |
11 | Precursor | Der Parameter wirkt an: | 1 | Stellen. | Die | 1. | Auswirkung des Parameters erfolgt in Block: | B | Siehe Stelle: | #PRMA.BL-B.Precursor |
12 | Isoformen | Der Parameter wirkt an: | 1 | Stellen. | Die | 1. | Auswirkung des Parameters erfolgt in Block: | B | Siehe Stelle: | #PRMA.BL-B.Isoformen |
13 | Symbol | Der Parameter wirkt an: | 1 | Stellen. | Die | 1. | Auswirkung des Parameters erfolgt in Block: | C | Siehe Stelle: | #PRMA.BL-C.Symbol |
14 | HGNCid | Der Parameter wirkt an: | 3 | Stellen. | Die | 3. | Auswirkung des Parameters erfolgt in Block: | C | Siehe Stelle: | #PRMA.BL-C.HGNCid |
15 | AltSymbols | Der Parameter wirkt an: | 1 | Stellen. | Die | 1. | Auswirkung des Parameters erfolgt in Block: | C | Siehe Stelle: | #PRMA.BL-C.AltSymbols |
16 | GeneCards | Der Parameter wirkt an: | 1 | Stellen. | Die | 1. | Auswirkung des Parameters erfolgt in Block: | C | Siehe Stelle: | #PRMA.BL-C.GeneCards |
17 | OMIM | Der Parameter wirkt an: | 1 | Stellen. | Die | 1. | Auswirkung des Parameters erfolgt in Block: | C | Siehe Stelle: | #PRMA.BL-C.OMIM |
18 | UniProt | Der Parameter wirkt an: | 2 | Stellen. | Die | 1. | Auswirkung des Parameters erfolgt in Block: | C | Siehe Stelle: | #PRMA.BL-C.UniProt |
19 | MGIid | Der Parameter wirkt an: | 1 | Stellen. | Die | 1. | Auswirkung des Parameters erfolgt in Block: | C | Siehe Stelle: | #PRMA.BL-C.MGIid |
20 | CID | Der Parameter wirkt an: | 1 | Stellen. | Die | 1. | Auswirkung des Parameters erfolgt in Block: | C | Siehe Stelle: | #PRMA.BL-C.CID |
21 | CAS | Der Parameter wirkt an: | 1 | Stellen. | Die | 1. | Auswirkung des Parameters erfolgt in Block: | C | Siehe Stelle: | #PRMA.BL-C.CAS |
22 | CASergänzend | Der Parameter wirkt an: | 1 | Stellen. | Die | 1. | Auswirkung des Parameters erfolgt in Block: | C | Siehe Stelle: | #PRMA.BL-C.CASergnzend |
23 | ATC-Code | Der Parameter wirkt an: | 1 | Stellen. | Die | 1. | Auswirkung des Parameters erfolgt in Block: | D | Siehe Stelle: | #PRMA.BL-D.ATCCode |
24 | DrugBank | Der Parameter wirkt an: | 1 | Stellen. | Die | 1. | Auswirkung des Parameters erfolgt in Block: | D | Siehe Stelle: | #PRMA.BL-D.DrugBank |
25 | Wirkstoffklasse | Der Parameter wirkt an: | 1 | Stellen. | Die | 1. | Auswirkung des Parameters erfolgt in Block: | D | Siehe Stelle: | #PRMA.BL-D.Wirkstoffklasse |
26 | TCDB | Der Parameter wirkt an: | 1 | Stellen. | Die | 1. | Auswirkung des Parameters erfolgt in Block: | E | Siehe Stelle: | #PRMA.BL-E.TCDB |
27 | TranspText | Der Parameter wirkt an: | 1 | Stellen. | Die | 1. | Auswirkung des Parameters erfolgt in Block: | E | Siehe Stelle: | #PRMA.BL-E.TranspText |
28 | EC-Nummer | Der Parameter wirkt an: | 1 | Stellen. | Die | 1. | Auswirkung des Parameters erfolgt in Block: | F | Siehe Stelle: | #PRMA.BL-F.ECNummer |
29 | Kategorie | Der Parameter wirkt an: | 1 | Stellen. | Die | 1. | Auswirkung des Parameters erfolgt in Block: | F | Siehe Stelle: | #PRMA.BL-F.Kategorie |
30 | Peptidase_fam | Der Parameter wirkt an: | 1 | Stellen. | Die | 1. | Auswirkung des Parameters erfolgt in Block: | F | Siehe Stelle: | #PRMA.BL-F.Peptidasefam |
31 | Inhibitor_fam | Der Parameter wirkt an: | 1 | Stellen. | Die | 1. | Auswirkung des Parameters erfolgt in Block: | F | Siehe Stelle: | #PRMA.BL-F.Inhibitorfam |
32 | Reaktionsart | Der Parameter wirkt an: | 1 | Stellen. | Die | 1. | Auswirkung des Parameters erfolgt in Block: | F | Siehe Stelle: | #PRMA.BL-F.Reaktionsart |
33 | Substrat | Der Parameter wirkt an: | 1 | Stellen. | Die | 1. | Auswirkung des Parameters erfolgt in Block: | F | Siehe Stelle: | #PRMA.BL-F.Substrat |
34 | Produkte | Der Parameter wirkt an: | 1 | Stellen. | Die | 1. | Auswirkung des Parameters erfolgt in Block: | F | Siehe Stelle: | #PRMA.BL-F.Produkte |
35 | MoreEC1 | Der Parameter wirkt an: | 1 | Stellen. | Die | 1. | Auswirkung des Parameters erfolgt in Block: | F | Siehe Stelle: | #PRMA.BL-F.MoreEC1 |
36 | MoreEC2 | Der Parameter wirkt an: | 1 | Stellen. | Die | 1. | Auswirkung des Parameters erfolgt in Block: | F | Siehe Stelle: | #PRMA.BL-F.MoreEC2 |
37 | MoreEC3 | Der Parameter wirkt an: | 1 | Stellen. | Die | 1. | Auswirkung des Parameters erfolgt in Block: | F | Siehe Stelle: | #PRMA.BL-F.MoreEC3 |
38 | Homolog_fam | Der Parameter wirkt an: | 1 | Stellen. | Die | 1. | Auswirkung des Parameters erfolgt in Block: | G | Siehe Stelle: | #PRMA.BL-G.Homologfam |
39 | Homolog_db | Der Parameter wirkt an: | 1 | Stellen. | Die | 1. | Auswirkung des Parameters erfolgt in Block: | G | Siehe Stelle: | #PRMA.BL-G.Homologdb |
40 | UniProt | Der Parameter wirkt an: | 2 | Stellen. | Die | 2. | Auswirkung des Parameters erfolgt in Block: | G | Siehe Stelle: | #PRMA.BL-G.UniProt |
41 | Homolog_url | Der Parameter wirkt an: | 1 | Stellen. | Die | 1. | Auswirkung des Parameters erfolgt in Block: | G | Siehe Stelle: | #PRMA.BL-G.Homologurl |
42 | Taxon | Der Parameter wirkt an: | 1 | Stellen. | Die | 1. | Auswirkung des Parameters erfolgt in Block: | G | Siehe Stelle: | #PRMA.BL-G.Taxon |
43 | Taxon_Ausnahme | Der Parameter wirkt an: | 1 | Stellen. | Die | 1. | Auswirkung des Parameters erfolgt in Block: | G | Siehe Stelle: | #PRMA.BL-G.TaxonAusnahme |
44 | Orthologe | Der Parameter wirkt an: | 1 | Stellen. | Die | 1. | Auswirkung des Parameters erfolgt in Block: | H | Siehe Stelle: | #PRMA.BL-H.Orthologe |
Verknüpfungsknoten – Elemente der Vorlage Infobox_Protein
Blöcke
- Überschriften, Abschnitte und die Blöcke A bis H ← knappe Darstellung der ›Blöcke‹.
- Detaillierte Beschreibung der Vorlage Infobox_Protein – Blöcke und Parameter ← detaillierte Darstellung der ›Blöcke‹.
Blöcke A bis H | knapp: A bis H ← | detailliert: A bis H ← |
Block A | knapp: A ← | detailliert: A ← |
Block B | knapp: B ← | detailliert: B ← |
Block C | knapp: C ← | detailliert: C ← |
Block D | knapp: D ← | detailliert: D ← |
Block E | knapp: E ← | detailliert: E ← |
Block F | knapp: F ← | detailliert: F ← |
Block G | knapp: G ← | detailliert: G ← |
Block H | knapp: H ← | detailliert: H ← |
Parameter
Anzeige- und Eingabe-Elemente
Detaillierte Beschreibung der Vorlage Infobox_Protein – Blöcke und Parameter
Zu den einzelnen Blöcken: A↓ / B↓ / C↓ / D↓ / E↓ / F↓ / G↓ / H↓ und zum Verknüpfungsknoten: Blöcke A bis H ←.
Block | Überschrift(en) | Funktion | ||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A | Entspricht zumeist dem Wert des Parameters "Name "
|
Titel der jeweiligen Infobox Protein und Einleitung. | ||||||||||||||||||||||||||||||||
Beschreibung von Block A
| ||||||||||||||||||||||||||||||||||
Block | Überschrift(en) | Funktion | ||||||||||||||||||||||||||||||||
B | Keine Überschrift oder „Eigenschaften des menschlichen Proteins“ | Fortsetzung der Einleitung durch weitere Eigenschaften oder neuer Abschnitt mit speziellen Eigenschaften, nämlich denen der menschlichen Protein-Variante. | ||||||||||||||||||||||||||||||||
Beschreibung von Block B
| ||||||||||||||||||||||||||||||||||
Block | Überschrift(en) | Funktion | ||||||||||||||||||||||||||||||||
C | „Bezeichner“ | Aufzählung von Symbolen und Identifikationsnummern mit ihren Fundorten in externen Datenbanken. | ||||||||||||||||||||||||||||||||
Beschreibung von Block C
| ||||||||||||||||||||||||||||||||||
Block | Überschrift(en) | Funktion | ||||||||||||||||||||||||||||||||
D | „Arzneistoffangaben“ | Angaben zum Protein, wenn es ein Arzneistoff ist. | ||||||||||||||||||||||||||||||||
Beschreibung von Block D
| ||||||||||||||||||||||||||||||||||
Block | Überschrift(en) | Funktion | ||||||||||||||||||||||||||||||||
E | „Transporter-Klassifikation“ | Angaben zum Protein, wenn es ein Membranprotein mit Transportfunktion ist. | ||||||||||||||||||||||||||||||||
Beschreibung von Block E
| ||||||||||||||||||||||||||||||||||
Block | Überschrift(en) | Funktion | ||||||||||||||||||||||||||||||||
F | „Enzymklassifikation“ oder „Enzymklassifikationen“ oder „Inhibitorklassifikation“ | Angaben zum Protein, wenn es ein Enzym ist. | ||||||||||||||||||||||||||||||||
Beschreibung von Block F
| ||||||||||||||||||||||||||||||||||
Block | Überschrift(en) | Funktion | ||||||||||||||||||||||||||||||||
G | „Vorkommen“ | Angaben zum Vorkommen und Fehlen des Proteins in Lebewesen. | ||||||||||||||||||||||||||||||||
Beschreibung von Block G
| ||||||||||||||||||||||||||||||||||
Block | Überschrift(en) | Funktion | ||||||||||||||||||||||||||||||||
H | „Orthologe“ | Angaben zu sogenannten orthologen Proteinen, d. h. verwandten Gen- bzw. Proteinvarianten in verschiedenen Lebewesen als Tabelle. | ||||||||||||||||||||||||||||||||
Beschreibung von Block H
|
Konstante, atomare Zeichenketten
Durch Anwendungs-Beispiele konnte ich 73 Schriftzüge identifizieren, die ich als ›konstante, atomare Zeichenketten‹ bezeichnet habe.
Links zu den 73 einzelnen Zeichenketten:
- / AltSymbols / Andere Namen / Arzneistoffangaben / ATC-Code / Ausnahmen / Bezeichner / Bezeichnung / Bild / Bild_legende / CAS / CASergänzend / CAS-Nummer / CID / DrugBank / EC, Kategorie / EC-Nummer / Eigenschaften des menschlichen Proteins / Entrez / Enzymklassifikation / Enzymklassifikationen / Externe IDs / GeneCards / Gen-Name / Gen-Name(n) / Gen-Namen / Groesse / HGNCid / Homolog_db / Homolog_fam / Homolog_url / Homologie-Familie / Inhibitor_fam / Inhibitorklassifikation / Isoformen / Kategorie / Kofaktor / Masse/Länge Primärstruktur / MEROPS / MGI / MGIid / MoreEC1 / MoreEC2 / MoreEC3 / Name / OMIM / Orthologe / PDB / Peptidase_fam / Präkursor / Precursor / Produkte / PubMed-Suche / Reaktionsart / S1_EntrezGene / S1_Uniprot / S2_EntrezGene / S2_Uniprot / Sekundär- bis Quartärstruktur / Spezies1 / Spezies2 / Struktur / Substrat / Symbol / Taxon / Taxon_Ausnahme / TCDB / Transporter-Klassifikation / TranspText / Übergeordnetes Taxon / UniProt / Vorhandene Strukturdaten / Vorkommen / Wirkstoffklasse /
Bei den ›konstante, atomare Zeichenketten‹ (kaZk) handelt es sich um wiederkehrende Schriftzüge. Diese kaZk können
- sowohl Anzeige- als auch Eingabe-Elemente sein (15 kaZk sind Überschriften oder ›optische Parameter‹ und gleichzeitig Parameter) oder
- sie sind nur Anzeige-Elemente (26 kaZk sind Überschriften und ›optische Parameter‹) oder
- sie sind nur Eingabe-Elemente (32 kaZk sind Parameter).
Die meisten kaZk ergaben sich nur durch die Haupt-Vorlage „Infobox Protein“, wenige nur durch eine der Unter-Vorlagen "Infobox Protein/MoreEC" und "Protein Orthologe" und einige durch beides (siehe „Die Referenzversionen im Einzelnen“ ←).
Zeichenketten | Anzeige- und Eingabe-Elemente |
---|---|
AltSymbols | Eingabe-Element, Parameter: "AltSymbols"; Block C (C↔) |
Andere Namen | 1. Anzeige-Element, ›optischer Parameter‹: "Andere Namen"; Block A (A↔) |
2. Eingabe-Element, Parameter: "Andere Namen"; Block A (A↔) | |
Arzneistoffangaben | Anzeige-Element, Überschrift: "Arzneistoffangaben"; Block A (A↔) |
ATC-Code | 1. Anzeige-Element, ›optischer Parameter‹: "ATC-Code"; Block D (D↔) |
2. Eingabe-Element, Parameter: "ATC-Code"; Block D (D↔) | |
Ausnahmen | Anzeige-Element, ›optischer Parameter‹: "Ausnahmen"; Block G (G↔) |
Bezeichner | Anzeige-Element, Überschrift: "Bezeichner"; Block C (C↔) |
Bezeichnung | Anzeige-Element, ›optischer Parameter‹: "Bezeichnung"; Block E (E↔) |
Bild | Eingabe-Element, Parameter: "Bild"; Block A (A↔) |
Bild_legende | Eingabe-Element, Parameter: "Bild_legende"; Block A (A↔) |
CAS | Eingabe-Element, Parameter: "CAS"; Block C (C↔) |
CASergänzend | Eingabe-Element, Parameter: "CASergänzend"; Block C (C↔) |
CAS-Nummer | Anzeige-Element, ›optischer Parameter‹: "CAS-Nummer:"; Block C (C↔) |
CID | 1. Anzeige-Element, ›optischer Parameter‹: "CID:" Block C (C↔) |
2. Eingabe-Element, Parameter: "CID"; Block C (C↔) | |
DrugBank | 1. Anzeige-Element, ›optischer Parameter‹: "DrugBank"; Block D (D↔) |
2. Eingabe-Element, Parameter: "DrugBank"; Block D (D↔) | |
EC, Kategorie | Anzeige-Element, ›optischer Parameter‹: "EC, Kategorie"; Block F (F↔) |
EC-Nummer | Eingabe-Element, Parameter: "EC-Nummer"; Block F (F↔) |
Eigenschaften des menschlichen Proteins | Anzeige-Element, Überschrift: "Eigenschaften des menschlichen Proteins"; Block B (B↔) |
Entrez | Anzeige-Element, ›optischer Parameter‹: "Entrez"; Block H (H↔) |
Enzymklassifikation | Anzeige-Element, Überschrift: "Enzymklassifikation"; Block F (F↔) |
Enzymklassifikationen | Anzeige-Element, Überschrift: "Enzymklassifikationen"; Block F (F↔) |
Externe IDs | Anzeige-Element, ›optischer Parameter‹: "Externe IDs"; Block C (C↔) |
GeneCards | 1. Anzeige-Element, ›optischer Parameter‹: "GeneCards:"; Block C (C↔) |
2. Eingabe-Element, Parameter: "GeneCards"; Block C (C↔) | |
Gen-Name | Anzeige-Element, ›optischer Parameter‹: "Gen-Name"; Block C (C↔) |
Gen-Name(n) | Anzeige-Element, ›optischer Parameter‹: "Gen-Name(n)"; Block C (C↔) |
Gen-Namen | Anzeige-Element, ›optischer Parameter‹: "Gen-Namen"; Block C (C↔) |
Groesse | Eingabe-Element, Parameter: "Groesse"; Block B (B↔) |
HGNCid | Eingabe-Element, Parameter: "HGNCid"; Blöcke A (A↔), B (B↔) und C (C↔) |
Homolog_db | Eingabe-Element, Parameter: "Homolog_db"; Block G (G↔) |
Homolog_fam | Eingabe-Element, Parameter: "Homolog_fam"; Block G (G↔) |
Homolog_url | Eingabe-Element, Parameter: "Homolog_url"; Block G (G↔) |
Homologie-Familie | Anzeige-Element, ›optischer Parameter‹: "Homologie-Familie"; Block G (G↔) |
Inhibitor_fam | Eingabe-Element, Parameter: "Inhibitor_fam"; Block F (F↔) |
Inhibitorklassifikation | Anzeige-Element, Überschrift: "Inhibitorklassifikation"; Block F (F↔) |
Isoformen | 1. Anzeige-Element, ›optischer Parameter‹: "Isoformen"; Block B (B↔) |
2. Eingabe-Element, Parameter: "Isoformen"; Block B (B↔) | |
Kategorie | Eingabe-Element, Parameter: "Kategorie"; Block F (F↔) |
Kofaktor | 1. Anzeige-Element, ›optischer Parameter‹: "Kofaktor"; Block B (B↔) |
2. Eingabe-Element, Parameter: "Kofaktor"; Block B (B↔) | |
Masse/Länge Primärstruktur | Anzeige-Element, ›optischer Parameter‹: "Masse/Länge Primärstruktur"; Block B (B↔) |
MEROPS | Anzeige-Element, ›optischer Parameter‹: "MEROPS"; Block F (F↔) |
MGI | Anzeige-Element, ›optischer Parameter‹: "MGI:"; Block C (C↔) |
MGIid | Eingabe-Element, Parameter: "MGIid"; Block C (C↔) |
MoreEC1 | Eingabe-Element, Parameter: "MoreEC1"; Block F (F↔) |
MoreEC2 | Eingabe-Element, Parameter: "MoreEC2"; Block F (F↔) |
MoreEC3 | Eingabe-Element, Parameter: "MoreEC3"; Block F (F↔) |
Name | Eingabe-Element, Parameter: "Name"; Block A (A↔) |
OMIM | 1. Anzeige-Element, ›optischer Parameter‹: "OMIM:"; Block C (C↔) |
2. Eingabe-Element, Parameter: "OMIM"; Block C (C↔) | |
Orthologe | 1. Anzeige-Element, Überschrift: "Orthologe"; Block H (H↔) |
2. Eingabe-Element, Parameter: "Orthologe"; Block H (H↔) | |
PDB | Eingabe-Element, Parameter: "PDB"; Block A (A↔) |
Peptidase_fam | Eingabe-Element, Parameter: "Peptidase_fam"; Block F (F↔) |
Präkursor | Anzeige-Element, ›optischer Parameter‹: "Präkursor"; Block B (B↔) |
Precursor | Eingabe-Element, Parameter: "Precursor"; Block B (B↔) |
Produkte | 1. Anzeige-Element, ›optischer Parameter‹: "Produkte"; Block F (F↔) |
2. Eingabe-Element, Parameter: "Produkte"; Block F (F↔) | |
PubMed-Suche | Anzeige-Element, ›optischer Parameter‹: "PubMed-Suche"; Block H (H↔) |
Reaktionsart | 1. Anzeige-Element, ›optischer Parameter‹: "Reaktionsart"; Block F (F↔) |
2. Eingabe-Element, Parameter: "Reaktionsart"; Block F (F↔) | |
S1_EntrezGene | Eingabe-Element, Parameter: "S1_EntrezGene"; Block H (H↔) |
S1_Uniprot | Eingabe-Element, Parameter: "S1_Uniprot"; Block H (H↔) |
S2_EntrezGene | Eingabe-Element, Parameter: "S2_EntrezGene"; Block H (H↔) |
S2_Uniprot | Eingabe-Element, Parameter: "S2_Uniprot"; Block H (H↔) |
Sekundär- bis Quartärstruktur | Anzeige-Element, ›optischer Parameter‹: "Sekundär- bis Quartärstruktur"; Block B (B↔) |
Spezies1 | Eingabe-Element, Parameter: "Spezies1"; Block H (H↔) |
Spezies2 | Eingabe-Element, Parameter: "Spezies2"; Block H (H↔) |
Struktur | Eingabe-Element, Parameter: "Struktur"; Block B (B↔) |
Substrat | 1. Anzeige-Element, ›optischer Parameter‹: "Substrat"; Block F (F↔) |
2. Eingabe-Element, Parameter: "Substrat"; Block F (F↔) | |
Symbol | Eingabe-Element, Parameter: "Symbol"; Block C (C↔) |
Taxon | Eingabe-Element, Parameter: "Taxon"; Block G (G↔) |
Taxon_Ausnahme | Eingabe-Element, Parameter: "Taxon_Ausnahme"; Block G (G↔) |
TCDB | 1. Anzeige-Element, ›optischer Parameter‹: "TCDB"; Block E (E↔) |
2. Eingabe-Element, Parameter: "TCDB"; Block E (E↔) | |
Transporter-Klassifikation | Anzeige-Element, Überschrift: "Transporter-Klassifikation"; Block E (E↔) |
TranspText | Eingabe-Element, Parameter: "TranspText"; Block E (E↔) |
Übergeordnetes Taxon | Anzeige-Element, ›optischer Parameter‹: "Übergeordnetes Taxon"; Block G (G↔) |
UniProt | 1. Anzeige-Element, ›optischer Parameter‹: "UniProt:"; Block C (C↔) |
2. Eingabe-Element, Parameter: "UniProt"; Blöcke C (C↔) und G (G↔) | |
Vorhandene Strukturdaten | Anzeige-Element, ›optischer Parameter‹: "Vorhandene Strukturdaten:"; Block A (A↔) |
Vorkommen | Anzeige-Element, Überschrift: "Vorkommen"; Block G (G↔) |
Wirkstoffklasse | 1. Anzeige-Element, ›optischer Parameter‹: "Wirkstoffklasse"; Block D (D↔) |
2. Eingabe-Element, Parameter: "Wirkstoffklasse"; Block D (D↔) |
Vollständig ausgelagert
Anker für detaillierte Beschreibung (Blöcke und Parameter) -- Material
Detaillierte Beschreibung der Vorlage Infobox_Protein – Blöcke und Parameter
Ineinander geschachtelte Tabellen mit Ankern.
- Anker
BLD.BL-<A bis H>
: BLöcke Detailiert, BLock A, B, C usw. bis H. - Anker
PRMA.BL-<A bis H>.<Name des Parameters>
: PaRaMeter-Auswirkung, BLock, welcher diese Auswirkungsstelle aufweist und Name des Parameters. Umlaute und Ähnliches (ä, ö, ü, ß), Minuszeichen (-), Unterstriche (_) und Leerzeichen sind für die Anker bzw. die Verknüpfungen aus den ursprünglichen Parameternamen entfernt worden.
Anker für ›Konstante, atomare Zeichenketten‹ -- Material
Anker für ›Konstante, atomare Zeichenketten‹: {{Anker|KAZK_<Bezeichnung für den Parameter>}}
;
Bezeichnung für den Parameter: basiert auf dem jeweiligen Namen des Parameters, wobei Umlaute und Ähnliches (ä
, ö
, ü
, ß
), Kommas (ein Komma: ,
), Minuszeichen (-
), Unterstriche (_
) und Leerzeichen (
) aus den Parameter-Namen entfernt wurden.
Weitere Sonderzeichen wurden anfangs nicht gefunden. Es sollten eigentlich nur große und kleine lateinische Buchstaben übrig geblieben, zwei Klammern [(
und )
in "KAZK_GenName(n)"] sowie ein Schrägstrich (/
in "KAZK_Masse/LngePrimrstruktur") wurden aber übersehen (entdeckt: 2020-09-08). Während der Schrägstrich einfach zu entfernen wäre, ist das bei den Klammern nicht so einfach, weil es bisher nicht nur "KAZK_GenName(n)" sondern auch "KAZK_GenNamen" gibt. „GenName(n)“ und „GenNamen“ werden in dieser Reihenfolge sortiert und daher werden aus den die alten Benennungen "KAZK_GenName(n)" und "KAZK_GenNamen" die neuen Benennungen "KAZK_GenNamen1" und "KAZK_GenNamen2" gemacht; aus "KAZK_Masse/LngePrimrstruktur" wird "KAZK_MasseLngePrimrstruktur".
Mehrdeutig wirksame Parameter HGNCid und UniProt -- Material
HGNCid
Der Parameter HGNCid existiert seit Anbeginn der Vorlage am 8. Januar 2007 „Infobox Protein“ (oldid=26161029), als sie aus der englischen Wikipedia übernommen und angepasst wurde.
Seit dem 3. Oktober 2012 fügt der Parameter HGNCid die Überschrift „Eigenschaften des menschlichen Proteins“ ein (oldid=108815396).
UniProt
Der Parameter UniProt existiert seit Anbeginn der Vorlage „Infobox Protein“ am 8. Januar 2007 (oldid=26161029), als sie aus der englischen Wikipedia übernommen und angepasst wurde.
Am 15. September 2008 (oldid=50758588) ist UniProt beseitigt worden und statt dessen ist z. B. der Block „Externe IDs“ eingefügt worden.
Am 26. September 2008 wurde UniProt zwischen OMIM und MGlid (oldid=51180706) wieder eingefügt. Weiterhin wurde am 26. September 2008 (oldid=51181083) die Wirkung auf den zweiten Bereich ausgedehnt ("Homolog handling umgestellt").
Seit dem 30. September 2008 (oldid=51314051) wird die Homologie-Familie bedingt durch UniProt u. a. angezeigt ("zeige Homolog-Fam. nur wenn sowohl UniProt && Homolog_fam && Homolog_db").
Vorlage:CID und Vorlage:PubChem
Beim Stöbern auf Benutzerseiten habe ich zufällig gesehen, dass es mal eine Vorlage:CID gab (2020-07, Benutzer:Ghilt → https://xtools.wmflabs.org/pages/de.wikipedia.org/Ghilt/all). Diese Seite wurde vermutlich zweimal angelegt und zweimal gelöscht:
Diese Seite wurde gelöscht oder verschoben. Zur Information folgt das Lösch- und Verschiebungs-Logbuch dieser Seite.
- 06:01, 26. Okt. 2017 Partynia Diskussion Beiträge löschte die Seite Vorlage:CID ({{SLA|Nicht verwendete Vorlage, zudem redundant zu Vorlage:PubChem siehe auch Spezial:Linkliste/Vorlage:CID und Wikipedia:Redaktion Chemie#Vorlage:CID --Lómelinde 06:17, 26. Okt. 2017 (CEST)}}) (danken)
- 23:43, 24. Dez. 2008 Church of emacs Diskussion Beiträge löschte die Seite Vorlage:CID (Nicht länger benötigt) (danken)
HTML-Entitäten und Pfeile
Einschub – „Überschriften, Abschnitte und die Blöcke A bis H“ #x2196-2199 #8598-8601 /
x2196↖ x2197↗ x2198↘ x2199↙ |
Referenzversionen -- Material
Die Analyse möglichst aller Parameter begann also mit dem Kopieren einer Tabelle aus dem Abschnitt „Parameter-Details“,
- aus der Vorlage, Vorlage:Infobox Protein, oldid=183851377#Parameter-Details, Programm-Version vom 19. Dez. 2018
- oder aus der Dokumentation, Vorlage:Infobox Protein/Doku, oldid=175729659#Parameter-Details, Dokumentations-Version vom 3. April 2018.
Am Stichtag (29.9.'19) und darüber hinaus (bis zum 27.12.'19) band die damals aktuelle Programm-Version (oldid=183851377) den Text der damals aktuellen Dokumentations-Version (oldid=175729659) ein, so dass es keinen Unterschied machte, ob die Tabelle indirekt aus der Einbindung oder aus der Dokumentation entnommen wurde (am 5.12.'19).
Drei Formen von Genname(n) -- Material
Ein weiterer Abschnitt, der durch "HGNCid" beeinflußt werden kann, heißt „Bezeichner“. Allerdings löst "HGNCid" das Erscheinen des Abschnitts mit der Überschrift „Bezeichner“ nicht aus. Es bestehen Abhängigkeiten zwischen den Parametern "Symbol" (Gen-Symbol), "AltSymbols" (alternative Gen-Symbole) und "HGNCid".
Sowohl "Symbol" als auch "AltSymbols" (wie auch andere Parameter) können die Überschrift „Bezeichner“ auslösen. Wenn die Überschrift „Bezeichner“ ausgelöst wird, dann kann ein Schriftzug zur Benennung einer Zeile in diesem Abschnitt der Infobox drei verschiedene Formen annehmen:
- Gen-Name(n) – Text ohne Verknüpfung; HGNCid fehlt und mindestens einer der beiden anderen Parameter, Symbol oder AltSymbols, hat einen Wert.
- Gen-Name – Text mit Verknüpfung zum Wikipedia-Artikel Human_Genome_Organisation; "AltSymbols" fehlt und die beiden anderen Parameter, "Symbol" und "HGNCid", haben einen Wert.
- Gen-Namen – Text mit Verknüpfung zum Wikipedia-Artikel Human_Genome_Organisation; alle drei Parameter ("Symbol", "AltSymbols" und "HGNCid") haben einen Wert.
Vereinfacht ausgedrückt ist "Symbol" also für die Einzahl, "AltSymbols" für die Mehrzahl und "HGNCid" für eine spezielle Verknüpfung zuständig. Ohne diese Verknüpfung wird ein „zahlneutraler“ Schriftzug angegeben. Diese Auswirkung eines einzelnen Parameters an mehreren Stellen hat Vor- und Nachteile. Der größte Vorteil dürfte sein, dass ...
Kombinatorik -- Material
Als Werte bzw. Argumente wurden die Vorschläge aus der Tabelle unter "Parameter-Details" der Dokumentation angewendet (1: |Symbol=ALB, 2: |AltSymbols=; ALB-1 und 3: |HGNCid=399). Jeder Kombination wurde ein entsprechender Name gegeben (allgemeine Form: |Name=Beispiel … …).
Der Parameter HGNCid löst allein (ohne die beiden anderen Parameter) die Überschrift "Eigenschaften des menschlichen Proteins" aus (der zugeordnete Abschnitt wird hier Block B genannt).
Sowohl Symbol als auch AltSymbols lösen jeweils allein die Überschrift "Bezeichner" aus. Wenn die Überschrift "Bezeichner" ausgelöst wird, dann kann ein Schriftzug zur Benennung einer Zeile im zugehörigen Abschnitt (Block C) drei verschiedene Formen annehmen:
▪ "Gen-Name(n)" – Text ohne Verknüpfung; HGNCid fehlt und mindestens einer der beiden anderen Parameter, Symbol oder AltSymbols, hat einen Wert.
▪ "Gen-Name" – Text mit Verknüpfung (Wikipedia, https://de.wikipedia.org/wiki/Human_Genome_Organisation); AltSymbols fehlt und die beiden anderen Parameter, Symbol und HGNCid, haben einen Wert.
▪ "Gen-Namen" – Text mit Verknüpfung (Wikipedia, https://de.wikipedia.org/wiki/Human_Genome_Organisation); Alle drei Parameter (Symbol, AltSymbols und HGNCid) haben einen Wert.
Vereinfacht ausgedrückt ist Symbol also für die Einzahl, AltSymbols für die Mehrzahl und HGNCid für eine Verknüpfung zuständig. Ohne Verknüpfung wird ein „zahlneutraler“ Schriftzug ["Gen-Name(n)"] angegeben.
Setzt man eine gültige ID ein (z. B. |HGNCid=399
), dann wird die Überschrift „Eigenschaften des menschlichen Proteins“ auch zwischen Einleitung und Eigenschaften gesetzt.
Engl. Wikipedia -- Auslagerung
In der Wikipedia könnte man auch an die Wikipedia:Kategorien denken. In der englischen Wikipedia wurde versucht, das EC-System mit seinen Enzymklassen und Enzymeinträgen relativ deckungsgleich abzubilden.
Die oberste Einteilungsebene des EC-Systems (z. B. EC 1 Hydrolases oder EC 2 Transferases) ist nur durch den Namen, nicht durch die EC-Nummer erreichbar (wahrscheinlich, weil solche Angaben wie "EC 1" oder "EC 2" mehrdeutig sind), während die darunter liegenden Klassen meist nur durch die jeweilige EC-Nummer, aber nicht durch den Namen erreichbar sind (wahrscheinlich, weil z. B. "Transferring one carbon groups" deutlich sperriger ist, als "EC 2.1").
Die Enzymklassen (Hierachie-Ebenen 1 bis 3) wurden in Wikipedia-Kategorien erfasst (Category: ...), während die Enzymeinträge (Hierachie-Ebene 4) oft als Weiterleitungen der jeweiligen EC-Nummer auf mehr oder weniger passende Artikel angelegt sind.
Die folgende Tabelle enthält die sechs EC-Nummern, die zu den DNA-Methyltransferasen bzw. "DNA methyltransferases" (https://en.wikipedia.org/wiki/DNA_methyltransferase) einen Bezug haben, zusammen mit deren Umsetzung in der englischen Wikipedia.
Textblock Programmablauf Doppel-Parameter
Zuerst fragt der Programmcode der Vorlage, ob mindestens einer der beiden Parameter (also "EC-Nummer" und "Kategorie") einen Wert hat. Und wenn dem so ist, werden eine Tabellenzeile, eine Tabellenzelle und eben dort ein Schriftzug erzeugt, der „EC, Kategorie“ lautet.
Darauf folgend wird eine weitere Tabellenzelle angelegt, in welcher das Argument des Parameters "EC-Nummer" – falls ein Wert angegeben wurde – als ›optisches Argument‹ geschrieben wird. In die gleiche Tabellenzelle wird – falls ein Wert für den Parameter "Kategorie" angegeben wurde – ein Komma geschrieben, dem ein geschütztes Leerzeichen und das ›optische Argument‹ vom Parameter "Kategorie" folgt. Das Komma mit dem Leerzeichen hängt laut Programmcode nicht von "EC-Nummer", sondern ausschließlich vom Auftreten des Parameters "Kategorie" ab.
Da zuerst ein Schriftzug generiert wird, der zu beiden Parametern passen soll und danach einer, der zu beiden Argumenten passen soll, nenne ich dieses Paar aus den beiden Parametern "EC-Nummer" und "Kategorie" hier einen „Doppel-Parameter“. Entsprechend sind die beiden Werte eine „Doppel-Wert“ oder „Doppel-Argument“. Die resultierenden Anzeige-Elemente sind folglich „optischer Doppel-Parameter“ und „optisches Doppel-Argument“.
Das Wort Enzym -- Stichproben
https://de.wikipedia.org/w/index.php?title=Vorlage:Infobox_Protein&action=edit&oldid=52053905, am 20. Oktober 2008 um 19:21 Uhr durch Leyo (Diskussion | Beiträge)
- Überschrift Enzymklassifikation (keine Mehrzahl), "EC, Kategorie", zwei Leerzeichen, Doku: Zwei Hintergrundfarben, nicht erklärt "Mit * bezeichnete Felder müssen angegeben werden." --> *(Enzyme) EC-Nummer des Enzyms
Programmablauf:
{{#if: {{{EC-Nummer|}}}{{{Kategorie|}}}{{{Peptidase_fam|}}}{{{Reaktionsart|}}}{{{Substrat|}}}{{{Produkte|}}} |
{{!-}}
{{!}} align="center" colspan="3" bgcolor="#90ee90" {{!}} '''Enzymklassifikation'''
{{!-}} {{!}} bgcolor="#ffffff" {{!}} [[EC-Nummer|EC, Kategorie]]
{{!}} bgcolor="#ffffff" colspan="2" align="center" {{!}} <span class=plainlinks>[http://www.expasy.org/enzyme/{{{EC-Nummer}}} {{{EC-Nummer}}}]</span> [[{{{Kategorie}}}]]
Integrierte Dokumentation:
|- class="hintergrundfarbe7"
| EC-Nummer || *(Enzyme) [[EC-Nummer]] des Enzyms || <code>2.1.1.14</code>
Blöcke A bis H detailliert
- | #Blöcke A bis H detailliert -- 1 | "Prototyp", Erst Blöcke (Beschreibungs-Tabelle), dann Parameter-Tabellen für Blöcke A bis H.
- | #Blöcke A bis H detailliert -- 2 | Jeder Block in einer einzelnen Tabelle.
- | #Blöcke A bis H detailliert -- 3 | Ineinander geschachtelte Tabellen. Die äußere Tabelle enthält die Blöcke A bis H, die inneren Tabellen enthalten die jeweiligen Parameter.
- | War mal ""; ist nun "#Detaillierte Beschreibung der Vorlage Infobox_Protein – Blöcke und Parameter" |
Blöcke A bis H detailliert -- 1
↑ Blöcke A bis H detailliert ↑
Block | Überschrift(en) | Funktion |
---|---|---|
Block A | Entspricht zumeist dem Wert des Parameters "Name "
|
Titel der jeweiligen Infobox Protein und Einleitung. |
Block | Überschrift(en) | Funktion |
Block B | Keine Überschrift oder „Eigenschaften des menschlichen Proteins“ | Fortsetzung der Einleitung durch weitere Eigenschaften oder neuer Abschnitt mit speziellen Eigenschaften, nämlich denen der menschlichen Protein-Variante. |
Block | Überschrift(en) | Funktion |
Block C | „Bezeichner“ | Aufzählung von Symbolen und Identifikationsnummern mit ihren Fundorten in externen Datenbanken. |
Block | Überschrift(en) | Funktion |
Block D | „Arzneistoffangaben“ | Angaben zum Protein, wenn es ein Arzneistoff ist. |
Block | Überschrift(en) | Funktion |
Block E | „Transporter-Klassifikation“ | Angaben zum Protein, wenn es ein Membranprotein mit Transportfunktion ist. |
Block | Überschrift(en) | Funktion |
Block F | „Enzymklassifikation“ oder „Enzymklassifikationen“ oder „Inhibitorklassifikation“ | Angaben zum Protein, wenn es ein Enzym ist. |
Block | Überschrift(en) | Funktion |
Block G | „Vorkommen“ | Angaben zum Vorkommen und Fehlen des Proteins in Lebewesen. |
Block | Überschrift(en) | Funktion |
Block H | „Orthologe“ | Angaben zu sogenannten orthologen Proteinen, d. h. verwandten Gen- bzw. Proteinvarianten in verschiedenen Lebewesen als Tabelle. |
Blöcke A bis H detailliert -- 2
↑ Blöcke A bis H detailliert ↑
Jeder Block in einer einzelnen Tabelle.
Beschreibung von Block A
Parameter | Beschreibung | Möglicher Wert |
---|---|---|
Name | Name des Proteins | Serumalbumin |
Bild | Bild des Proteins | Serum Albumin.png |
Bild_legende | Legende | von {{PDB|1YY1}} |
Andere Namen | Weitere Namen des Proteins | BSA |
PDB | Schriftzug: „Vorhandene Strukturdaten:“; Liste von Einträgen bei PDB | {{PDB2|1YY1}}, {{PDB2|ABCD}} |
HGNCid | Optionale Überschrift unterhalb der Einleitung; Achtung! "HGNCid" wirkt an mehreren Stellen |
Beschreibung von Block B
Parameter | Beschreibung | Möglicher Wert |
---|---|---|
HGNCid | Durch eine optionale Überschrift werden die Parameter in Block B als: „Eigenschaften des menschlichen Proteins“ gekennzeichnet. Achtung! "HGNCid" wirkt an mehreren Stellen. | |
Groesse | Schriftzug: „Masse/Länge Primärstruktur“; Anzahl Aminosäuren, Molgewicht in Dalton oder kD | 1234 aa, 187,9 kD |
Struktur | Schriftzug: „Sekundär- bis Quartärstruktur“; | βαββαβ |
Kofaktor | Für Funktion notwendiger Kofaktor | [[Folsäure|Folat]] |
Precursor | Schriftzug: „Präkursor“; Link auf evtl. Präkursor-Protein | [[Präalbumin]] |
Isoformen | Liste von Isoformen | Alb-2a, Alb-2b |
Beschreibung von Block C
Parameter | Beschreibung | Möglicher Wert |
---|---|---|
Symbol | Schriftzug: „Gen-Name“, auch „Gen-Namen“ oder „Gen-Name(n)“; Verlinkung durch "HGNCid" möglich | ALB |
HGNCid | Optionale Verlinkung: Werte von "Symbol" als Text und von "HGNCid" als Linkziel; Eintrag bei HGNC (HUGO Gene Nomenclature Committee); Achtung! "HGNCid" wirkt an weiteren Stellen. | 399 |
AltSymbols | Alternative Gen-Symbole, werden rechts von "Symbol" (Schriftzug „Gen-Name“) angeordnet | ; ALB-1 |
GeneCards | Verlinkung auf den Eintrag bei GeneCards | IDH1 |
OMIM | Verlinkung auf den Eintrag bei OMIM | 103600 |
UniProt | Verlinkung auf den Eintrag bei UniProt, Achtung! "UniProt" wirkt an mehreren Stellen | P12345 |
MGIid | Verlinkung auf den Eintrag bei MGIid | 98765 |
CID | PubChem Compound CID; Verlinkung auf den Eintrag bei PubChem | 64763 |
CAS | CAS-Nummer des Proteins | 1234-56-78 |
CASergänzend | Zusätze zur CAS-Nummer, die in der Infobox hinter dem Link auftauchen | ? |
Beschreibung von Block D
Parameter | Beschreibung | Möglicher Wert |
---|---|---|
ATC-Code | ATC-Code des Proteins | {{ATC|???|????}} |
DrugBank | Zugriffsnummer der DrugBank | DB00062 |
Wirkstoffklasse | [[RNase-Hemmer]] |
Beschreibung von Block E
Parameter | Beschreibung | Möglicher Wert |
---|---|---|
TCDB | Klassifikation bei TCDB (www.tcdb.org) | 1.A.10 |
TranspText | Bezeichnung Transporterklasse | [[Kaliumkanal]] |
Beschreibung von Block F
Parameter | Beschreibung | Möglicher Wert |
---|---|---|
EC-Nummer | Schriftzug: „EC, Kategorie“; EC-Nummer des Enzyms | 2.1.1.14 |
Kategorie | Enzym-Kategorie; Text ergänzt "EC-Nummer" und wird automatisch zur gleichnamigen Wikipedia-Seite verlinkt | Hydrolasen |
Peptidase_fam | Schriftzug: „MEROPS“; Peptidase-Familie bei MEROPS | M02 |
Inhibitor_fam | Schriftzug: „MEROPS“; Proteaseinhibitor-Familie bei MEROPS | I04 |
Reaktionsart | Klassifizierung der kat. Reaktion | [[Methylierung]] |
Substrat | Haupt-Substrat des Enzyms | [[Traubenzucker|Glukose]] |
Produkte | Produkte der kat. Reaktion | [[Ethanol]] |
MoreEC1 | Startet mit Schriftzug: „EC, Kategorie“; Zweiter möglicher Eintrag für Enzym- bzw. Inhibitorklassifikation; siehe Vorlage:Infobox Protein/MoreEC | {{Infobox Protein/MoreEC|...}} |
MoreEC2 | Dritter möglicher Eintrag, siehe "MoreEC1" | |
MoreEC3 | Vierter möglicher Eintrag, siehe "MoreEC1" |
Beschreibung von Block G
Parameter | Beschreibung | Möglicher Wert |
---|---|---|
Homolog_fam | Schriftzug: „Homologie-Familie“; Name der Gen- bzw. Proteinfamilie; der Text kann zu einer Datenbank verlinkt werden: "Homolog_fam"+"Homolog_db"+"UniProt" oder "Homolog_fam"+"Homolog_url" | beliebiger Text |
Homolog_db | Verlinkung zu einer Datenbank: Text durch "Homolog_fam", Datenbank durch "Homolog_db" und Identifikations-Nummer durch "UniProt"; für eine Homologie-Recherche siehe http://pbil.univ-lyon1.fr/search/query_fam.php; mögliche Werte: HOGENOM, HOVERGEN und HOBACGEN | HOGENOM |
UniProt | Siehe "Homolog_db"; Achtung! "UniProt" wirkt an mehreren Stellen | 103600 |
Homolog_url | URL zur HOGENOM-Datenbank, durch "Homolog_fam"+"Homolog_url" (nur nötig, falls abweichend von der automatisch generierten URL durch "Homolog_fam"+"Homolog_db"+"UniProt") | http://doua.prabi.fr/cgi-bin/... |
Taxon | Schriftzug: „Übergeordnetes Taxon“; Taxon, das alle Organismen einschließt, wo das Protein vorkommt (kann bei http://pbil.univ-lyon1.fr/search/query_fam.php nachgelesen werden) | [[Chordatiere|Chordata]] |
Taxon_Ausnahme | Schriftzug: „Ausnahmen“; Liste der Taxa, wo Protein nicht vorkommt | [[Felis]] |
Beschreibung von Block H
Parameter | Beschreibung | Möglicher Wert |
---|---|---|
Orthologe | Eine oder mehrere Ortholog-Boxen, siehe die Vorlage:Protein Orthologe | {{Protein Orthologe |...}} |
Blöcke A bis H detailliert -- 3
Ineinander geschachtelte Tabellen ohne Anker.
↑ Blöcke A bis H detailliert ↑
Block | Überschrift(en) | Funktion | ||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A | Entspricht zumeist dem Wert des Parameters "Name "
|
Titel der jeweiligen Infobox Protein und Einleitung. | ||||||||||||||||||||||||||||||||
Beschreibung von Block A
| ||||||||||||||||||||||||||||||||||
Block | Überschrift(en) | Funktion | ||||||||||||||||||||||||||||||||
B | Keine Überschrift oder „Eigenschaften des menschlichen Proteins“ | Fortsetzung der Einleitung durch weitere Eigenschaften oder neuer Abschnitt mit speziellen Eigenschaften, nämlich denen der menschlichen Protein-Variante. | ||||||||||||||||||||||||||||||||
Beschreibung von Block B
| ||||||||||||||||||||||||||||||||||
Block | Überschrift(en) | Funktion | ||||||||||||||||||||||||||||||||
C | „Bezeichner“ | Aufzählung von Symbolen und Identifikationsnummern mit ihren Fundorten in externen Datenbanken. | ||||||||||||||||||||||||||||||||
Beschreibung von Block C
| ||||||||||||||||||||||||||||||||||
Block | Überschrift(en) | Funktion | ||||||||||||||||||||||||||||||||
D | „Arzneistoffangaben“ | Angaben zum Protein, wenn es ein Arzneistoff ist. | ||||||||||||||||||||||||||||||||
Beschreibung von Block D
| ||||||||||||||||||||||||||||||||||
Block | Überschrift(en) | Funktion | ||||||||||||||||||||||||||||||||
E | „Transporter-Klassifikation“ | Angaben zum Protein, wenn es ein Membranprotein mit Transportfunktion ist. | ||||||||||||||||||||||||||||||||
Beschreibung von Block E
| ||||||||||||||||||||||||||||||||||
Block | Überschrift(en) | Funktion | ||||||||||||||||||||||||||||||||
F | „Enzymklassifikation“ oder „Enzymklassifikationen“ oder „Inhibitorklassifikation“ | Angaben zum Protein, wenn es ein Enzym ist. | ||||||||||||||||||||||||||||||||
Beschreibung von Block F
| ||||||||||||||||||||||||||||||||||
Block | Überschrift(en) | Funktion | ||||||||||||||||||||||||||||||||
G | „Vorkommen“ | Angaben zum Vorkommen und Fehlen des Proteins in Lebewesen. | ||||||||||||||||||||||||||||||||
Beschreibung von Block G
| ||||||||||||||||||||||||||||||||||
Block | Überschrift(en) | Funktion | ||||||||||||||||||||||||||||||||
H | „Orthologe“ | Angaben zu sogenannten orthologen Proteinen, d. h. verwandten Gen- bzw. Proteinvarianten in verschiedenen Lebewesen als Tabelle. | ||||||||||||||||||||||||||||||||
Beschreibung von Block H
|
z
/ AltSymbols / Andere Namen / Arzneistoffangaben / ATC-Code / Ausnahmen / Bezeichner / Bezeichnung / Bild / Bild_legende / CAS / CASergänzend / CAS-Nummer / CID / DrugBank / EC, Kategorie / EC-Nummer / Eigenschaften des menschlichen Proteins / Entrez / Enzymklassifikation / Enzymklassifikationen / Externe IDs / GeneCards / Gen-Name / Gen-Name(n) / Gen-Namen / Groesse / HGNCid / Homolog_db / Homolog_fam / Homolog_url / Homologie-Familie / Inhibitor_fam / Inhibitorklassifikation / Isoformen / Kategorie / Kofaktor / Masse/Länge Primärstruktur / MEROPS / MGI / MGIid / MoreEC1 / MoreEC2 / MoreEC3 / Name / OMIM / Orthologe / PDB / Peptidase_fam / Präkursor / Precursor / Produkte / PubMed-Suche / Reaktionsart / S1_EntrezGene / S1_Uniprot / S2_EntrezGene / S2_Uniprot / Sekundär- bis Quartärstruktur / Spezies1 / Spezies2 / Struktur / Substrat / Symbol / Taxon / Taxon_Ausnahme / TCDB / Transporter-Klassifikation / TranspText / Übergeordnetes Taxon / UniProt / Vorhandene Strukturdaten / Vorkommen / Wirkstoffklasse /
d
d
d
d
d
d
d
d
d
d
dd
d
d
d
d
d
d
d
d
d
d
/ AltSymbols / Andere Namen / Arzneistoffangaben / ATC-Code / Ausnahmen / Bezeichner / Bezeichnung / Bild / Bild_legende / CAS / CASergänzend / CAS-Nummer / CID / DrugBank / EC, Kategorie / EC-Nummer / Eigenschaften des menschlichen Proteins / Entrez / Enzymklassifikation / Enzymklassifikationen / Externe IDs / GeneCards / Gen-Name / Gen-Name(n) / Gen-Namen / Groesse / HGNCid / Homolog_db / Homolog_fam / Homolog_url / Homologie-Familie / Inhibitor_fam / Inhibitorklassifikation / Isoformen / Kategorie / Kofaktor / Masse/Länge Primärstruktur / MEROPS / MGI / MGIid / MoreEC1 / MoreEC2 / MoreEC3 / Name / OMIM / Orthologe / PDB / Peptidase_fam / Präkursor / Precursor / Produkte / PubMed-Suche / Reaktionsart / S1_EntrezGene / S1_Uniprot / S2_EntrezGene / S2_Uniprot / Sekundär- bis Quartärstruktur / Spezies1 / Spezies2 / Struktur / Substrat / Symbol / Taxon / Taxon_Ausnahme / TCDB / Transporter-Klassifikation / TranspText / Übergeordnetes Taxon / UniProt / Vorhandene Strukturdaten / Vorkommen / Wirkstoffklasse / |]] /