Wikiup:Taxoboxen/Taxobot

aus Wikipedia, der freien Enzyklopädie
Vorlage:Portal:Lebewesen/Tab3 {{Wikipedia:Redaktion Biologie/Tab3|Paläoboxen}} Vorlage:Portal:Lebewesen/Tab1 {{Wikipedia:Redaktion Biologie/Tab4|Viroboxen}} Vorlage:Portal:Lebewesen/Tab2 {{Wikipedia:Redaktion Biologie/Tab6|Botdiskussionen}}
 

Taxobot ist ein Bot zur Prüfung und Sicherstellung der Einheitlichkeit der taxonomischen Einordnung der Lebewesenartikel. Die Prüfung zielt insbesondere auf die Zuordnung zu den höheren Taxa ab, da diese zwangsläufig hochgradig redundant über die Artikel verteilt ist. Die Prüfung umfasst die Taxoboxen (oder Paläoboxen) und die Zuordnung zu den die biologische Systematik wiedergebenden Kategorien.

Dabei wird die Systematik für einzelne Teilbereiche der Lebewesen (beispielsweise Pflanzen) zentral auf einer speziellen Seite definiert. Der Bot überprüft,

  • ob die in allen relevanten Artikeln dargestellten Taxoboxen bzw. Paläoboxen diese Systematik wiedergeben und
  • ob die Kategoriezuordnungen konsistent zu dieser Systematik sind.

Festgestellte Abweichungen kann der Bot in den meisten Fällen selbst korrigieren, andere werden protokolliert.

Prinzip

Ein auf einer speziellen Seite definierter "Taxobaum" legt die Systematik aller höheren Taxa unterhalb eines "Ausgangstaxons" (z.B. Pflanzen) fest. Die hier festgelegte Definition wird von Taxobot periodisch verwendet, um die Taxoboxen und Kategoriezuordnungen aller relevanten Artikel zu prüfen und ggf. anzupassen. Bis hinab zu welcher Ebene die Systematik zentral festgelegt wird, ist technisch flexibel und anhand fachlicher oder praktischer Aspekte entscheidbar. Der Taxobaum ist aufgebaut als "normale" Aufzählung in Wiki-Syntax. In einer Zeile werden folgende Attribute spaltenweise definiert. Die Bedeutung ist dabei genau entsprechend {{Taxobox}}, das Trennzeichen ist Backslash ("\").

  1. Rang
  2. WissName
  3. Name
  4. LinkName
  5. Autor (nur bei monotypischen Taxa)

In einer weiteren sechsten Spalte kann zudem ein beliebiger Kommentar abgelegt werden (wird ignoriert).

Der Aufzählung vorangestellt ist das Ausgangstaxon. Für alle Artikel, die diesem Taxon untergeordnet sind, wird die in der Taxobox dargestellte Systematik überprüft und ggf. angepasst. Dem Ausgangstaxon selbst vorangestellt werden ebenfalls ohne Einrückung (dafür mit vorangestelltem Leerzeichen) die diesem übergeordneten Taxa, da diese bei Bearbeitung der höheren Taxa des Baums bekannt sein müssen, da sie in der Taxobox enthalten sind.

Die ersten Zeilen der den Taxobaum enthaltenen Definitionsdatei haben besondere Bedeutungen:

  1. Hinweis, auf welcher Basis die hier zentral definierte Systematik erstellt wurde (diese Zeile wird vom Bot ignoriert)
  2. Ausgangskategorie, der alle zu bearbeitenden Artikel angehören (auch indirekt). Es können ggf. auch mehrere angeben werden, Trennzeichen ist Backslash ("\"). Durch Voranstellen eines "-" kann eine Unterkategorie auch ausgeschlossen werden.
  3. Statusseite des Taxobot (weiteres siehe unten)

Die Seite kann beliebig mit Überschriftenzeilen strukturiert werden. Diese werden vom Bot ignoriert (wie auch leere Zeilen).

Hinter der Definition des Taxobaums können ggf. noch Umbenennungen für Taxa spezifiziert werden (siehe unten).

Skizzierung des Taxobaums

Pflanzensystematik nach xyz.

Pflanzen
Wikipedia:WikiProjekt Pflanzensystematik/Status
Klassifikation \ \ Lebewesen
Domäne \ Eukaryota \ Eukaryoten
ohne Rang \ Archaeplastida
ohne Rang \ Chloroplastida
ohne Rang \ Charophyta

Reich \ Plantae \ Pflanzen

  • Abteilung \ Tracheophyta \ Gefäßpflanzen
    • Unterabteilung \ Spermatophytina \ Samenpflanzen
      • Klasse \ Magnoliophyta \ Bedecktsamer
        • ohne Rang \ \ Monokotyledonen
          • Ordnung \ Acorales \ Kalmusartige \ \ Link
        • ...
        • ohne Rang \ \ Eudikotyledonen
          • Ordnung \ Trochodendrales \ \ \ Cronquist
          • ...
          • ohne Rang \ \ Kerneudikotyledonen
            • Familie \ Dilleniaceae \ Kalmusartige

Ablauf und Details

  • Der Bot läuft auf Anfrage[1], ggf. später periodisch. Er prüft, ob die im Taxobaum definierte Struktur zu den Taxoboxen der Artikel passt und nimmt ggf. Anpassungen vor.
  • Vom Bot bearbeitet werden alle Artikel, die den spezifizierten Ausgangskategorien angehören (und nicht einer der auszuschließenden) und die eine Taxobox enthalten.
  • Das unterste Taxon in der Taxobox wird gesucht, das im auf der Definitionsseite definierten Taxobaum enthalten ist. Dabei gelten Taxa als gleich, wenn
    • die Trivialnamen und die Ränge übereinstimmen,
    • die wissenschaftlichen Namen und die Ränge übereinstimmen oder
    • die wissenschaftlichen Namen übereinstimmen auch wenn die Ränge verschieden sind, allerdings darf keiner der beiden Ränge Untergattung sein.[2]
  • Wird eins gefunden, werden alle übergeordneten Taxa der Box entsprechend der Definition im Taxobaum angepasst (falls erforderlich).
  • Es wird immer eine konstante Anzahl (Artikeltaxon + 5 übergeordnete) in der Box abgebildet.
  • Der Bot bearbeitet nur die übergeordneten Taxa der Box, nie das Taxon des Artikels selbst.
  • Für die Attribute "Name", "WissName" und "LinkName" können auf der Definitionsseite Verlinkungen (Wikilinks) verwendet werden (obwohl sie eigentlich funktional unnötig sind), da dies das Auffinden von Fehlern erheblich erleichtert.
  • Das Attribut "Autor" muss nur für monotypische Taxa hier angegeben werden. Dieses Autorenzitat wird in die Taxobox des einzigen direkt untergeordneten Taxons eingetragen, zudem bewirkt diese Angabe, dass das Taxon in diesem Artikel nicht verlinkt wird. Diese Verlinkung wäre ja ein Selbstlink, da für ein monotypisches Taxon eine Weiterleitung auf das einzige enthaltene Taxon eingerichtet wird. Problematisch sind monotypische Taxa, für die kein Autor bekannt ist. Für diese muss als Autor "unbekannt" eingetragen werden, damit der Selbstlink auch in diesem Fall verhindert wird.[3]
  • Auch ausgestorbene Taxa werden abgehandelt. Dies gilt sowohl für Taxa, bei denen die unterste im Baum enthaltene Stufe ein rezentes Taxon ist (also ein Taxon, dass neben diesem ausgestorbenen auch rezente Taxa enthält), als auch für ausgestorbene höhere Taxa, die selbst im Baum aufgenommen werden. Letztere können durch ein "†" direkt vor dem Rang kenntlich gemacht werden.[4]
  • Verschiedene spezielle Verarbeitungsanweisungen können durch Voranstellen besonderer Zeichen ("+", "^", "?", "~", "&") direkt vor dem Rang festgelegt werden (die Reihenfolge dieser Zeichen ist dabei unerheblich).
    • Taxa, für die untergeordnete Taxa aufgeführt werden aber bei denen die Aufzählung der untergeordneten Taxa nicht vollständig erfolgt, sollten durch "+" gekennzeichnet werden.[5] Ansonsten wird durch den Bot ggf. ein Hinweis erzeugt, wenn er ein ihm unbekanntes untergeordnetes Taxon in der Taxobox vorfindet.
    • Die Auslassung weniger wichtiger Zwischentaxa in der Taxobox kann durch Voranstellen eines "^" vor dem Rang erreicht werden. Diese Möglichkeit ist für Fälle mit sehr differenzierter Rangabstufung gedacht und hat das Ziel zu vermeiden, dass die Taxobox ausschließlich mit weniger bekannten Taxa gefüllt wird. Direkt hinter dem "^" kann die Ebene angegeben werden, ab dem das Taxon wegzulassen ist. "^3" bedeutet zum Beispiel, dass das Taxon nur dann in der Taxobox dargestellt ist, wenn es dem Artikeltaxon direkt übergeordnet ist, sonst wird es weggelassen. Wenn keine Ebene angegeben wird, wird "^4" angenommen, was bedeutet, dass das Taxon weggelassen wird, wenn es in der oberen Hälfte der Taxobox stünde.
    • Die Auslassung von Zwischentaxa, die nur im fossilen Kontext relevant sind und nur in Paläoboxen darzustellen sind – in Taxoboxen zu rezenten Taxa hingegen auszulassen – kann durch Voranstellen eines "&" vor dem Rang erreicht werden.
    • Falls auf der Definitionsseite ein Rang angegeben wird, der nicht von der Taxobox unterstützt wird oder nicht der durch die Taxobox unterstellten Bedeutung entspricht[6], kann ein "?" vor den Rang gestellt werden. In diesem Fall wird "ohne" in die Taxobox eingetragen.[7]
    • Falls eine Zeile der Definitionsseite (zeitweise) gänzlich ignoriert werden soll, kann vor den Rang ein "~" (Tilde) eingetragen werden.
  • In Artikel, die nach o.g. Kriterien eigentlich bearbeitet würden, für die das aber aus irgendwelchen Gründen nicht wünschenswert ist, ist die Vorlage {{Bots|deny=Taxobot}} einzutragen.
  • Die in der dritten (relevanten) Zeile der Definitionsdatei angegebene Seite dient der Speicherung von Statusinformation durch den Bot. Während der Durchführung des Abgleichs enthält die Seite die Liste der bearbeiteten Artikel. Nach Abschluss des Abgleichs wird statistische Information zum letzten Abgleich (z.B. die Zahl der angepassten Seiten) und ggf. weitere Hinweise auf besondere Änderungen oder zu prüfende Sachverhalte dort abgelegt.

Prüfung der Kategoriezuordnung

Die Prüfung der Kategoriezuordnungen ist optional. Dabei prüft der Bot zunächst, ob der Kategoriebaum unterhalb der über die auf der Definitionsseite festgelegten Ausgangskategorien zum Taxobaum passt. Falls Abweichungen existieren, protokolliert der Bot diese. In diesem Fall ist keine Weiterverarbeitung möglich.[8] Sonst prüft der Bot, ob die Zuordnung der die biologische Systematik betreffenden Kategorien korrekt ist. Dabei werden auch ggf. existierende Weiterleitungen für den wissenschaftlichen Namen überprüft (siehe auch Leitlinien Biologie)[9]. Zu beachten ist, dass der Bot nur in den Bereichen die Kategoriezuordnungen selbsttätig korrigieren kann, in denen der Kategoriebaum nicht tiefer gegliedert ist als der Taxobaum. In anderen Fällen können Abweichungen lediglich protokolliert werden.[10]

Umbenennung eines Taxons

Problematisch ist der Fall, wenn der wissenschaftliche Name eines Taxons anzupassen ist, da der Bot bei der Suche des ersten bekannten Taxons in einer Box die Übereinstimmung eines in der Taxobox aufgeführten alt benannten Taxons mit dem entsprechenden Taxon der Definitionsseite, wo schon der neue Name verwendet wird, nicht mehr zuverlässig erkennen kann. Deshalb sollte bei Änderung des wissenschaftlichen Namens diese Umbenennung explizit definiert werden.[11]Die erste Zeile der Definitionsseite nach dem Taxobaum, der kein Aufzählungszeichen ("*") vorangestellt ist, wird als Umbenennung interpretiert. Eine Umbenennungsdefinition nennt dabei zunächst den alten wissenschaftlichen Namen des Taxons und getrennt durch einen rechtsgerichteten Pfeil ("→", U+2192) alle aktuellen Angaben zum Taxon. Die aktuellen Angaben zum Taxon werden dabei genauso spezifiziert, wie bei der Angabe im Taxobaum, also Rang, WissName, Name, LinkName und Autor getrennt durch Backslash ("\"). Der Rang eines Taxons kann sich bei einer solchen Umbenennung durchaus ändern. Taxa ohne wissenschaftlichen Namen können derzeit nicht auf diese Weise umbenannt werden.

Beispiel:

Hyacinthaceae → Unterfamilie \ Scilloideae

Aktueller Einsatz

Der Bot läuft derzeit unter dem Account CactusBot[12]. Anfragen für eine Ausführung des Bot bitte auf der Diskussionsseite stellen. Für allgemeine Botfragen im Biologiebereich steht die Botseite der Redaktion Biologie zur Verfügung.

Eingesetzt wird der Bot derzeit für folgende Bereiche (Links jeweils zur Definitions- und Statusseite).

produktiv (periodischer Abgleich)
in Arbeit

Anmerkungen

  1. Anfragen bitte auf der Diskussionsseite dieser Seite stellen
  2. Diese Einschränkung ist nötig, da Untergattungen häufig denselben Namen wie die Gattung haben
  3. Es ist nicht ratsam, in einem solchen Fall auf der Definitionsseite für LinkName "nein" anzugeben. Dies würde den Link auch für die Artikel der untergeordneten Taxa des "schwesterlosen" Taxons unterdrücken. Dies mag zwar akzeptabel sein, da auch dort das direkt darunter stehende Taxon auf denselben Artikel verlinkt, offensichtlich ist aber für den Leser dieser Zusammenhang nicht.
  4. Dieses Kennzeichen ist bislang optional, es beeinflusst das Verhalten beim Abgleich nicht.
  5. Eine unvollständige Aufzählung untergeordneter Taxa kann beispielsweise dann sinnvoll sein, wenn der Kategoriebaum an dieser Stelle sonst tiefer geschachtelt wäre als die Aufstellung auf der Definitionsseite.
  6. Beispielsweise werden bei den Knochenfischen die Ränge "Serie" und "Unterserie" oberhalb der Ordnung verwendet, die Taxobox sieht "Serie" aber als intragenerischen Rang an.
  7. Man könnte auch auf der Definitionsseite "ohne" als Rang angeben, das Resultat wäre genau dasselbe, es mag aber wünschenswert sein, den in der Literatur verwendeten Rang auf der Definitionsseite anzugeben.
  8. Der Bot legt selbsttätig keine Kategorien an bzw. löscht keine bestehenden.
  9. Fehlende Weiterleitungen für den in der Taxobox angegebenen wissenschaftlichen Namen werden ggf. angelegt und entsprechend kategorisiert.
  10. In diesem Fall könnten mehrere Kategorien zutreffend sein, der Bot kann nur protokollieren, falls keine der in Frage kommenden verwendet wird.
  11. Problematisch sind solche Umbenennungen nur dann, wenn sie ein unterstes Taxon des Definitionsbaums betreffen. Im anderen Fall "retten" die untergeordneten Taxa des umbenannten Taxons die Sache, da diese ebenfalls im Baum definiert sind und als Einstiegspunkt des Bot dienen. Dies funktioniert aber nur dann ohne Umbenennungsdefinition, wenn alle untergeordneten Taxa des umbenannten Taxons im Baum aufgeführt werden.
  12. Der Taxobot ist auf Basis von .NET implementiert. Die Programmdateien und der Quellcode des Taxobot kann bei Benutzer:Cactus26 angefordert werden. Ggf. sind auch ein spezifischer Account und die Ausführung auf einem zentralen Server langfristig möglich.