Wikiup:WikiProjekt Metadaten
Lua-Fehler in package.lua, Zeile 80: module 'strict' not foundLua-Fehler in package.lua, Zeile 80: module 'strict' not found[[:]]
Dieses WikiProjekt ist im Aufbau und bedarf noch vieler Diskussionen. Bitte hilf mit und beteilige Dich daran. |
Erstes persönliches Treffen zu diesem Projekt war am Sonntag den 21. September 2008, 19:00h in Stuttgart. |
Die Wikipedia lebt von gut geschriebenen Artikeln, die Zusammenhänge erläutern und Lust zum Lesen machen. Gute Artikel leben aber auch von Fakten, die in unterschiedlichen Artikeln genutzt werden oder permanenten Änderungen unterworfen sind. Es ist zeit- und arbeitsaufwändig, solche Fakten über mehrere Artikel zu vereinheitlichen und auf dem Laufenden zu halten. Dieses Projekt versucht, dieses Problem durch technische Unterstützung der Mediawiki-Software zu beheben und ggf. immer wieder notwendige Bot-Läufe zu ersetzen.
Organisation
Die Strukturierung, Organisation, Koordination und Bereitstellung der Vorlagen vom Typ „Metadaten“ erfolgt im Wikipedia:WikiProjekt Metadaten/Datenorganisation.
Grundlagen
Daten, wie z. B. die Einwohnerzahl einer Gemeinde oder das Bruttosozialprodukt eines Landes, werden oft in mehreren Artikeln sowohl im Fließtext als auch in Infoboxen oder Tabellen verwendet. Solche Daten zeichnen sich durch mehrere Attribute aus:
- Wer (Schlüssel): welche Einheit ist gemeint (z. B. Berlin).
- Was (Bezug): um welche Daten handelt es sich (z. B. Einwohnerzahl)
- Wieviel (Wert): welchen Wert haben diese Daten (z. B. 3420786)
- Wann (Stand): wann wurde dieser Wert ermittelt (z. B. 31. März 2008)
- Woher (Quelle): woher kommen diese Daten (z. B. Amt für Statistik Berlin-Brandenburg)
Die ersten drei Attribute beschreiben die Daten selbst. Sie werden in Anlehnung an das Resource Description Framework (RDF) auch als Subjekt - Prädikat - Objekt bezeichnet. Die beiden letzten Attribute sind im engsten Sinne Metadaten, also Daten über Daten.
Vorlagen bieten eine einfache Möglichkeit, über einen Eingabeparameter einen Rückgabewert zu steuern. So könnte eine Vorlage "Bevölkerungszahl" (Prädikat) z. B. bei der Eingabe des Parameters "Berlin" (Subjekt), den Wert "3420786" (Objekt) zurückgeben. Die Vorlagenprogrammierung bietet hierzu über switch eine elegante Lösung.
Die Kategorie:Vorlage:Metadaten zeigt erste Beispiele solcher Vorlagen.
Datentypen
Bei den relevanten Daten werden verschiedene Datentypen unterschieden, die aus praktischen Gründen jedoch in maschinenverarbeitbarer Form vorliegen sollten und erst zur Ausgabe in ein geeignetes Format gewandelt werden. Diese maschinenverarbeitbare Form (z. B. bei Zahlen ohne Tausendertrenner und mit Punkt als Dezimaltrenner) erlaubt es etwa auch noch, die Bevölkerungsdichte aus dem Quotienten Bevölkerungszahl/Fläche zu ermitteln:
- Zahl (zur Formatierung siehe Vorlage:FormatZahl)
- Datum (zur Formatierung siehe Vorlage:FormatDate)
- Quelle (ohne weitere Formatierung)
Nomenklatur der Vorlagen
Die Benennung der Vorlagen des Vorlagentyps „Metadaten“ erfolgt nach dem Schema:
Vorlage:Metadaten Bezug Abgrenzung
Beispiel: Vorlage:Metadaten Einwohnerzahl DE-NI
Der Aufruf erfolgt dann entsprechend:
{{Metadaten Yyz|Schlüssel|Zusatz}}
Beispiel: {{Metadaten Einwohnerzahl DE-NI|12345}}
Bezug
Daten des gleichen Bezugs werden mit dem gleichen möglichst allgemeingültigen Überbergiff beschrieben. Beispiele:
Einwohnerzahl
ergibt Daten über die Einwohnerzahl einer GebietskörperschaftOberhaupt
ergibt Daten über das Oberhaupt einer Gebietskörperschaft, das entspricht z. B. bei einer Gemeinde einem „Bürgermeister“, bei einem deutschen Landkreis einem „Landrat“.Bruttoinlandsprodukt
ergibt Daten über das Bruttoinlandsprodukt eines Landes.
Abgrenzung
Die optionale Abgrenzung des Datensatzes erfolgt nach den Kriterien
- Form der Datenbereitstellung der Datenquelle,
- Größe des Datenumfangs (z. B. sollten nicht mehr als max. 2000 Einträge in der Switch-Liste stehen) und
- logischem Zusammenhang der Datengruppe.
Beispiele:
- Die Einteilung der Datenvorlagen für die Einwohnerzahlen deutscher Gemeinden, Gemeindeverbände, Landkreise und Regierungsbezirke erfolgt nach Bundesland.
- Die Datenvorlage für den Human Development Index erfolgt nach Staaten der Erde.
Die Benennung der Abgrenzung erfolgt ebenfalls nach allgemeingültigen Kriterien, so werden etwa Daten über geographische Einheiten nach ISO 3166 abgegrenzt.
Schlüssel
Die Zuordnung der Daten erfolgt möglichst nach allgemeingültigen und eindeutigen von wikipediainternen Regelungen unabhängigen Schlüsseln. So sollte z. B. der amtliche Gemeindeschlüssel für Daten zu deutschen Gemeinden oder der ISO-3166-Schlüssel für Daten zu Staaten benutzt werden. Dies verhindert, dass Dateneinbindungen durch Lemma-Änderungen verloren gehen und ermöglicht eine Verwendung der Datensätze unabhängig von den Namenskonventionen der einzelnen Wikipedia-Sprachversionen.
Zusatz
Wird der Parameter Zusatz
nicht angegeben, liefern die Vorlagen die erwarteten Daten in entsprechender Form (siehe oben). Durch Angabe dieses Parameters können zusätzliche Daten zu den Daten abgefragt werden. Beispiele:
STAND
liefert den Stand der Daten im Format JJJJ-MM-TT zurück. Damit kann z. B. durch folgenden Aufruf
Einwohner München: {{FormatZahl|{{Metadaten Einwohnerzahl DE-BY|09162000}} }} (Stand {{FormatDate|{{Metadaten Einwohnerzahl DE-BY|09162000|STAND}} }})
folgendes Ergebnis erziehlt werden:- Einwohner München: 1.487.708 (Stand 31. Dezember 2021)
- bzw. kurz:
Einwohner München: {{EWZ|DE-BY|09162000}} (Stand {{EWD|DE-BY|09162000|}})
- Einwohner München: 1.487.708 (Stand 31. Dezember 2021)
QUELLE
liefert die Quelle der angeforderten Daten, als Text (ggf. mit Formatierung), Beispiel: {{Metadaten Einwohnerzahl DE-BY|09162000|QUELLE}} bzw. kurz: {{EWQ|DE-BY|09162000}}
- Genesis Online-Datenbank des Bayerischen Landesamtes für Statistik Tabelle 12411-003r Fortschreibung des Bevölkerungsstandes: Gemeinden, Stichtag (Einwohnerzahlen auf Grundlage des Zensus 2011) (Hilfe dazu).
BEZEICHNER
liefert einen näheren Bezeichner wie z. B. „Bürgermeisterin“ bei einem weiblichem Gemeindeoberhaupt.
Zu klärende Fragen
- Stehen Aufwand und Nutzen in vernünftigem Verhältnis?
- Schreckt man Newbies damit nicht noch mehr ab?
- Wie sollen die Bezüge benannt werden?
- Braucht es einen Default-Wert?
- Wie können Bots damit umgehen?