Wikiup:WikiProjekt Französische Gemeinden/Vorlage:Infobox französischer Kanton

aus Wikipedia, der freien Enzyklopädie

Zielsetzung

  • Die Einwohnerzahlen in den Infoboxen französischer Kantonsartikel sind auf dem Stand der Volkszählung von 1999 und sollen auf den Stand 2006 gebracht werden. Dies soll durch Einbindung der Vorlagen der Reihe Kategorie:Vorlage:Metadaten Einwohnerzahl FR geschehen. Die Metadatenvorlagen sind bei den Infoboxen Vorlage:Infobox Französisches Département, Vorlage:Infobox französisches Arrondissement und Vorlage:Infobox Gemeinde in Frankreich bereits im Einsatz und haben sich soweit bewährt.
  • Die Bevölkerungsdichte wurde bisher über einen eigenen Parameter erfasst, dessen Werte bei Aktualisierung der Einwohnerzahlen nicht mehr stimmen würden, und soll in Zukunft aus Einwohnerzahl und Fläche berechnet werden, um diese Fehlerquelle für die Zukunft auszuschließen. Um dies zu ermöglichen, sollen die vorliegenden Flächenangaben einheitlich in das von der Parserfunktion #expr verlangte Rohformat gebracht werden.
  • Da die Zuordnung der „Datensätze“ zu den Artikeln über den INSEE-Code läuft, ist das Verfahren anfällig für Verwechslungen. Ein falsch angegebener INSEE-Code kann zur Einbindung einer falschen Einwohnerzahl führen. Als zusätzliche Plausibilitätsprüfung soll der im Artikel angegebene Name mit dem in den Metadatenvorlagen hinterlegten Bezeichner verglichen werden. Zu diesem Zweck sollen die Namen soweit wie möglich mit den Metadaten in Übereinstimmung gebracht werden. Die redundante Eingabe des Wortes „Kanton“ soll entfallen.

Bestandsaufnahme

Parameter nom

Kantonsartikel insgesamt ca. 3650 100 %
nom irgendwie angegeben 3623 (Quelle) 99,2 %
nom beginnt mit „Kanton“ 3573 (Quelle) Noch Regelfall, zu ändern
nom beginnt nicht mit „Kanton“ 50 (Quelle) Fehlerquelle: „(Kanton)“ in Klammern hinten angefügt

Parameter km²

Kantonsartikel insgesamt ca. 3650 100 %
km² irgendwie angegeben 2789 (Quelle) 76,4 % (Viel zu wenig für einen Pflichtparameter)
km² besteht aus Ziffern, Komma, 1 oder 2 Ziffern 2053 (Quelle) Komma durch Punkt ersetzen
km² besteht aus Ziffern, Komma, 3 oder mehr Ziffern 3 (Quelle) Werte sind schon jetzt falsch (Komma an der falschen Stelle) => so lassen
km² besteht nur aus Ziffern 657 (Quelle) so lassen
km² besteht aus Ziffern, Punkt, Ziffern 11 (Quelle) so lassen
km² enthält Zeichen außer Ziffern, Komma und Punkt 65 (Quelle) von Hand abarbeiten

Parameter insee

Kantonsartikel insgesamt ca. 3650 100 %
insee irgendwie angegeben 3467 (Quelle) 95,0 %
insee 6- und mehrstellig 2 (Quelle) Problemfall: Sammelartikel wie Metzer Kantone. Infobox raus?
insee 5-stellig 46 (Quelle) Fehlerquelle: unerwünschtes Leerzeichen zwischen Départements- und Kantonsnummer
insee 4-stellig 3400 (Quelle) Regelfall
insee 3-stellig 0 (Quelle)
insee 2-stellig 18 (Quelle) Fehlerquelle: vorangestellte Départementsnummer fehlt
insee 1-stellig 1 (Quelle)

Umstellungsplan

Ablauf

  1. Botbetreiber suchen (nur einfache Textersetzungen notwendig)
  2. Sobald Botbetreiber gefunden:
    1. Bot programmieren
    2. Erste Tests des Bots
  3. Wenn Freigabe des Bots vorliegt: Vorlage:Infobox französischer Kanton und Vorlage:Infobox französischer Kanton/Doku (Dokumentation muss mit Beginn der Umstellung aktuell sein) mit dem Quelltext von hier überschreiben
  4. Sobald Vorlage überschrieben, werden alle Kantonsartikel in der Kategorie:Vorlage:Metadaten Einwohnerzahl/Fehler landen (kann aber je nach Serverlast und Länge der Job queue eine Weile dauern, bis sie dort sichtbar sind)
  5. Unmittelbar nach Überschreiben der Vorlage startet der Bot und nimmt folgende Änderungen vor, wobei die Kategorie:Vorlage:Metadaten Einwohnerzahl/Fehler wieder kleiner wird:
    1. Wenn Parameter {{{nom}}} mit „Kanton“ beginnt oder auf „(Kanton)“ endet, soll dies jeweils entfernt werden. Ausdruck: 's/^Kanton (.*) \(Kanton\)$/$1/'
    2. Wenn Parameter {{{insee}}} ein Leerzeichen enthält und links und rechts davon je zwei Ziffern stehen, soll das Leerzeichen entfernt werden. Ausdruck: 's/^([0-9]{2}) ([0-9]{2})$/$1$2/'
    3. Parameter {{{km²}}} in maschinenlesbares Format umwandeln, aber nur wenn maximal zwei Nachkommastellen. Ausdruck: 's/^([0-9]+),([0-9]{1,2})$/$1.$2/'
    4. Parameter entfernen: {{{sans}}}, {{{date-sans}}}, {{{dens}}}, {{{rang}}}, {{{hect}}}
    5. Als Zugabe könnte der Bot noch die häufige Weiterleitung Regionen Frankreichs nach Region (Frankreich) auflösen, muss aber nicht sein
  6. Bei 3600 Artikeln und 5 Bearbeitungen pro Minute würde der Botlauf etwa 12 Stunden dauern. Währenddessen sind manuelle Eingriffe zu unterlassen.
  7. Unmittelbach nach Abschluss des Botlaufs wird in der ersten Infoboxzeile ({{#ifeq: {{Strleft| ...) durch Kanton {{{nom}}} ersetzt; dies ist nur ein temporärer Hack zur Vermeidung von Anzeigefehlern während der Umstellungsphase.
  8. Nachdem der Bot durchgelaufen ist, verbleiben in der Kategorie:Vorlage:Metadaten Einwohnerzahl/Fehler nur noch händisch abzuarbeitende Artikel, bei denen
    1. gar kein INSEE-Code angegeben ist (das werden ca. 200 sein) => nachtragen;
    2. der INSEE-Code falsch angegeben ist (im Voraus nicht abschätzbar) => korrigieren;
    3. der INSEE-Code im Prinzip richtig angegeben ist, aber der Name im Artikel nicht mit dem Namen in den Metadaten übereinstimmt; dies betrifft neben Schreibfehlern (im Voraus nicht abschätzbar) auch Sammelartikel (3 Stück zu erwarten) und alle nummerierten Kantone, bei denen in den Metadaten Namen wie Montluçon-Nord-Est (1er Canton), Nice 1er Canton, Romilly-sur-Seine 1er Canton stehen (max. 374 Stück zu erwarten); was mit diesen Fällen passieren soll, ist noch nicht geklärt.
  9. Fehlende km²-Angaben (ca. 900 Artikel) dürfen selbstverständlich im Rahmen dieser Aktion nachgetragen werden, haben aber keinen direkten Zusammenhang dazu (Zeitpunkt zum Nachtragen ist jetzt nicht günstiger als irgendwann sonst)
  10. Bei Kantonen in Überseegebieten werden die Metadatenvorlagen nicht genutzt (der Parameter {{{insee}}} ist aber trotzdem korrekt auszufüllen, damit die Infobox weiß, dass es sich um ein Überseegebiet handelt). Hier sind die Parameter {{{sans}}} und {{{date-sans}}} von Hand mit den aktuellen Werten (population municipale, nicht population totale) zu füllen:
Code Gebiet Kantone insgesamt Kantone mit Wikipedia-Artikel Kantone mit Wikipedia-Artikel und Infobox Liste Kategorie Navigationsleiste Datenquelle
971/GP Guadeloupe 40 40 40 Liste der Kantone auf Guadeloupe Kategorie:Kanton in Guadeloupe Vorlage:Navigationsleiste Kantone im Département Guadeloupe insee.fr
972/MQ Martinique 45 0 0 Liste der Kantone auf Martinique insee.fr
973/GF Französisch-Guayana 19 19 0 Liste der Kantone in Französisch-Guayana Kategorie:Kanton in Französisch-Guayana Vorlage:Navigationsleiste Kantone im Département Französisch-Guayana insee.fr
974/RE Réunion 49 4 4 Liste der Kantone auf Réunion Kategorie:Kanton in Réunion insee.fr
976/YT Mayotte 19 0 0 insee.fr

Offene Fragen

  • Parameter {{{rang}}} abschaffen? Wird relativ selten genutzt (224/3650 ≈ 6,1 %) und ist ziemlich unangenehm aktuell zu halten. Lohnt sich das überhaupt?
  • Fehlerbehandlung: Kategorie oder Linkliste? Vorschlag: Die bereits vorhandene Kategorie:Vorlage:Metadaten Einwohnerzahl/Fehler temporär „missbrauchen“
  • Namenskonventionen? Vorschlag: Wort „Kanton“ in deutscher Schreibweise + französischer Artikel, falls zutreffend (= Spalte „ARTMIN“ aus http://www.insee.fr/fr/methodes/nomenclatures/cog/telechargement/2008/txt/canton2008.txt) + Name (= Spalte „NCCENR“ aus http://www.insee.fr/fr/methodes/nomenclatures/cog/telechargement/2008/txt/canton2008.txt) + typografische Korrekturen (Apostrophe)
  • Nicht mehr benötigte Parameter aus den Artikeln entfernen oder einfach stehen lassen? Kandidaten:
    • {{{sans}}} + {{{date-sans}}} (vorhandene Werte werden nicht mehr stimmen; müssen aber bei Überseegebieten mit aktuellem Inhalt wieder eingetragen werden)
    • {{{dens}}} (vorhandene Werte werden nicht mehr stimmen; wird zukünftig automatisch berechnet, falls Fläche vorhanden)
    • {{{rang}}} (vorhandene Werte werden nicht mehr stimmen; wird zukünftig nicht mehr ausgewertet)
    • {{{hect}}} (redundant zu km², wurde nie ausgewertet). Widersprüche kommen bei folgenden Artikeln vor (Quelle):
Lemma hect km² Fehlerquelle
Arzacq-Arraziguet 18688 18,688 Komma an der falschen Stelle
Bozel 40.032 400,3 abweichende Genauigkeit
Lanslebourg-Mont-Cenis 61.885 618,8 abweichende Genauigkeit
Ugine 19.331 193,3 abweichende Genauigkeit
Obernai 1 378 93,9 ganz anderer Wert
Sélestat 13 529 132,59 Zahlendreher
Aubergenville 7858 78,85 Zahlendreher
Thiers 12.438 89,15 ganz anderer Wert
Lumbres 25 547 277,47 egal
  • Parameter {{{km²}}} optional machen?

Einzubauende Tests für die Übergangsphase

  • Beginnt {{{nom}}} mit dem Wort „Kanton“?
  • Stimmt {{{nom}}} mit dem Bezeichner in den Metadaten überein?
  • Ist {{{km²}}} numerisch?

Vorlage

Vorlage:Infobox französischer Kanton

Dokumentation

Vorlage:Infobox französischer Kanton/Doku

Wartung

Vorlage:Infobox französischer Kanton/Wartung