Zielsetzung
- Die Einwohnerzahlen in den Infoboxen französischer Kantonsartikel sind auf dem Stand der Volkszählung von 1999 und sollen auf den Stand 2006 gebracht werden. Dies soll durch Einbindung der Vorlagen der Reihe Kategorie:Vorlage:Metadaten Einwohnerzahl FR geschehen. Die Metadatenvorlagen sind bei den Infoboxen Vorlage:Infobox Französisches Département, Vorlage:Infobox französisches Arrondissement und Vorlage:Infobox Gemeinde in Frankreich bereits im Einsatz und haben sich soweit bewährt.
- Die Bevölkerungsdichte wurde bisher über einen eigenen Parameter erfasst, dessen Werte bei Aktualisierung der Einwohnerzahlen nicht mehr stimmen würden, und soll in Zukunft aus Einwohnerzahl und Fläche berechnet werden, um diese Fehlerquelle für die Zukunft auszuschließen. Um dies zu ermöglichen, sollen die vorliegenden Flächenangaben einheitlich in das von der Parserfunktion #expr verlangte Rohformat gebracht werden.
- Da die Zuordnung der „Datensätze“ zu den Artikeln über den INSEE-Code läuft, ist das Verfahren anfällig für Verwechslungen. Ein falsch angegebener INSEE-Code kann zur Einbindung einer falschen Einwohnerzahl führen. Als zusätzliche Plausibilitätsprüfung soll der im Artikel angegebene Name mit dem in den Metadatenvorlagen hinterlegten Bezeichner verglichen werden. Zu diesem Zweck sollen die Namen soweit wie möglich mit den Metadaten in Übereinstimmung gebracht werden. Die redundante Eingabe des Wortes „Kanton“ soll entfallen.
Bestandsaufnahme
Parameter nom
Kantonsartikel insgesamt |
ca. 3650 |
100 %
|
nom irgendwie angegeben |
3623 (Quelle) |
99,2 %
|
nom beginnt mit „Kanton“ |
3573 (Quelle) |
Noch Regelfall, zu ändern
|
nom beginnt nicht mit „Kanton“ |
50 (Quelle) |
Fehlerquelle: „(Kanton)“ in Klammern hinten angefügt
|
Parameter km²
Kantonsartikel insgesamt |
ca. 3650 |
100 %
|
km² irgendwie angegeben |
2789 (Quelle) |
76,4 % (Viel zu wenig für einen Pflichtparameter)
|
km² besteht aus Ziffern, Komma, 1 oder 2 Ziffern |
2053 (Quelle) |
Komma durch Punkt ersetzen
|
km² besteht aus Ziffern, Komma, 3 oder mehr Ziffern |
3 (Quelle) |
Werte sind schon jetzt falsch (Komma an der falschen Stelle) => so lassen
|
km² besteht nur aus Ziffern |
657 (Quelle) |
so lassen
|
km² besteht aus Ziffern, Punkt, Ziffern |
11 (Quelle) |
so lassen
|
km² enthält Zeichen außer Ziffern, Komma und Punkt |
65 (Quelle) |
von Hand abarbeiten
|
Parameter insee
Kantonsartikel insgesamt |
ca. 3650 |
100 %
|
insee irgendwie angegeben |
3467 (Quelle) |
95,0 %
|
insee 6- und mehrstellig |
2 (Quelle) |
Problemfall: Sammelartikel wie Metzer Kantone. Infobox raus?
|
insee 5-stellig |
46 (Quelle) |
Fehlerquelle: unerwünschtes Leerzeichen zwischen Départements- und Kantonsnummer
|
insee 4-stellig |
3400 (Quelle) |
Regelfall
|
insee 3-stellig |
0 (Quelle) |
–
|
insee 2-stellig |
18 (Quelle) |
Fehlerquelle: vorangestellte Départementsnummer fehlt
|
insee 1-stellig |
1 (Quelle) |
–
|
Umstellungsplan
Ablauf
- Botbetreiber suchen (nur einfache Textersetzungen notwendig)
- Sobald Botbetreiber gefunden:
- Bot programmieren
- Erste Tests des Bots
- Wenn Freigabe des Bots vorliegt: Vorlage:Infobox französischer Kanton und Vorlage:Infobox französischer Kanton/Doku (Dokumentation muss mit Beginn der Umstellung aktuell sein) mit dem Quelltext von hier überschreiben
- Sobald Vorlage überschrieben, werden alle Kantonsartikel in der Kategorie:Vorlage:Metadaten Einwohnerzahl/Fehler landen (kann aber je nach Serverlast und Länge der Job queue eine Weile dauern, bis sie dort sichtbar sind)
- Unmittelbar nach Überschreiben der Vorlage startet der Bot und nimmt folgende Änderungen vor, wobei die Kategorie:Vorlage:Metadaten Einwohnerzahl/Fehler wieder kleiner wird:
- Wenn Parameter {{{nom}}} mit „Kanton“ beginnt oder auf „(Kanton)“ endet, soll dies jeweils entfernt werden. Ausdruck:
's/^Kanton (.*) \(Kanton\)$/$1/'
- Wenn Parameter {{{insee}}} ein Leerzeichen enthält und links und rechts davon je zwei Ziffern stehen, soll das Leerzeichen entfernt werden. Ausdruck:
's/^([0-9]{2}) ([0-9]{2})$/$1$2/'
- Parameter {{{km²}}} in maschinenlesbares Format umwandeln, aber nur wenn maximal zwei Nachkommastellen. Ausdruck:
's/^([0-9]+),([0-9]{1,2})$/$1.$2/'
- Parameter entfernen: {{{sans}}}, {{{date-sans}}}, {{{dens}}}, {{{rang}}}, {{{hect}}}
- Als Zugabe könnte der Bot noch die häufige Weiterleitung Regionen Frankreichs nach Region (Frankreich) auflösen, muss aber nicht sein
- Bei 3600 Artikeln und 5 Bearbeitungen pro Minute würde der Botlauf etwa 12 Stunden dauern. Währenddessen sind manuelle Eingriffe zu unterlassen.
- Unmittelbach nach Abschluss des Botlaufs wird in der ersten Infoboxzeile (
{{#ifeq: {{Strleft| ...
) durch Kanton {{{nom}}}
ersetzt; dies ist nur ein temporärer Hack zur Vermeidung von Anzeigefehlern während der Umstellungsphase.
- Nachdem der Bot durchgelaufen ist, verbleiben in der Kategorie:Vorlage:Metadaten Einwohnerzahl/Fehler nur noch händisch abzuarbeitende Artikel, bei denen
- gar kein INSEE-Code angegeben ist (das werden ca. 200 sein) => nachtragen;
- der INSEE-Code falsch angegeben ist (im Voraus nicht abschätzbar) => korrigieren;
- der INSEE-Code im Prinzip richtig angegeben ist, aber der Name im Artikel nicht mit dem Namen in den Metadaten übereinstimmt; dies betrifft neben Schreibfehlern (im Voraus nicht abschätzbar) auch Sammelartikel (3 Stück zu erwarten) und alle nummerierten Kantone, bei denen in den Metadaten Namen wie Montluçon-Nord-Est (1er Canton), Nice 1er Canton, Romilly-sur-Seine 1er Canton stehen (max. 374 Stück zu erwarten); was mit diesen Fällen passieren soll, ist noch nicht geklärt.
- Fehlende km²-Angaben (ca. 900 Artikel) dürfen selbstverständlich im Rahmen dieser Aktion nachgetragen werden, haben aber keinen direkten Zusammenhang dazu (Zeitpunkt zum Nachtragen ist jetzt nicht günstiger als irgendwann sonst)
- Bei Kantonen in Überseegebieten werden die Metadatenvorlagen nicht genutzt (der Parameter {{{insee}}} ist aber trotzdem korrekt auszufüllen, damit die Infobox weiß, dass es sich um ein Überseegebiet handelt). Hier sind die Parameter {{{sans}}} und {{{date-sans}}} von Hand mit den aktuellen Werten (population municipale, nicht population totale) zu füllen:
Offene Fragen
Parameter {{{rang}}} abschaffen? Wird relativ selten genutzt (224/3650 ≈ 6,1 %) und ist ziemlich unangenehm aktuell zu halten. Lohnt sich das überhaupt?
Fehlerbehandlung: Kategorie oder Linkliste? Vorschlag: Die bereits vorhandene Kategorie:Vorlage:Metadaten Einwohnerzahl/Fehler temporär „missbrauchen“
- Namenskonventionen? Vorschlag: Wort „Kanton“ in deutscher Schreibweise + französischer Artikel, falls zutreffend (= Spalte „ARTMIN“ aus http://www.insee.fr/fr/methodes/nomenclatures/cog/telechargement/2008/txt/canton2008.txt) + Name (= Spalte „NCCENR“ aus http://www.insee.fr/fr/methodes/nomenclatures/cog/telechargement/2008/txt/canton2008.txt) + typografische Korrekturen (Apostrophe)
- Nicht mehr benötigte Parameter aus den Artikeln entfernen oder einfach stehen lassen? Kandidaten:
- {{{sans}}} + {{{date-sans}}} (vorhandene Werte werden nicht mehr stimmen; müssen aber bei Überseegebieten mit aktuellem Inhalt wieder eingetragen werden)
- {{{dens}}} (vorhandene Werte werden nicht mehr stimmen; wird zukünftig automatisch berechnet, falls Fläche vorhanden)
- {{{rang}}} (vorhandene Werte werden nicht mehr stimmen; wird zukünftig nicht mehr ausgewertet)
- {{{hect}}} (redundant zu km², wurde nie ausgewertet). Widersprüche kommen bei folgenden Artikeln vor (Quelle):
Parameter {{{km²}}} optional machen?
Einzubauende Tests für die Übergangsphase
Beginnt {{{nom}}} mit dem Wort „Kanton“?
Stimmt {{{nom}}} mit dem Bezeichner in den Metadaten überein?
Ist {{{km²}}} numerisch?
Vorlage
→ Vorlage:Infobox französischer Kanton
Dokumentation
→ Vorlage:Infobox französischer Kanton/Doku
Wartung
→ Vorlage:Infobox französischer Kanton/Wartung