Benutzer Diskussion:MisterSynergy

aus Wikipedia, der freien Enzyklopädie
Zum Archiv
Wie wird ein Archiv angelegt?

Wikidata-Check

Hallo MisterSynergy, ich bin gerade auf diese recht spannende Diskussion gestoßen, und in dem Zusammenhang logischerweise auch auf dieses Modul im Beta-Wiki. Wie ist denn da der Stand, ist das hier schon irgendwo umgesetzt? Modul:Wikidata/ValueComparison existiert ja nicht, und die Vorlage {{WikidataCheck}} scheint weder erprobt noch genutzt zu sein. Meiner Auffassung nach hat eine solche Funktionalität enorm viel Potenzial, und in einigen Infoboxen sind eher händisch und hemdsärmelig solche Wikidata-Abgleiche umgesetzt (ich erinnere mich dabei an die {{Infobox Ort in den Vereinigten Staaten}}, in der ich das mangels besseren Wissens selbst ansatzweise umgesetzt habe). Wenn Du Zeit und Lust hast, können wir gern auch gemeinsam die letzte Meile zur Umsetzung und Erprobung gehen. ;-) Viele Grüße, Yellowcard (D.) 10:04, 23. Jun. 2020 (CEST)

PS: In diesem Zusammenhang spannend ist die Kategorie:Wikipedia:Abweichende Daten auf Wikidata. Gruß Yellowcard (D.) 10:05, 23. Jun. 2020 (CEST)
Hallo Yellowcard, nein, ich habe das bisher nicht zum Ende geführt und seit den letzten Einträgen in der Versionsgeschichte auch nicht mehr draufgeschaut. Natürlich bin ich weiterhin der Meinung, dass wir das haben sollten und dass das wertvoll ist, und irgendwann werde ich das auch nochmal weitertreiben, sofern das niemand anderes macht. User:PerfektesChaos hat bei der Entwicklung soweit mit einigem Input geholfen, aber irgendwann wurde mir das erstmal wieder zu dewiki-typisch bürokratisch und gerade das hat mir damals durchaus die Lust vertrieben, das direkt fertig zu machen. Die Entwicklung im betawiki ist ziemlich umständlich, und die Anforderungen für den Produktivbetrieb hier in dewiki sind recht hoch, weshalb das halt erstmal liegenblieb. (Beides hat nachvollziehbare Gründe, aber schränkt den Kreis der Entwickler für solche Funktionalitäten ziemlich heftig ein.)
Wie auch immer, ich würde eine Reaktivierung durchaus begrüßen und freue mich über jede weitere Beteiligung. Nach meiner Erinnerung war funktionell für den Identifikator-Vergleich alles wie gewünscht lauffähig, es müssten aber noch einige Entscheidungen hinsichtlich potenziell zukünftiger Erweiterungen getroffen werden und ggf. einige Funktionsnamen entsprechend angepasst werden. Soll ich mir den Status Quo nochmal genauer anschauen und das in der Lua-Werkstatt in dem Thema mal zusammenfassen? Bräucht so ein bis zwei Tage, glaube ich. Viele Grüße! ---MisterSynergy (Diskussion) 10:22, 23. Jun. 2020 (CEST)
Hallo MisterSynergy, Deiner Bewertung hinsichtlich Einstiegsaufwand solcher Umsetzungen kann ich nur zustimmen; ebenfalls der Tatsache, dass dies Vor- und Nachteile mit sich bringt. (In Modul:Wikidata habe ich selbst einige Funktionen umgesetzt, gerade dieses Modul hat aber den Nachteil, dass es sich in den jeweiligen Sprachversionen völlig verselbstständigt hat, was PC zurecht mehrfach kritisiert hat. Ebenso stimme ich ihm zu, dass es in erter Linie das Versagens Wikidatas ist, dass solche Module nicht dort zentral entwickelt und angeboten werden.)
Leider ist auch der globale Kreis an in Wikimedia-Projekten aktiven Lua-Entwicklern recht klein, soweit ich das beurteilen kann. Die Anmerkungen von PC sind sinnvoll und richtig; wenn eine zu perfektionistische Herangehensweise aber dazu führt, dass gute Ideen nicht realisiert werden, ist diese Herangehensweise in einem Wiki meines Erachtens nicht mehr geeignet. Gerade bei einem neuen Modul und einer quasi-neuen Vorlage (sowohl {{WikidataCheck}} als auch {{Wikidata-Check}} kann man in ihrem jetzigen Zustand einfach überschreiben, da ohne Mehrwert) sollte ein weniger perfekter Trial-and-Error-Ansatz den Zweck am Ende auch erfüllen, meine ich.
Dein Angebot, dass Du Dir den Status Quo noch einmal genauer anschaust und zusammenfasst, würde ich sehr gerne annehmen. Das ist schon wesentlich mehr, als ich bei meiner obigen Anfrage erhofft hatte... :-) Ich steige dann gern in die Diskussion ein und helfe bei der Entscheidungsfindung, ping' mich gerne einfach an. Großes Danke schon einmal! Viele Grüße, Yellowcard (D.) 10:32, 23. Jun. 2020 (CEST)
Ja, ich mache dass dann zeitnah in der Werkstatt-Diskussion.
Das Problem ist nach meinem Dafürhalten nicht dem Wikidata-Projekt anzulasten. Es gibt tatsächlich Module, die dort entwickelt werden und dann in die Projekte verteilt werden (sollen), aber letztlich ist jedes Projekt selbst für seinen Code, die notwendige Dokumentation und die einzuhaltenden Standards verantwortlich. Außerdem gibt es genug Benutzer, die dann halt lokale Modifikationen vornehmen, ohne sie für alle für die zentrale Version in Wikidata anzubieten.
Der ganze Bereich der Modul- und Vorlagenprogrammierung ist eigentlich Mist. Code-Entwicklung über wiki page revisions (statt zum Beispiel git), und praktisch nicht vorhandene Testmöglichkeiten sind ebenfalls alles andere als hilfreich. Aber leider haben wir nichts anderes, und alle Vorschläge zur Verbesserung sind bisher versandet. ---MisterSynergy (Diskussion) 10:39, 23. Jun. 2020 (CEST)
Okay, da habe ich vermutlich etwas zu vorschnell verurteilt – mir war gar nicht bewusst, dass Wikidata selbst Module bereitstellt. Vermutlich nutzen wir diese aber auch nicht so, wie wir könnten? Yellowcard (D.) 10:43, 23. Jun. 2020 (CEST)
Ein bekanntes Beispiel ist Modul:Cycling race. Der Code wird bei Wikidata entwickelt, und dann gelegentlich oder nach größeren Updates in zahlreiche Projekte rüberkopiert. Aber das ist dann halt eine echte lokale Kopie, keine direkte Einbindung von Wikidata oder so; damit können danach lokale Modifikationen vorgenommen wird, von denen bei Wikidata nichts ankommt -- und die beim nächsten Mal zum Frust der lokalen Benutzer überschrieben werden.
Soweit ich weiß, sind bloß einige Spezialbereich-Module derart im Einsatz. Eher allgemeiner Code wie etwa ein allgemeiner Identifikator-Abgleich wird meist lokal entwickelt, mit recht geringen Anforderungen (abgesehen von dewiki). Dadurch bleibt der ganze Lua-Bereich, auch und insbesondere im Zusammenspiel mit Wikidata, enorm hinter seinen Möglichkeiten zurück. Wie bereits erwähnt, halte ich aber die Grundarchitektur wie wir hier Code entwickeln und verwalten für falsch und ursächlich. ---MisterSynergy (Diskussion) 11:00, 23. Jun. 2020 (CEST)
Hallo MisterSynergy, hattest Du schon eine Gelegenheit, Dich mit dem Modul-Entwurf zu befassen? Möglicherweise ist es auch ein weiterer Ansatz, in dem Modul das Modul:Wikidata einzubinden; dieses bietet ja schon einige gut nutzbare Funktionen, die man für einen solchen Wikidata-Check ebenfalls bräuchte. Das würde vielleicht die Wartbarkeit etwas erleichern, oder übersehe ich etwas?
Vielleicht (falls Du Interesse hast, die Idee nochmal aufzunehmen), können wir auch einen einfachen Anforderungskatalog für eine solche Vorlage/Modul erstellen. So nutzt die {{Infobox Ort in den Vereinigten Staaten}} beispielsweise einen handgestrickten Wikidata-Check bzgl. der Einwohnerzahl eines Ortes; dabei aber unter der Bedingung, dass die Wartungskategorie nur gesetzt wird, wenn die Angabe in der Infobox älter als 2010 ist (mit inhaltlicher Begründung: 2010 war die letzte Volkszählung in den USA, diese Daten sind von hoher Qualität und daher bestimmten interpolierten Daten durchaus vorzuziehen). Derartige Anwendungsfälle gibt es bestimmt mehrere; und das Wikidata-Check-Modul stelle ich mir so vor, dass es solche Anwendungen flexibel ermöglicht, während es die Kommunikation mit Wikidata/Wikibase eher dem Modul:Wikidata überlässt. Was meinst Du dazu? Yellowcard (D.) 17:07, 26. Jun. 2020 (CEST)
Hallo Yellowcard, ich habe mir das mittlerweile angeschaut und selbst noch ein bisschen weitergemacht. Ist ja nicht so, dass ich nicht mehr weiterkommen würde; das Code-Schreiben an sich ist nicht das Problem, auch wenn meine Lua-Kenntnisse ziemlich bescheiden sind. Ich werde auch in dem Abschnitt in der Lua-Werkstatt in den nächsten Tagen noch etwas dazu schreiben, wie der Status Quo ist und was noch fehlt.
Das Modul soll Daten-Abgleich mit Wikidata machen – zunächst nur für Identifikatoren, weil das ein mittlerweile gefragter use-case ist. Das ganze kann dann mit wenig Aufwand in jede existierende Datenbanklink- oder Normdaten-Vorlage eingefügt werden (sofern eine entsprechende Wikidata-Eigenschaft existiert). Ausgabe des Moduls sind ausschließlich Wartungskategorien, wie etwa solche unter Kategorie:Wikipedia:Abweichende Daten auf Wikidata. Was das Modul im Kern ausmacht, ist die Implementierung einer für Identifikatoren (und später ggf. andere Datentypen) passende Vergleichslogik, die auch und insbesondere mit Situationen umgehen kann, in denen bei Wikidata kein Wert, unbekannter Wert, mehrere Werte, oder Werte mit missbilligtem Rang vorliegen.
Das Modul:Wikidata ist eher für Datenbezug (zur Anzeige im Artikel) gemacht, was ich hier aber gar nicht machen möchte. Ich sehe auch nicht, dass mir irgendetwas aus diesem Modul die Arbeit erleichtern würde. Nach derzeitigem Stand ist mein Modul gänzlich unabhängig von allen anderen Modulen. —MisterSynergy (Diskussion) 19:28, 26. Jun. 2020 (CEST)
Hallo MisterSynergy, super, ich freue mich auf Deine Ausführungen. Was die Anforderungen des Moduls angeht, haben wir schon dieselben Vorstellungen. Um eine Darstellung von Daten ging es mir gar nicht. Ich meinte lediglich, dass die claim-Funktion von Modul:Wikidata ja bereits einige Funktionalitäten zum Abrufen (zwecks Vergleich, auch individuell modifizierter Vergleich) bereithält -- mit dem Zweck, eine Wartungskategorie zu setzen oder eben nicht. In der Kategorie:Wikipedia:Abweichende Daten auf Wikidata ist ja schon einiges von mir, aber meist eben manuell in der jeweiligen Infobox realisiert.
Eine Frage bleibt mir noch, und zwar: Was verstehst Du in dem Zusammenhang unter Identifikatoren? Viele Grüße, Yellowcard (D.) 21:07, 26. Jun. 2020 (CEST)
Die claim-Funktion von Modul:Wikidata ist eigentlich schon viel zu komplex, um sie wiederzuverwenden. Es ist ja auch sonst nicht so schwierig, mit Lua über die Werte aller Aussagen einer Eigenschaft in einem Objekt zu loopen. An Qualifikatoren und Fundstellen sind wir für den Vergleich eh nicht interessiert.
Mit "Identifikatoren" meine ich alle Wikidata-Eigenschaften mit dem Datentyp "external-id". Das sind jene Eigenschaften, die im Web-UI unter "Identifikatoren" aufgelistet werden. In Wikipedia nutzen wir diese Art von Daten zurzeit vor allem in Datenbanklinks und Normdaten-Vorlagen wie Vorlage:Normdaten, um Weblinks zu bauen. Die Vergleichslogik ist recht Identifikator-spezifisch und sicherlich anders, als wie man beispielsweise Geo-Koordinaten, oder Zeit-Daten vergleichen würde. Wie ein sinnvoller Abgleich aussieht, hängt tatsächlich ziemlich von den Daten ab, die man gerade vergleichen möchte. —MisterSynergy (Diskussion) 21:48, 26. Jun. 2020 (CEST)
Hm, okay, dann gehen unsere Vorstellungen an der Stelle doch inhaltlich etwas auseinander. Mir schweben nämlich einerseits eher inhaltliche Vergleiche vor, also schon klassische Statements. Dies ist der Use-Case, den ich manuell bereits in {{Infobox Ort in den Vereinigten Staaten}} nutze und entsprechende inhaltliche Vergleiche anstelle. Das geht los bei recht simplen 1:1-Vergleichen wie dem Bürgermeister (Kategorie) und wird dann etwas komplexer mit der Einwohnerzahl (Kategorie und inhaltlich ähnliche Kategorie mit Artikeln, deren Einwohnerzahl gegenüber Wikidata abweichend ist aber unter der Bedingung, dass der Stand im Artikel vor der Datumsangabe in Wikidata sowie vor 2010 liegt (zweiter Parameter)). Da benötigt man also schon etwas mehr Logik und definitiv muss man auch die Qualifikatoren von Statements mit auswerten. Geht das über den von Dir angedachten Fall also deutlich hinaus? Yellowcard (D.) 22:57, 26. Jun. 2020 (CEST)
Für den Anfang geht das über meine Planungen deutlich hinaus, aber wenn die Identifikatoren richtig laufen und der Ansatz sich bewährt, dann wäre die logische Erweiterung eine Berücksichtigung anderer Datentypen. Das Bürgermeister-Szenario scheint durchaus machbar und für viele andere Sachen in gleicher Weise einsetzbar; die Einwohnerzahlen mit den Nebenbedingungen sind dagegen eher ein sonderbarer Spezialfall, bei dem ich spontan nicht bewerten kann, ob das auch hier rein passt. Nicht weil es technisch nicht ginge, sondern weil dann potenziell praktisch beliebig viele andere Spezialfälle auch berücksichtigt werden möchten und das alles evtl. zu sehr den Fokus verliert. Ich denke allerdings einmal darüber nach, ob das per Erweiterbarkeit irgendwie berücksichtigt werden kann. —MisterSynergy (Diskussion) 23:37, 26. Jun. 2020 (CEST)
Was die Einwohnerzahl angeht, kann man das abstrahieren: Der Inhalt eines Statements wird verglichen, die Wartungskat wird aber nur gesetzt, wenn für einen festgelegten Qualifikator dieses Statements eine weitere übergebene Bedingung zutrifft. Hier muss also entsprechend eine zweite Property angegeben werden sowie die Bedingung (das könnte Gleichheit oder Ungleichheit irgendeiner Art sein, sowie ein größer/kleiner-Vergleich für numerische und Datumswerte). Damit müsste man meiner Überlegung nach einen ganz großen Teil der Fälle abgedeckt haben.
Ich warte mal Deine "Zwischenanalyse" in der Lua-Werkstatt ab und schaue dann, wie ich damit am besten vorgehen könnte. Die Erweiterbarkeit des Moduls von Identifikatoren auf Statements im ersten Schritt sollte einfach sein, die Berücksichtigung um Qualfikatoren im zweiten Schritt ebenfalls nicht so schwer. Hierfür wären aber die über die claim-Funktion des Wikidata-Moduls eben Schnittstellen verfügbar, die man in einem neuen Modul nicht noch einmal realisieren (und warten) müsste, daher finde ich die Idee weiterhin bedenkenswert. Liebe Grüße, Yellowcard (D.) 09:41, 27. Jun. 2020 (CEST)

@MisterSynergy:, hab dir ne EMail geschickt--Ciao • Bestoernesto

@Bestoernesto: ich habe bisher nichts bekommen – auch nicht im Spamordner oder dergleichen. Du kannst im Zweifel auch direkt an mich mailen, meine E-Mailadresse findest Du auch meiner Benutzerseite. Viele Grüße! —MisterSynergy (Diskussion) 19:57, 10. Nov. 2021 (CET)
@MisterSynergy:, sehr seltsam. Habe meinerseits auch keine Unzustellbarkeits-Meldung erhalten. Vlt. liegt's am Leerzeichen am Ende nach .com. Hab's jetzt noch 2× ohne dem Leerzeichen versucht, beim 2.Mal mit bitte um Lesebestätigumg.--Ciao • Bestoernesto 21:25, 10. Nov. 2021 (CET)
PS: War ja direkt an dich, an deine Mailadresse von deiner Benutzerseite gesendet.--Ciao • Bestoernesto 21:28, 10. Nov. 2021 (CET)

MvP

Hallo MisterSynergy, zunächst ein gutes neues Jahr! Eine kleine Frage: Magst du vielleicht bei Gelegenheit mal Benutzer:MisterSynergy/Möglicherweise verstorbene Personen erneuern bzw. neu generieren (unter Erhalt der noch nicht abgearbeiteten Fälle/Kommentare von 2017)? Wäre sicher interessant und ich gehe davon aus, dass neben den bestehenden "Knacknüssen" wieder einiges an Fällen dazu kommen würde, die leicht abzuarbeiten sind. Gestumblindi 16:05, 3. Jan. 2021 (CET)

Hallo Gestumblindi, diese Anfrage hat mich in der Vergangenheit schon einmal erreicht, und es war nicht so einfach, diese Listen zu aktualisieren. Sie basieren letztlich auf sauberer Kategorisierung, was in praktisch allen Wikis außer dewiki häufig nicht vorzufinden ist.
Ich würde erstmal auf der MvP-Liste die Petscan-Abfragen im Wikidata-Abschnitt anschauen. Diese hier funktioniert zum Beispiel weiterhin und hat zurzeit über 600 Ergebnisse. Bei Interesse kann ich davon auch eine lokale Kopie anlegen, so dass die Fälle kommentiert werden können. Soweit ich weiß, werden Todesdaten aus den größeren Wikipedias mittlerweile sowieso regelmäßig nach Wikidata importiert. —MisterSynergy (Diskussion) 17:23, 3. Jan. 2021 (CET)
Vielen Dank für die Antwort; eine kommentierbare lokale Kopie würde für mich gut klingen! Auch aus Performancegründen, da PetScan-Abfragen gerne mal sehr lange dauern... Gestumblindi 17:32, 3. Jan. 2021 (CET)

HSDB

Hi, ich spreche Dich mal direkt mit einer Wartungsaufgabe an, die man elegant über WD lösen könnte... wenn dort die passenden Daten vorhanden wären :-/

Worum geht es? Wir haben Vorlage:HSDB, knapp 400× genutzt, bisher über die CAS-Nummer verlinkt. Diese Links sind seit geraumer Zeit down (siehe auch Wikipedia:Redaktion_Chemie/Knacknüsse#Datenbank_der_TOXNET_nicht_mehr_vorhanden!), die Datenbank gibt es so nicht mehr. Die eigentlichen Inhalte finden sich nun eingebettet in die PubChem-Datenbank, allerdings mit einer eigenen ID ( (P2062)) - beispielsweise für Vanillylaceton (synonym: Zingeron) hier.

Auf WD sind aber nur von 29 der rund 5000 Einträge die IDs vorhanden. Damit kann man nicht arbeiten. Die Datenbank an sich ist geschlossen, da ändert sich überhaupt nichts mehr, insofern wäre ein Einpflegen auf WD eine Einmal-Aktion.

Der URL-Formatierer und der Regex auf (P2062) stimmen übrigens auch nicht mehr, das ist jetzt https://pubchem.ncbi.nlm.nih.gov/source/hsdb/$1.

Leider habe ich nirgendwo eine Liste der IDs gefunden, die müsste man sich also besorgen. Vermutlich am leichtesten per Download von https://www.nlm.nih.gov/databases/download/hsdb.html - ich kriege das aber nicht hin.

Solltest Du es schaffen, die Daten dort abzuholen und mir als einfache Zuordnung Item-ID (oder (P662)) → (P2062) zur Verfügung zu stellen, würde ich (oder gerne auch Du direkt) sie auf WD via Quickstatements einpflegen. Anschließend wäre die Reparatur der hiesigen Vorlagen ein Klacks.

Ich hoffe, Du konntest mir folgen - und noch mehr, dass Du Lust und Zeit für sowas hast... Viele Grüße--Mabschaaf 20:43, 10. Mai 2021 (CEST)

Hallo Mabschaaf, ich konnte da was runterladen – bin aber noch nicht sicher, ob das brauchbar ist. Eine 451 MB große XML-Datei mit massig viel Text ist das. Würde Dir das helfen? —MisterSynergy (Diskussion) 21:30, 10. Mai 2021 (CEST)
Ich fürchte nein. Kannst Du daraus irgendwie die Zuordnung CAS-Nummer (oder PubChem CID) zu HSDB-ID extrahieren? Das würde ja reichen...--Mabschaaf 12:40, 11. Mai 2021 (CEST)
Sieht so aus, als wenn das darin enthalten ist. Ich suche zeitnah mal einen geeigneten XML-Parser raus, der mir das alles extrahiert. —MisterSynergy (Diskussion) 12:57, 11. Mai 2021 (CEST)
Ich habe nun die XML-Datei geparst bekommen:
  • 6060 Einträge, mit HSDB-ID identifiziert
  • 5934 haben eine zugeordnete CAS-Nummer
Als TSV-Daten (HSDB, CAS) kann ich Dir das Mapping zuschicken. Reicht das schon, oder soll ich da noch Wikidata-QIDs ergänzen? —MisterSynergy (Diskussion) 21:34, 14. Mai 2021 (CEST)
Wenn Du die QIDs ganz einfach ergänzen kannst, dann gerne. Sonst suche ich sie zusammen. Hast Du evtl. auch noch die Stichworte dabei, unter denen die Substanzen in HSDB geführt werden?--Mabschaaf 08:50, 15. Mai 2021 (CEST)
So, jetzt hab ich endlich Zeit dafür gefunden. Die TSV-Datei hat nun 4 Spalten: HSDB, CAS, Substanzname, WD-Objekt.
  • Die Daten habe ich aus dem offenbar letzten Datenbank-Release am 28. Oktober 2019 extrahiert.
  • Das WD-Objekt habe ich auf Basis der CAS-Aussagen bei Wikidata heute Abend gemappt.
  • CAS-Nummern und WD-Objekt fehlen in wenigen Fällen (dann steht dort "None" im Feld drin).
Soll ich das mal per Mailanhang rüberschicken? Schreib mir dazu bitte kurz eine Wikimail. —MisterSynergy (Diskussion) 22:09, 18. Mai 2021 (CEST)
Du hast Mehl.--Mabschaaf 22:59, 18. Mai 2021 (CEST)
Großen Dank! Leider habe ich wohl kurzfristig keine Zeit, damit weiter aktiv zu werden. Vielleicht am Wochenende.--Mabschaaf 21:00, 19. Mai 2021 (CEST)
Ich habe jetzt mal zwei Testedits gemacht [1] und [2]. Falls Du noch Verbesserungsvorschläge hast - gerne, sonst lasse ich den Batch durchlaufen. Insgesamt sind es 5734 eindeutige Zuordnungen (keine mit mehrfach vorhandener CAS-Nummer).
Was ich nicht verstehe ist, dass dieser Edit offenbar nicht ausreichend ist, um die Links hinter den IDs anzupassen. Muss das noch an einem anderen Ort geschehen oder schläft da einfach ein Server ziemlich gut?--Mabschaaf 11:55, 23. Mai 2021 (CEST)
  • Ich würde für das Datum "28 October 2019" die Eigenschaft (P577) nutzen und für (P813) stattdessen "10 May 2021" eintragen. Sonst okay.
  • Die URLs werden nicht sofort aktualisiert, manchmal dauert das ziemlich lang – oder passiert erst beim nächsten Edit am Datenobjekt. Das ist irgendwie so eine Hintergrundjob-Geschichte, technisch gesehen müssen wohl alle Objekt-Seiten "gepurged" werden oder so.
MisterSynergy (Diskussion) 12:39, 23. Mai 2021 (CEST)
ok, dann warten wir mal ab. Die Quellenangabe passe ich an. Danke nochmals.--Mabschaaf 13:21, 23. Mai 2021 (CEST)

Hallo MisterSynergy, ich hätte doch noch mal eine Nachfrage hierzu (wenn auch in völlig anderem Zusammenhang). Du hast oben geschrieben, dass Du einen geeigneten XML-Parser benötigst. Kannst Du mir verraten, welchen Du verwendet hast und ist der ggf. frei verfügbar? Ich hätte da nämlich noch ein anderes 1,3 GB-Datenbankfile... --Mabschaaf 17:23, 26. Jun. 2021 (CEST)

den hier, in einem Pythonskript —MisterSynergy (Diskussion) 20:16, 26. Jun. 2021 (CEST)


Olympedia - Vorlage:ProCyclingStats

Hallo,

ich sehe gerade, dass die Vorlage Olympedia parameterlos auf der Grundlage von Wikidata funktioniert. Wäre das auch bei der Vorlage PCS denkbar?

Vielen Dank im Voraus!--RikVII (Diskussion) 12:25, 15. Mai 2021 (CEST)

Hallo RikVII, das sollte grundsätzlich möglich sein, denn die genutzten Identifikatoren sind auch bei Wikidata verfügbar.
Die Schwierigkeit in diesem konkreten Fall liegt darin, dass die genannte Vorlage für drei verschiedene Szenarien (Fahrer, Teams, Rennen/Etappen) eingesetzt wird und der Code auch so schon recht komplex ist. Für Olympedia haben wir deshalb zum Beispiel eine separate Vorlage {{OlympediaWettbewerb}}.
Was wäre denn der konkrete Plan für einen Wikidata-Einsatz in dieser Vorlage? —MisterSynergy (Diskussion) 11:27, 18. Mai 2021 (CEST)
Hallo, wir verwenden die Vorlage ja bei Fahrern, Teams und Rennen jeweils in Weblinks. Dabei ergibt sich, dass man entweder die Id angeben kann oder einen Textfragment in der Url (peter-sagan). Die Id ist wohl unabänderlich, nicht aber die zexliche Url. Da verschiebt PCS durchaus die einzelne Seite und die Verwendung der Vorlage geht auf Error. Die Id umgekehrt muss regelrecht recherchiert werden, da bei dem Folgen der Verlinkung in der Url der Text erscheint und nicht die Id. Umgekehrt sehen ich, dass mehr und mehr in Wikidata die PCS-Id erscheint. Wenn man die Vorlage auf Wikidata zugreifen lassen würde, würde perspektivisch das Rumgesuche und nachträgliche korrigieren wegfallen. Allerdings muss ich einräumen, dass einzelne Nutzer wie bei Commons den einfachen Weg gehen werden, ohne zu überprüfen, ob er ein Ziel hat. Aber eine Option ohne Parameter, bzw. ohne den Parameter text oder Id wäre schon schön. Nur so ne Idee.--Radsportler.svg RikVII. my2cts  12:23, 18. Mai 2021 (CEST)
Ja, ich habe das ein bisschen angeschaut und das sieht alles recht ungeordnet aus. Bei PCS, bei Wikidata, und in Wikipedia. Jetzt bin ich etwas unentschlossen, wie man das am besten ändern könnte…
  • Bei PCS kommen wir nicht ran, da müssen wir nehmen was die anbieten.
  • Bei Wikidata gibt es immerhin separate Eigenschaften für Fahrer, Teams, und Rennen/Etappen. Blöderweise sind darin aber jeweils beide Identifikatortypen enthalten. Das ist kein best practice-Ansatz und sieht eher nach einem Relikt aus Anfangszeiten aus. Besser wäre es, wenn das erstmal separiert würde. Einen guten Teil davon könnte man automatisiert migrieren, sofern die Wikidata-Community damit einverstanden ist.
  • Bei Wikipedia ist alles in einer Vorlage drin, was besser in drei verschiedenen Vorlagen gemacht werden würde.
  • Datenabgleich würde man wohl am ehesten über ein Modul laufen lassen; für Datenbezug gibt es genug Erfahrung mit den anderen Vorlagen, die sowas schon machen.
  • Alternativ: bei Wikidata und Wikipedia alles lassen wie es ist, und den Datenbezug zusätzlich in die Vorlage integrieren.
Da muss ich erstmal drüber nachdenken. Im Radsportbereich sind die Dinge so sehr miteinander verdrahtet, dass man erstmal nach zahlreichen möglicherweise unerwünschten Nebenwirkungen von Migrationen Ausschau halten muss. —MisterSynergy (Diskussion) 14:34, 18. Mai 2021 (CEST)

Passende Vorlage suchen und finden: Suchfunktion und weitere Verbesserungen im Vorlagenassistenten

Hallo, du erhältst diese Nachricht, weil du in der Umfrage Technische Wünsche 2019 für den Themenschwerpunkt „Leichter mit Vorlagen arbeiten“ abgestimmt hast.

Die verbesserte Suchfunktion des Vorlagenassistenten im VisualEditor, dem Wikitext Editor 2017 und dem Wikitext Editor 2010 liefert ab jetzt nicht nur Treffer mit dem gleichen Anfangswort, sondern alle relevanten Vorlagen, die den eingegebenen Begriff im Titel enthalten.

Mit dem neuen „Zurück“-Button im VisualEditor wird es außerdem möglich, nach dem Auswählen einer Vorlage wieder zu der Vorlagensuche zurückzukehren. Auf diese Weise ist es leichter, solange im Suchfenster zu bleiben und in den Vorlagen zu stöbern, bis man eine passende gefunden hat, ohne, wie bisher, den Dialog vollständig schließen zu müssen.

Wenn Daten in die ausgewählte Vorlage eingegeben wurden und dann der Zurück-Button betätigt wird, erscheint nun außerdem eine Warnung. Sie dient dazu, dem Verlorengehen der eingegebenen Daten vorzubeugen.

Nicht zuletzt gibt es nun eine intuitive Möglichkeit im VisualEditor, eine Vorlage von einer Seite zu entfernen. Wenn man die Vorlage anklickt, erscheint neben dem „Bearbeiten“ eine neue „Löschen“-Option im Menü, wie es beispielsweise auch für Tabellen bereits der Fall ist.

Diese Neuerungen werden voraussichtlich am 7. Juli hier in der deutschsprachigen Wikipedia sowie auf einigen weiteren ersten Wikis aktiviert. Mehr Informationen gibt es auf den Projektseiten: Vorlagen suchen und einfügen und Vorlagen von einer Seite entfernen (VisualEditor). Rückmeldungen sind hier und hier willkommen. --Timur Vorkul (WMDE) 16:26, 6. Jul. 2021 (CEST)

Technische Wünsche: Umgang mit noch offenen Wünschen aus bisherigen Umfragen & nächste große Umfrage

Du erhältst diese Nachricht, weil du in einer der Umfragen Technische Wünsche über Projekte abgestimmt hast, um deren weiteres Vorgehen es hier geht.

In den vergangenen Monaten hat das Team Technische Wünsche evaluiert, wie gut die Arbeitsweise in Themenschwerpunkten funktioniert und wie sie noch verbessert werden kann. Die Überlegungen und daraus abgeleiteten Konsequenzen sind hier auf der Projektseite beschrieben.

In Kürze: Der neue Arbeitsmodus funktioniert insgesamt sehr gut, aber es ging bisher nicht so schnell voran wie geplant – aus verschiedenen Gründen. Um in Zukunft in den zwei Jahren pro Themenschwerpunkt mehr erreichen zu können, hat das Team nach reiflicher Überlegung beschlossen, wie mit den vier noch offenen Wünschen aus dem alten Arbeitsmodus umgegangen werden soll: Zwei Wünsche, die bereits umgesetzt, aber noch nicht auf allen Wikis bereitgestellt wurden, werden noch auf weiteren Wikis ausgerollt. Die anderen beiden Wünsche können im aktuellen Zustand noch nirgends bereitgestellt werden; an diesen beiden Wünschen wird das Team nicht mehr weiterarbeiten.

Weil es bei der Arbeit an den Themenschwerpunkten zu ein paar Monaten Verzögerung kam, verschiebt sich auch die nächste große Umfrage Technische Wünsche. Geplant ist sie nun für Januar 2022. Wer sie nicht verpassen möchte, kann sich per Newsletter erinnern lassen.

Eine kleinere, themenbezogene Umfrage gibt es trotzdem schon bald: Voraussichtlich ab dem 19. Juli kann darüber abgestimmt werden, in welchem Problembereich aus dem Themenschwerpunkt „Bessere Unterstützung von Geoinformationen“ das Team Technische Wünsche für Verbesserungen sorgen soll. Mehr Informationen dazu gibt es in Kürze auf der Projektseite. Auch daran kann man sich per Newsletter erinnern lassen. Es wäre toll, wenn sich viele beteiligen und die Information weitergeben.

Ausführlichere Informationen zum geplanten Vorgehen und den Gründen dafür gibt es wie gesagt auf der Technische-Wünsche-Projektseite. Feedback dazu bitte auf die dortige Diskussionsseite, damit alles an einer Stelle gesammelt werden kann.

-- Für das Team Technische Wünsche, Johanna Strodt (WMDE) 09:35, 7. Jul. 2021 (CEST)

Infobox Olympischer Wettbewerb

Hallo, Du hast damals diese Infobox erstellt. Es gibt den Parameter "Siegerzeit", in einigen Wettbewerben geht es aber um "Punkte". Könntest Du das bitte noch ergänzen? Danke, --Radsportler.svg Nicola - kölsche Europäerin 21:52, 10. Sep. 2021 (CEST)

Du wurdest auf der Seite Vandalismusmeldung gemeldet (2021-09-12T13:24:00+00:00)

Hallo MisterSynergy, Du wurdest auf der o. g. Seite gemeldet. Weitere Details kannst du dem dortigen Abschnitt entnehmen. Wenn die Meldung erledigt ist, wird sie voraussichtlich hier archiviert werden.
Wenn du zukünftig nicht mehr von diesem Bot informiert werden möchtest, trage dich hier ein. – Xqbot (Diskussion) 15:24, 12. Sep. 2021 (CEST)

Kannada

Kannada-Aktor wie Kannada-Schrift. 83.7.7.118 16:22, 10. Okt. 2021 (CEST)

Technische Wünsche: Grundlegende Verbesserung des Vorlagen-Dialogs kommt in Kürze

O-Töne zur Verbesserung des VE-Vorlagendialogs.png

Hallo, du erhältst diese Nachricht, weil du in der Umfrage Technische Wünsche 2019 für den Themenschwerpunkt „Leichter mit Vorlagen arbeiten“ abgestimmt hast. Danke dafür! In Kürze wird das letzte und umfangreichste Projekt in diesem Themenschwerpunkt umgesetzt.

Der Vorlagen-Dialog im VisualEditor und Wikitext Editor 2017 wird grundlegend verbessert: Die sichtbarste Neuerung ist die Seitenleiste, die nun auf einen Blick darstellt, welche Parameter für eine Vorlage zur Verfügung stehen. Zuweisen und entfernen lassen sich Parameter jetzt bequem über Auswahlkästchen, und beim Finden des richtigen Parameters unterstützt eine Suchmaske. Nicht zuletzt kann man über die Parameternamen in der Seitenleiste auf die entsprechenden Felder im Hauptdialog springen und so Zeit sparen. Genauer sind alle Änderungen auf der Projektseite beschrieben.

Voraussichtlich am 24. November werden diese verschiedenen kleinen und großen Änderungen nun auf mehreren Wikis, einschließlich der deutschsprachigen Wikipedia, bereitgestellt. Wie immer würde sich das Projektteam über Rückmeldungen auf der Diskussionsseite dieses Projekts freuen. -- Timur Vorkul (WMDE) 12:48, 24. Nov. 2021 (CET)

Vorlage:FISA

Ich habe gerade bei Glen Loftus festgestellt, dass aktuell bei der FISA wieder vierstellige ID-Nummern existieren, die seltsamen langen IDs in Wikidata führen ins Leere. --Geher (Diskussion) 17:43, 26. Nov. 2021 (CET)

Hallo Geher, ja das habe ich vor ein paar Tagen schon bemerkt und mich sehr geärgert.
Wir haben die Option, schnell und unkompliziert auf die alten numerischen Identifikatoren von Wikidata zurückzugreifen und damit erstmal die Links zu reparieren, ohne alle Seiten wieder anfassen zu müssen. Die alten Identifikatoren sind nämlich noch bei Wikidata vorhanden, sie sind meines Wissens unverändert zum Zustand vor Dezember 2020.
Mittelfristig stellt sich dann die Frage, inwiefern wir hier lokale Identifikatoren für fast alle oder alle Vorlageneinbindungen vorhalten wollen. Von mir aus können wir im Wesentlichen Wikidata-Datenbezug machen, ich könnte aber mit einem Botlauf auch einfach die alten Identifikatoren wieder einbauen.
Viele Grüße! —MisterSynergy (Diskussion) 19:58, 26. Nov. 2021 (CET)
Hallo Geher, nach einiger Zeit habe ich mir das hier doch einmal genauer angeschaut.
Tatsächlich ist FISA mittlerweile wieder komplett zurückgekehrt zu den numerischen Identifikatoren. Da wir die bei Wikidata noch haben, habe ich die Vorlage auf exklusiven Datenbezug von Wikidata umgestellt, so dass alle lokalen Parameter ignoriert werden. Damit sind die Profile erstmal wieder erreichbar.
Das ist natürlich kein optimaler Zustand, den wir lange beibehalten möchten. Soll ich die Identifikatoren mit dem Bot wieder alle lokal umstellen, oder wollen wir sie einfach und ein für alle Mal entfernen?
Viele Grüße! —MisterSynergy (Diskussion) 00:15, 26. Mär. 2022 (CET)
Tja, wenn die vermaledeiten versteckten Kategorien nicht wären, würde ich sagen, dass es eigentlich egal ist. Da wir aber die Wartungskategorien haben, bin ich dafür, dass die Identifikatoren mit dem Bot umgestellt werden. Es müsste also der Zustand vor der Umstellung der Identifikatoren wieder hergestellt werden. Gruß --Geher (Diskussion) 08:34, 26. Mär. 2022 (CET)
Die Wartungskategorien lassen sich auf die aktuelle Situation anpassen, einfacher sogar als die Identifikatoren. Letzters bekomme ich aber auch hin und ein bisschen Feintuning an der Vorlage wäre sowieso noch notwendig. Ich bereite aber jetzt erst einmal einen Botlauf vor und gebe in den nächsten Tagen Bescheid, wenn ich startklar bin. Viele Grüße! —MisterSynergy (Diskussion) 09:29, 26. Mär. 2022 (CET)

Schon mal vormerken: Vom 24.1. bis zum 6.2. findet die Umfrage Technische Wünsche statt

Frohes neues Jahr! Es gibt vieles, was man sich für 2022 wünschen kann: viele erfolgreiche Bearbeitungen, interessante Artikel, Gesundheit … und Verbesserungen an der Nutzbarkeit der Wikipedia und ihrer Schwesterprojekte!

Zu sehen ist ein Buchstabengitter, in dem die 16 verschiedenen Themenschwerpunkte der Umfrage Technische Wünsche 2022 versteckt sind. Darüber steht: „Der erste Begriff, den du siehst, bringt dir Glück im Jahr 2022“ und ein Zwinkersmiley. Darunter steht: „… und vielleicht in der Umfrage Technische Wünsche?“)

In Kürze ist es nämlich wieder so weit: Vom 24. Januar bis zum 6. Februar findet die Umfrage Technische Wünsche statt. Es wird wieder darüber abgestimmt, in welchem Bereich das Team Technische Wünsche (WMDE) zwei Jahre lang, in engem Austausch mit den deutschsprachigen Communitys, für Verbesserungen sorgen wird.

Du bist wieder herzlich eingeladen, mitzumachen! Es stehen 16 Themenschwerpunkte zur Wahl. Neu ist in diesem Jahr, dass du angibst, welche fünf davon dir am wichtigsten sind. Das Konzept ist auf der Umfrageseite genauer beschrieben. Dort finden sich auch Antworten auf häufig gestellte Fragen und einiges mehr. Auf der Diskussionsseite sind außerdem Fragen und Anregungen sehr willkommen.

Wir würden uns freuen, wenn du ab dem 24. Januar wieder dabei bist und auch anderen davon erzählst. Technikkenntnisse oder viele Bearbeitungen sind ausdrücklich nicht nötig, um teilzunehmen. -- Für das Team Technische Wünsche, Johanna Strodt (WMDE) 15:06, 6. Jan. 2022 (CET)

PS: Wenn du zu Beginn der Umfrage nochmal erinnert werden möchtest, kannst du mit dem folgenden Textschnipsel auf diese Nachricht antworten, und bekommst dann am 24. Januar eine Nachricht über das System:
{{ErinnerMich|24.1.2022}} Jetzt abstimmen in der Umfrage Technische Wünsche -- ~~~~

Zerbrochene Links

Kannst du das hier Benutzer:MisterSynergy/rrk-online/test bitte so anpassen, dass die beiden Rotlinks bei Missing event: und Invalid event: nicht innerhalb eines Weblinks stehen? Also den Link zur Webseite unterbinden oder beide von einander trannen? Die Seite löst sonst unnötig Lint-Fehler aus --Liebe Grüße, Lómelinde Diskussion 17:59, 9. Jan. 2022 (CET)

Puh, da muss ich einiges umbauen. Ich habe zurzeit nur wenig Zeit um mich darum zu kümmern. Ich lasse das mal hier stehen, damit ich es nicht wieder vergesse. Danke für den Hinweis und Viele Grüße! —MisterSynergy (Diskussion) 20:23, 9. Jan. 2022 (CET)
Es läuft ja nicht weg. Dankeschön. --Liebe Grüße, Lómelinde Diskussion 07:31, 10. Jan. 2022 (CET)
Denkst du noch daran, dass diese Fehler weiterhin bestehen? --Liebe Grüße, Lómelinde Diskussion 07:45, 31. Jan. 2022 (CET)

Umfrage Technische Wünsche: Der Gewinner steht fest

Vielen Dank, dass du bei der diesjährigen Umfrage mitgemacht hast. Gewonnen hat das Thema Wiederverwendung von Einzelnachweisen vereinfachen. Auf der Projektseite des Themenschwerpunkts werden in Zukunft alle wichtigen Schritte und Erkenntnisse dokumentiert. Wie das Ergebnis ermittelt wurde, ist auf dieser Seite detailliert beschrieben.

Mit diesem Themenschwerpunkt wird sich das Team Technische Wünsche für zwei Jahre beschäftigen und dort Verbesserungen umsetzen. Als Erstes ist eine Recherchephase vorgesehen, in der ermittelt wird, was die dringendsten Probleme in diesem Bereich sind.

Möglicherweise wunderst du dich, warum du schon wieder eine Nachricht auf deiner Diskussionsseite erhältst. Die Umfrage Technische Wünsche ist eine große Veranstaltung, die etwa einmal im Jahr stattfindet. Und je mehr Leute mitmachen, desto aussagekräftiger ist das Ergebnis. Jetzt wo die Umfrage vorbei ist, endet auch die Werbung für die Umfrage, aber: Um sicherzustellen, dass die Verbesserungen in diesem Bereich auch sinnvoll und nutzbar sind, ist das Projektteam auf Feedback angewiesen. Dazu wird es immer mal wieder Gelegenheit geben, beispielsweise wenn Rechercheergebnisse vorliegen, Ideen für Lösungsansätze oder auch fertige Funktionen. Wenn du diese und andere Meilensteine nicht verpassen möchtest, kannst du die Projektseite beobachten und/oder den Newsletter Technische Wünsche abonnieren.

Abschließend noch eine Bitte: Ein Ziel des Projekts Technische Wünsche ist es, die Meinungen und Vorstellungen möglichst vieler unterschiedlicher Personen aus verschiedenen Bereichen und mit unterschiedlichen Arbeitsweisen zu beachten. Schließlich soll die Software so weiterentwickelt werden, dass alle davon profitieren. Wir würden gerne erfahren, wie sich die Gruppe derjenigen, die an der Umfrage 2022 teilgenommen haben, zusammensetzt. Daher wäre es toll, wenn du dir etwa fünf Minuten Zeit nehmen könntest, um anonymisiert ein paar Fragen zu dir und zur Umfrage zu beantworten. Bei dem Fragebogen werden alle Vorgaben des Datenschutzes berücksichtigt. Jede einzelne Frage ist optional zu beantworten. Weitere Informationen dazu gibt es im Fragebogen selbst. Vielen Dank für deine Teilnahme!

– Für das Team Technische Wünsche, Johanna Strodt (WMDE) 14:02, 10. Feb. 2022 (CET)

3. Admin-Workshop: 12. April 2022, 20:00 Uhr

Logo der Administratoren

Online-Veranstaltung Einladung zum 3. Admin-Workshop

Der 3. Admin-Workshop findet Dienstag, 12. April, 20:00 Uhr online statt. Weitere Infos zur Teilnahme findest du im WikiProjekt Administratoren. Zukünftige Termine werden ebenfalls dort angekündigt.

Themen werden die Initiierung eines Mentoringprogramms zur Einarbeitung in Aufgabengebiete sowie der Ausbau des Admin-Handbuchs sein. Zudem werden wir über die Einführung eines Open-Source-Adminchats sowie aktuell anstehende Diskussionen sprechen.

Im Rahmen der AdminCon 2022 wurde der Wunsch geäußert die Zusammenarbeit unter den Admins zu intensivieren. Daraus hat sich dieses neue Format der regelmäßigen Online-Workshops ergeben.

Viele Grüße, Wnme

Verteiler zur einmaligen Einladung aller Admins zum neuen Veranstaltungsformat. Versendet via --MediaWiki message delivery (Diskussion) 12:20, 9. Apr. 2022 (CEST)

WP:Kat Zukunft

Hallo lieber MisterSynergy!

Per Zufall habe ich gesehen, dass du dich u.A. mit Bots auf Wikidata beschäftigst. Weil die Verknüpfungen zu Wikidata ein Kernaspekt in Wikipedia_Diskussion:WikiProjekt_Kategorien#Wikidata_und_die_Zukunft_des_Kategoriesystems_von_de:Wikipedia sind, wäre es besonders begrüßenswert, wenn ein Fachkundiger wie du einen Beitrag leisten könnte. Herzliche Grüße --Tom (Diskussion) 14:06, 26. Mai 2022 (CEST)

Hallo User:Tom, ich habe wenig Zeit und kann nicht die ganze verlinkte Diskussion lesen.
Aus meiner Sicht sollten durchaus einige Aufgaben vom Kategoriensystem nach Wikidata übertragen werden, insbesondere alles was mit der detaillierten Einordnung in eine inhaltliche Systematik zu tun hat. Ein sehr rudimentäres Basis-Kategoriensystem für Wartungszwecke und ggf. die Zuordnung zu Wikipedia-internen Fachbereichen würde aus meiner Sicht schon reichen.
Allerdings kann man den Autoren nicht vorschreiben, was sie tun und lassen sollen. Letztlich muss uns das aktuelle Kategoriensystem so sehr über den Kopf wachsen, dass mehr und mehr Benutzer es ignorieren und die Sachen anders und besser machen. Wikidata wäre da durchaus die richtige Plattform für. Solange es jedoch noch genug Benutzer gibt, die mit großem Einsatz am Kategoriensystem arbeiten, wird es uns unverändert erhalten bleiben – auch wenn viele das vielleicht eher als unnötige Doppelarbeit ansehen.
Alles weitere kann ich auf die Schnelle nicht kommentieren. Ich stehe aber gern für Rückfragen zur Verfügung, auch wenn es manchmal etwas dauern kann. Viele Grüße! —MisterSynergy (Diskussion) 01:54, 27. Mai 2022 (CEST)
Danke dir! Deine Meinung ist (auch als Kurznotiz) ein Baustein für das Stimmungsbild für die Zukunft. Das Katsystem wurde nicht dazu geschaffen, die Suchalgorhytmen von Google zu trainieren. Es soll unseren Zwecken dienen und nicht durch Atomisierung unbrauchbar werden. Siehe auch WD:WPK#476748 Kategorien. LG --Tom (Diskussion) 21:22, 28. Mai 2022 (CEST)
Weiß nicht, mit Google hat das alles nichts zu tun.
Im Grunde ist das simpel: das Kategoriensystem war halt von (fast) Beginn an verfügbar, und für lange Zeit die einzige und damit beste Lösung für das Problem. Deshalb wurde und wird das mit Verve von der Community entwickelt. Problem ist: so große Artikelmengen wie in dewiki (und mehr noch Commons bzw. enwiki) sind mit dem Kategoriensystem nicht so recht in den Griff zu bekommen – es war aber lange nicht absehbar, wie groß diese Wikipedias mal werden könnten. Den aktuellen Zustand kann man halt mit Wikidata wirklich besser in den Griff kriegen.
Im Einzelnen sind folgende Nachteile des Kategoriensystems zu berücksichtigen:
  • Technisch hat eine Kategorisierung keine semantische Bedeutung, d.h. wenn eine Seite (oder Kategorie oder eine Datei) kategorisiert ist, dann transportiert das allein rein formell keine nutzbare Bedeutung. Für jede Kategorie müssen wir deshalb zusätzlich per Konvention festlegen, welche Art von Relation die Kategorisierung auszeichnen soll. Wir machen das mit Kategorietypen wie "Objektkategorie", "Themenkategorie", etc., sowie darauf aufbauend Regeln für die weitere Unterkategorisierung, und außerdem Regeln für Transitivität der Kategorisierung. Das Kategoriensystem ist jedenfalls ein Moloch von Konventionen – deshalb gibt es da soviel Streit.
  • Schnittmengen aus unabhängigen Kategorien sind nicht besonders effizient zu ermitteln, weil die Datenstruktur das nicht hergibt. Petscan und ähnliche Tools machen sowas zwar, aber das ist eine ziemlich aufwändige Operation, die schnell an Grenzen stößt. Wir helfen uns dadurch, dass wir "Schnittmengenkategorien" in großer Zahl nutzen, aber das ist eine Krücke für sich.
  • Die Bezeichnung von Kategorien ist nur sehr aufwändig "einheitlich" zu halten. Auch hier sind viele Konventionen notwendig.
  • Es gibt häufig Bestrebungen, Kategorienstrukturen "einheitlich" über einen gewissen Themenbereich auszubreiten – aus Erfahrung ist das häufig wichtiger als die fachliche Korrektheit der daraus resultierenden Kategorisierungen.
Mit Wikidata hätte man diese eher konzeptionellen Probleme nicht (einige andere, eher praktische Probleme aber schon).
Viele Grüße! —MisterSynergy (Diskussion) 22:02, 28. Mai 2022 (CEST)
Hallo lieber MisterSynergy!
Deine Denkansätze hier und in WD:WPK#476748 Kategorien haben mir geholfen. Weißt, ich bin ein DV-Oldtimer der noch Lochkarten in der Hand hatte. Am Anfangs meines Berufslebens haben wir die damals als groß angesehen Datenmengen in "Tortenhauben" physisch transportiert, weil es schlicht nicht die Netze dafür gab. Es gab noch Magnetkontenkarten, 8″-Disketten, Bandlaufwerke und Fernschreiber. Der Aufwand für den DV-Prozess, der dahinter steht, wenn wir heute eine simple Googlesuche starten, hätte seinerzeit bei Siemens als Budgetpostion beim Vorstand zur Freigabe eingereicht werden müssen und wäre vermutlich als völliger Irrsinn abgelehnt worden. Heute sieht vieles anders aus und ich merke wie wichtig es ist, die Begrifflichkeiten zu komplexen Zusammenhängen zu syncronisieren, damit man nicht schon in der Orientierungsphase zu irgendwas ananeinder vorbei redet.
Wikipedia als Projekt hat seit Beginn evolutionäre Facetten. Dabei wird bewusst eine Verschwendung von "Work-Force" akzeptiert, die sich kein Wirtschaftsunternehmen leisten könnte. In alternativer Sichtweise sind wir Investoren, deren eingebrachtes Kapital ein Stück unserer Lebenszeit ist. Kapitalerhöhungen mit Neuinvestoren werden von Altaktionären äußert kritisch hinterfragt. Dennoch haben wir im Hinterkopf: „Wer nicht mit der Zeit geht, geht mit der Zeit.“ Man muss nach meiner Überzeugung für dieses Projekt die Bereitschaft für schmerzhafte Änderung mitbringen. Das Grundgesetz von "Jimbo-Moses" wagt kaum jemand öffentlich anzufassen; die später zur irgendwas beschlossenen Richtlinien schon. Politisches Sendungsbewusstsein, bezahltes Schreiben und was weiß ich für Motivationen haben ein unterschwelliges Misstrauen in "unserem Projekt" verbreitet. Mancher Altaktionär hat das Weite gesucht und das kann ich gut verstehen. Im Altersheim brauchen wir vielleicht auch eher professionelle Hilfe.
Lieber MisterSynergy! Nochmals mein Dank für deine Sichtweisen. Ja, ich bin dabei: wir brauchen mehr und professionelle Zahlen zu Kennwerten für das Content-Mangament-System von Wikipedia, damit man weiß wovon man spricht und nicht aneinander vorbeiredet. Herzliche Grüße --Tom (Diskussion) 10:10, 29. Mai 2022 (CEST)

Wikiläum-Tool

Hallo MisterSynergy, bei der Benutzung des von Dir erstellten Wikiläum-Tools bin ich heute auf einen Fehler gestoßen. Es wird der Benutzer:Zeno Gantner mit dem ersten Beitrag am 11.09.2002 angezeigt. In der Beitragsliste ist sein ältester Beitrag hingegen mit dem Datum 20.12.2002 angegeben. Hast Du eine Idee was nun korrekt ist und wo der Fehler liegt? Viele Grüße --JoeHard (Diskussion) 13:45, 11. Sep. 2022 (CEST)

Hallo JoeHard, in der Datenbank der deutschsprachigen Wikipedia finde ich einen Edit von User:Zeno_Gantner am 2002-09-11, 19:03:16 (UTC) mit der Zusammenfassungszeile verschoben nach "Rotbuche". Die zugehörige Seite mit der Seiten-ID 8789 ist allerdings nicht in der Datenbank zu finden, der Edit ist per Spezial:Weiterleitung/revision/6753598 nicht zugänglich. Das ist das erwartbare Verhalten, wenn die Datenbank fehlerhaft ist; es ist in diesem Fall auch normal, dass dieser seltsame Edit nicht in der Beitragsliste des betreffenden Benutzers oder in der Versionsgeschichte der betreffenden (mir unbekannten) Seite auftaucht.
User:Zeno_Gantner hat die Benutzer-ID 392. Andere Benutzer mit ähnlichen IDs haben um den 20. Dezember 2002 herum ihren ersten Edit getätigt. Es ist deshalb davon auszugehen, dass Zeno_Gantner sich ebenfalls im Dezember 2002 registriert hat und dann sehr zeitnah einen ersten Edit getätigt hat. Die Aktion vom 11. September 2002 dürfte von einem anderen Benutzer ausgelöst worden sein. Ich kann nicht identifizieren wer das war, und auch nicht was hier schiefgelaufen ist.
Als Toolautor kann ich da leider wenig machen – diese Fälle von Fehlern in der Datenbank sind selten, aber eben nicht unmöglich. Sie sind jedenfalls meist verschieden in ihrer Ausprägung und bedürfen einer manuellen Fehleranalyse, was nicht in einem Tool abzubilden ist. Viele Grüße! —MisterSynergy (Diskussion) 19:53, 11. Sep. 2022 (CEST)
Vielen Dank für Deine ausführliche Antwort. Das hilft mir erstmal weiter. Viele Grüße --JoeHard (Diskussion) 23:50, 11. Sep. 2022 (CEST)