Benutzer Diskussion:Mabschaaf/WD-Konzept
Danke
Deine Anregungen halte ich für unumgänglich!--Hubertl (Diskussion) 22:50, 8. Jun. 2014 (CEST)
Well done!
Hallo Mabschaaf, sehr schön durchdachtes Konzept! Am wichtigsten finde ich die Referenz-Datenbank, die würde etliche Probleme lösen helfen, sowohl Wikidata verbessern als auch langjährige Wünsche für Wikipedia erfüllen...
- Bug 6933 - Automatic method of adding references (2006), Bug 6535 - Implementation of form driven bibliographic reference editing for wiki articles. (2006), Bug 20441 - using ISBN, DOI, URI, ... in references (ref element), Bug 39487 - need for all projects to have common DOI citation templates... (2012), Bug 46521 - Create a VisualEditor plugin tool to insert/edit references to Wikidata queries (2013)
- 57812 - Annotation tool that uses Wikidata concepts to annotate statements from books (2014)
- d:Wikidata:Project_chat/Archive/2014/03#Annotation_tool_that_extracts_statements_from_books_and_feed_them_on_Wikidata
- d:Wikidata:Periodicals task force
- d:Wikidata:Project_chat/Archive/2014/04#Tool_required_for_data_input_for_same_source
- d:Wikidata:Project_chat#Gadget_to_clone_references
- Das VisualEditor Team arbeitet an einem mw:Talk:VisualEditor/Design/Reference Dialog für das einfache Einfügen von refs, mit autofill per ISBN, DOI etc.
- en:Wikipedia:VisualEditor/Feedback/Archive_2014_2#Reusing references from a "pool" across all articles on the respective Wiki?
- Wikipedia_Diskussion:Helferlein/Artikelmonitor#Einzelnachweise/ref_Zahlen, Benutzer:Atlasowa/ref_stats
usw. Ich glaube viele wünschen sich diese Referenz-Datenbank! Nur wer soll sie bauen..? ;-) --Atlasowa (Diskussion) 20:03, 12. Jun. 2014 (CEST)
- Wer A zu Wikidata gesagt hat muss auch B zu den Konsequenzen sagen. Sprich: Wer für A Geld in die Hand genommen hat, wird entweder bei dem Status bleiben müssen, oder einen Plan brauchen, wieviele Mannjahre Programmierer es noch braucht bis Status B erreicht ist - und dafür eben auch in die Tasche greifen. Wer hier behauptet eigentlich, dass Geld knapp wäre?--Mabschaaf 20:18, 12. Jun. 2014 (CEST)
- Was sagen die Wikidata-Leute dazu?--Hubertl (Diskussion) 20:57, 12. Jun. 2014 (CEST)
- Hast du mal bei diesen seltsamen „Wikidata-Leute[n]“ nachgefragt, Hubertl? Ich war so frei und habe im Wikidata:Forum einen Hinweis hinterlassen, Mabschaaf. --Succu (Diskussion) 21:52, 8. Sep. 2014 (CEST)
- Was sagen die Wikidata-Leute dazu?--Hubertl (Diskussion) 20:57, 12. Jun. 2014 (CEST)
Einige Richtigstellungen
Das Konzept passt nicht zum technischen Setting von Wikidata. Quellen können in Wikidata bereits bei jeder Aussage unter den "Einzelnachweisen" hinterlegt werden. Das können URLs sein (z.B. Sterbedatum in d:Q175684) oder Publikationen in anderen Items (z.B. Kinder in d:Q2288279). Wenn die Quelle weiter spezifiziert werden soll mit Abrufdatum, Ausgabe, Seitenzahl kann man diese Eigenschaften noch hinzufügen. Diese Informationen stehen dann im allen Sprachversionen gleichzeitig bereit. Nur lokale Bezeichnungen müssen nachgetragen werden. Das heisst: für jedes Werk, das als Quelle gebraucht wird, kann ein eigenes Item angelegt werden und per Link angesteuert werden. Eine eigene Referenzendatenbank braucht es nicht. Eine semantische Datenbank wie Wikidata ist auch eine Referenzendatenbank. Einzelnachweise aus Wikidata können mit Hilfe von Modulen in Wikipedia übernommen werden. Sobald eine grössere Bibliothek ihren Katalog unter einer freien Lizenz veröffentlicht, können für Millionen möglicher Quellen Items angelegt werden.
Bot-Rechte werden jetzt schon in Wikidata sehr viel restriktiver vergeben als in der deutschsprachigen Wikipedia.
Dynamische Daten, wie Einwohnerzahlen, werden jetzt schon per Zeitstempel in Wikidata hinterlegt (z.B. d:Q104192). Aktualisierungen der Statistischen Ämter können per Bot eingelesen werden. Module sorgen dafür, dass in Wikipedia alle Anzeigen den aktuellen Stand verwenden. -- Pütz M. (Diskussion) 00:55, 13. Jun. 2014 (CEST)
- Dann ist ja eh alles in Ordnung, wozu macht sich Mabschaaf noch Gedanken um ein unkontrollierbares Ungetüm. Es ist auch wunderbar, dass man ein technisches Setting hat, welches natürlich ganz toll ist, nur die User sind nicht toll genug, das zu verstehen. Wenn man ein dreirädriges Auto erfindet und das zur Norm erhoben hätte (wobei das dritte Rad im Kofferraum ist), dann muss man halt alles dem Problem unterordnen, wie man die User dazu bringt, sich besser um ihren Gleichgewichtssinn zu kümmern und nicht jammern, warum sie ständig umfallen. --Hubertl (Diskussion) 23:42, 16. Jun. 2014 (CEST)
@Pütz M.:: Du schreibst oben folgendes: Sobald eine grössere Bibliothek ihren Katalog unter einer freien Lizenz veröffentlicht, können für Millionen möglicher Quellen Items angelegt werden.
- Welche ernstzunehmende Bibliothek wird ihren Katalag unter einer freien Lizenz veröffentlichen, welche es dann erlaubt, diese unter CC0 hinunterzustufen? Public Domain ist nicht CC0, USA ist nicht DACH. Eine Datenkompilation ist nicht einfach nur die Summe aller darin enthaltenen Daten.
- Hast du jemals schon persönlich in Verhandlungen gestanden mit einem Datenanbieter, um dessen Daten zu bekommen? In welcher freien Lizenz auch immer? Um ein Ergebnis zu erzielen, welches dann wirklich dauerhaft ist?
- Hast du schon eine Antwort auf meine Frage gegeben, ob du selbst schon jemals ein halbwegs großes kommerzielles Projekt in Eigenverantwortung umgesetzt hast? Dass du kein Projekt in Wikipedia umgesetzt hast, das weiß man. Aber das sagt vorerst einmal nichts. Du bist zu einem Zeitpunkt in Wikimedia eingestiegen, als die Grundfrage, ob Wikipedia ernstzunehmen ist, bereits beantwortet war. Die Zeit davor hast du nicht miterlebt, welches aber genau die Aufbauarbeit betrifft, welche zu unseren Beleg- und Quellenregeln überhaupt geführt haben. Das, was gerade in Wikidata passiert, führte in Wikipedia zur Diskussion vor 10 Jahren. Mit dem bekannten Ergebnis.
Das sind die Kernfragen, welche uns auf den Boden der Tatsachen zurückbringen. Es geht nicht darum, was alles sein könnte, es geht darum, was tatsächlich umsetzbar ist, wie man tatsächlich auch in der Außenwahrnehmung ernst genommen wird und was man tun muss, um nicht nur in der Theorie dieses Ziel zu erreichen. --Hubertl (Diskussion) 10:16, 16. Jul. 2014 (CEST)
- Ad "Welche ernstzunehmende Bibliothek": British Library (alles ab 1950), Deutsche Nationalbibliothek(alles bis derzeit 2012) stehen zum Download unter CC0 zur Verfügung. Andere Nationalbibliotheken (zuerst seit 2009 die schwedische, mindestens noch die spanische) haben ihre Daten ebenfalls unter CC0 gestellt, bieten aber "nur" eine API und/oder SRU bzw. SPARQL-Interfaces für Abfragen bereit. Ernstzunehmen ist das schon, die Frage ist, ob wirklich prophylaktisch (derzeit geschätzt) 20 Millionen CC0-Literaturreferenzen eingestellt werden sollten, oder ob nicht eine Abfrage genügt, die on-the-fly Referenzen anlegt, wenn entsprechendes recherchiert wurde. -- Thomas Berger (Diskussion) 19:13, 10. Sep. 2014 (CEST)
Schmunzel
Unter Benutzer:Mabschaaf/WD-Konzept#Umsetzung steht: „Einzelnachweise, die schon jetzt in stark strukturierter Form vorliegen (die also mit Vorlage:Literatur, Vorlage:Internetquelle etc. eingebunden sind) können problemlos per Bot nach WD transferiert werden und dort entsprechende Felder einer Datenbank füllen.“ Wie stellt der Bot eigentlich sicher, dass diese Angaben stimmen? Das ist nichts anderes was ständig kritisiert wird: die unreflektierte Übernahme von Daten aus Kategorien und Infoboxen.
Der direkte Weg funktioniert allerdings auch. Da ich mir selber vertraue habe ich genau diese Art von Information benutzt um die von mir im Rahmen dieses Literaturstipendiums verfassten Artikel auf Wikidata mit einem Einzelnachweis zu versehen. Gruß --Succu (Diskussion) 20:01, 8. Sep. 2014 (CEST)
- Zu unreflektierte Übernahme von Daten aus Kategorien und Infoboxen: Nicht ganz. Mein Konzept sieht ja vor, dass irgendjemand noch die Verknüpfung zwischen Referenz und Aussage erstellen muss. Derjenige ist natürlich in der Pflicht, die Referenz zu prüfen. Ein
Hill, S. 348
ist natürlich nicht ausreichend, weil nicht eindeutig und nicht nachvollziehbar. Erstellt jemand Fakes, muss man genauso reagieren wie jetzt in WP: Spezial:Nuke.--Mabschaaf 22:51, 8. Sep. 2014 (CEST)- Spezial:Nuke kann ich - mangels Berechtigung - nicht einsehen. Ist aber unwichtig. Das Feature „Sichten“ gibts nur in wenigen WPs. „irgendjemand“ könnte auch ein Bot sein, der weiß was er tut? --Succu (Diskussion) 23:10, 8. Sep. 2014 (CEST)
- Entschuldige, war mir nicht bewusst, dass schon das Einsehen Admin-only ist. Hier die Erläuterung dazu.
- „irgendjemand“ kann (für sehr begrenzte Aufgaben) auch ein Bot sein. Wenn jemand wie Du das gleiche Buch für 500 Aloe-Arten als Quelle verwendet, muss man natürlich dafür technische Hilfsmittel verwenden dürfen. Aber ganz klar steigt die Verantwortung mit der Anzahl der Edits. Was sollte aber geschehen, wenn man irgendwann bei diesen 500 Einträgen (bitte jetzt nicht persönlich nehmen) zwei Fehler findet? Dann müsste wohl alles komplett nachgeprüft werden. Was, wenn dann noch fünf Fehler auftauchen? Hm. Da wäre ich schon für ein festes Auf-die-Finger-klopfen. Die Grenzen müssten hier natürlich ausdiskutiert werden, aber so ein Botflag sollte dann auch schnell weg sein. Daher auch der Vorschlag, Massenedits zunächst für eine bestimmte Dauer zur Diskussion/Überprüfung zu stellen. Klar, das bremst das Wachstum von Wikidata. Aber letztlich muss Wikidata nicht schneller wachsen, als die vorhandenen Daten auch eingebunden werden.--Mabschaaf 23:36, 8. Sep. 2014 (CEST)
- Spezial:Nuke kann ich - mangels Berechtigung - nicht einsehen. Ist aber unwichtig. Das Feature „Sichten“ gibts nur in wenigen WPs. „irgendjemand“ könnte auch ein Bot sein, der weiß was er tut? --Succu (Diskussion) 23:10, 8. Sep. 2014 (CEST)
- „Aber ganz klar steigt die Verantwortung mit der Anzahl der Edits“ - Bei wem? Bei dem der den Mist ggf. aufräumen muß? --Succu (Diskussion) 00:01, 9. Sep. 2014 (CEST)
- Meinst Du die Frage ernst? Wenn es eine vernünftige Hürde gibt, um ein Botflag auf Wikidata zu erhalten und man es umgekehrt relativ zügig entzogen bekommt bei Murks-Edits, dann wird sich auch ein Botbetreiber gut überlegen, was er da tut. Es ist also nicht mehr und nicht weniger der Wert bzw. die Reputation des eigenen Accounts (ob Bot oder händisch), der auf dem Spiel steht.--Mabschaaf 09:48, 9. Sep. 2014 (CEST)
- „Aber ganz klar steigt die Verantwortung mit der Anzahl der Edits“ - Bei wem? Bei dem der den Mist ggf. aufräumen muß? --Succu (Diskussion) 00:01, 9. Sep. 2014 (CEST)
- Es ist kein Bot-Flag notwendig um automatische Bearbeitung auf Wikidata vorzunehmen. Du benutzt einfach den WikiData Remote editor. Damit kann man viel Gutes bewirken, aber eben auch fehlerhafte Bearbeitungen verzapfen. Damit kannst du in ein paar Wochen schnell mal 500,000 Bearbeitungen zusammen bekommen, die keiner mehr „händisch“ prüfen kann. Und das ist ein großes Problem.
- Um nochmal auf das Beispiel zurückzukommen. Ich kann nicht ausschließen, dass ich bei den 500 Bearbeitung zwei oder mehr Tippfehler bei den Seitenzahlen nach Wikidata übernommen habe. Bei den mit Das große Kakteen-Lexikon „bequellten“ Einträgen habe ich jedenfalls ein paar gefunden. Die Prüfung war dort einfach möglich, weil die Arten und Gattungen in diesem Buch alphabetisch angeordnet sind. Da musste man nur prüfen ob die Seitenzahlen aufsteigend waren. --Succu (Diskussion) 12:52, 9. Sep. 2014 (CEST)
- Von solchen aktionistischen und gleichsam unnötigen ABM-Maßnahmen zum Zwecke der automatisierten Auslagerung halte ich nichts. Bin davon nicht überzeugt, denn ich sehe in solchen Vorhaben mehr Korrekturaufwand in der Nacharbeit als wirklichen Vorteil für die enzyklopädischen WP-Artikel. Benatrevqre …?! 18:15, 21. Okt. 2014 (CEST)
- Der Zusatz „enzyklopädisch“ entwickelt sich langsam zu einem überflüssigen, weil leerem, Attribut. Benatrevqre, der Bezug von „aktionistischen und gleichsam unnötigen ABM-Maßnahmen“ ist mir unklar. Falls sich das auf mein Beispiel bezieht, dann stelle das doch bitte klarer dar. --Succu (Diskussion) 18:44, 21. Okt. 2014 (CEST)
- Nein, ich bezog mich auf die umseitig beschriebene Einzelnachweise-nach-WikiData-auslagern-ABM, die ich als Unfug empfinde. Gruß Benatrevqre …?! 18:49, 21. Okt. 2014 (CEST)
- Der Zusatz „enzyklopädisch“ entwickelt sich langsam zu einem überflüssigen, weil leerem, Attribut. Benatrevqre, der Bezug von „aktionistischen und gleichsam unnötigen ABM-Maßnahmen“ ist mir unklar. Falls sich das auf mein Beispiel bezieht, dann stelle das doch bitte klarer dar. --Succu (Diskussion) 18:44, 21. Okt. 2014 (CEST)
- Von solchen aktionistischen und gleichsam unnötigen ABM-Maßnahmen zum Zwecke der automatisierten Auslagerung halte ich nichts. Bin davon nicht überzeugt, denn ich sehe in solchen Vorhaben mehr Korrekturaufwand in der Nacharbeit als wirklichen Vorteil für die enzyklopädischen WP-Artikel. Benatrevqre …?! 18:15, 21. Okt. 2014 (CEST)