Wikiup Diskussion:Importwünsche
Lua-Fehler in package.lua, Zeile 80: module 'strict' not foundLua-Fehler in package.lua, Zeile 80: module 'strict' not found[[:]]
Archiv |
Zur Archivübersicht |
Wie wird ein Archiv angelegt? |
Frage zu einem möglichen Nachimport
Liebe Mitarbeitende,
der Artikel World Courts of Women wurde 2012 aus en.Wikipedia importiert. Sehe ich das richtig? Wenn ich nun eine neue und verstehende aktuelle Übersetzung für die deutschsprachige Wikipedia machen möchte, muss dann ein Nachimport beantragt werden? Gruß, --Fiona (Diskussion) 10:10, 3. Jul. 2022 (CEST)
- Wenn du auf die bereits importierte Version von 2019 aufbauen willst: Nein, denn die steht schon in der Versionshistorie. Wenn du auf die aktuelle englische Version aufbauen willst: Ja, denn die Versionen seit 2019 sind nicht in der Versionshistorie. Wenn das technisch geht, wären ggf. nur die Differenzversionen nachzuimportieren. Die Versionshistorie kann dann aber niemand mehr nachvollziehen. MBxd1 (Diskussion) 10:31, 3. Jul. 2022 (CEST)
- Danke dir. --Fiona (Diskussion) 12:22, 3. Jul. 2022 (CEST)
Technisches Problem bei übergroßen Dateien
Hallo, liebe Kollegen!
Ich habe heute versucht, den Importwunsch bzgl. der Liste_der_Orte_mit_Stolpersteinen zu bearbeiten. Es ist mir nicht gelungen. Mit den mir zur Verfügung stehenden Mitteln gelingt es mir nicht, die Quelldatei zu exportieren. Von des 3367 Versionen des Artikels ist es mir nach mehreren Versuche gelungen, die ersten 972.401 kB (also ein knappes Gigabyte) der Quelldatei zu exportieren, die 2374 Versionen bis zum 8. März 2019 beinhaltet. Ich habe keine Ahnung, wie groß die Quelldatei tatsächlich ist. Wie ich an die verbleibenden knapp 1.000 Versionen kommen soll, ist mir bisher nicht klar.
Ist es bei Euch auch so, daß auch Brackenheims Importtool bei sehr großen Exportdateien scheitert? Meine Erfahrung ist, daß oberhalb einer – von mir jetzt nicht exakt bezifferbaren – Dateigröße der Export einfach abbricht, und zwar stets an der Grenze einer Version. Die – unvollständige – Datei endet also stets mit </revision>
. Versuche ich dann den gleichen Export erneut, wird eine größere Datei übertragen – mit zu Beginn deutlich höheren Übertragungsraten, so als würde erst ein Caché abgerufen, dann später wieder „neue“ Daten mit entsprechend geringeren Übertragungsraten. Das funktioniert bisweilen auch mehrfach, aber irgendwann wird die Dateigröße dann wieder kleiner, weswegen ich dann bisher diese Versuche immer abgebrochen habe.
Als mir das zum ersten Mal passiert ist, konnte ich die verbleibenden 75 Versionen mit dem Export-Tool des Hexers in zwei Downlaods herunterladen. Mit den hier in Rede stehenden knapp 1.000 Versionen wird das nicht klappen. Meine Versuche, das mit der finalen Einstellung „5“ oder „10“ beim Hexer-Tool (default ist „25“) zu starten, haben meinen Rechner für mehrere Minuten lahmgelegt, am Ende aber tatsächlich nur zu fünf bzw. zehn heruntergeladenen Versionen geführt (lt. Anleitung sollte es das zehnfache sein; aber damals hat der Hexer wohl auch nicht mit Artikeln gerechnet, bei denen jede Version ein dreiviertel MB groß ist). Das mache ich jetzt nicht noch 990mal.
BTW: Wir sollten dafür sorgen, daß alle Infos zu Thema „Importwünsche“ an einer zentralen Stelle zur Verfügung stehen: Als ich heute morgen versucht habe, den Importwunsch abzuarbeiten, und gescheitert bin, habe ich einen Link auf das Export-Tool von PerfektesChaos gefunden. Leider mußte ich meinen FireFox neu starten, nachdem er aus den o.g. Gründen stehengeblieben ist, und der Link ist weg. Ich finde ihn auch – nach einem harten Tag auf dem Boot, abends um halb zwölf – momentan nicht wieder ... vielleicht sollten wir wirklich eine zentrale Seite bzgl. Importen einrichten.
Ich schlage ein weiteres Mal vor – vielleicht ausgehend von Benutzer:M.ottenbruch/Versionsimport – eine zentrale Dokumentation für Importe einzurichten.
Mindestens sollte es eine Stelle geben, an der die verschiedenen Tools mit ihren Vor-und Nachteilen miteinander verglichen werden.
Und außerdem würde ich mich sehr freuen, wenn jemand eine Lösung für den Importwunsch hätte und mir erklären könnte, wie ich bei „übergroßen Dateien“ zielführend vorgehen kann. --M.ottenbruch ¿⇔! RM 23:54, 6. Aug. 2022 (CEST)
- @M.ottenbruch: die Frage stellt sich hier gar nicht erst, denn es wird NUR importiert, wenn die Schöpfungshöhe erfüllt ist. Bei beinahe reinen Listen oder Tabellen ist dies nicht der Fall. Copy und Paste oder Cut und Paste sind hier ausreichend. Danke sehr, – Doc Taxon • Disk. • 00:46, 7. Aug. 2022 (CEST)
- Das kann man sicher so sehen. Das beantwortet aber nicht meine grundsätzliche Frage, wegen derer ich hier auf der Disk-Seite nachfrage: Kennt hier jemand eine Möglichkeit, wirklich große *.xml-Dateien aus irgendeiner WP zu exportieren?
- Ist jemand bereit, das Tool seines Vertrauens bsplsw. an en:Mass_killings_under_communist_regimes oder an Liste der Orte mit Stolpersteinen auszuprobieren?
- Wenn derjenige dann genauso auf die Fresse fällt wie ich, können wir dann vielleicht noch einmal ernsthaft darüber reden, daß wir ein technisches und ein Dokumentations-Problem haben?
- Ich frage ja nur. -- M.ottenbruch ¿⇔! RM 01:43, 7. Aug. 2022 (CEST)
- @M.ottenbruch: wolltest Du die Versionen unter die Versionen von Stolpersteine in Deutschland drunterschieben? – Doc Taxon • Disk. • 01:50, 7. Aug. 2022 (CEST)
- Ach so, der Export selbst scheitert bei Dir? – Doc Taxon • Disk. • 01:56, 7. Aug. 2022 (CEST)
- Davon rede ich die ganze Zeit.
- Den Rest hätte ich mit dem Fragenden geklärt.
- Aber >3.500 Versionen und >1GB an xml-Datei; das hatte ich noch nicht. Und meine Hardware/Anbindung/whatsowver scheitert daran.
- Deswegen frage ich, ob da jemand eine Lösung weiß.
- Was sollte ich denn sonst tun? -- M.ottenbruch ¿⇔! RM 02:27, 7. Aug. 2022 (CEST)
- Anders – oder noch einmal – gefragt: Kannst Du en:Mass_killings_under_communist_regimes oder Liste der Orte mit Stolpersteinen exportieren, und wenn ja, wie? -- M.ottenbruch ¿⇔! RM 02:53, 7. Aug. 2022 (CEST)
- Ja, funktioniert, dauert aber. Wie man das macht, hatten wir doch aber schon mal diskutiert. Ich such mal ... – Doc Taxon • Disk. • 07:55, 7. Aug. 2022 (CEST)
- nee, find ich gerade nicht --- da ich nicht weiß, wie Du in der Regel vorgehst, weiß ich auch nicht, ob meine Antwort für Dich hilfreich sein kann, denn ein eigenes Tool verwendest Du wohl nicht:
- Ja, funktioniert, dauert aber. Wie man das macht, hatten wir doch aber schon mal diskutiert. Ich such mal ... – Doc Taxon • Disk. • 07:55, 7. Aug. 2022 (CEST)
- Ach so, der Export selbst scheitert bei Dir? – Doc Taxon • Disk. • 01:56, 7. Aug. 2022 (CEST)
- @M.ottenbruch: wolltest Du die Versionen unter die Versionen von Stolpersteine in Deutschland drunterschieben? – Doc Taxon • Disk. • 01:50, 7. Aug. 2022 (CEST)
- Export:
- Ich verwende ein eigenes Tool, das bei mir lokal läuft.
- Beim Download der Versionen zerlegt es mir den Content in xml-Exportdateien, die nicht größer als 100 MB sind.
- Exportdateien können auch deutlich mehr als 1000 Versionen beinhalten, wenn sie < 100 MB bleiben.
- Import-Upload:
- Je nachdem, wie groß der Content ist, entstehen dabei mehrere xml-Dateien, die man nacheinander, von der ältesten Version an, importieren kann.
- Damit bei größeren Importen keine Abbrüche passieren, ist es sinnvoll, die aktuelle Version des zu importierenden Artikels per Hand aufs Ziellemma zu speichern, wenn dieses noch nicht existiert.
Liebe Grüße, – Doc Taxon • Disk. • 08:25, 7. Aug. 2022 (CEST)
- @Doc Taxon: Die letzten drei Punkte sind mir durchaus geläufig – siehe auch die oben schon verlinkte Anleitung Benutzer:M.ottenbruch/Versionsimport. Ich nutze bisher – wie oben beschrieben – Brackenheims Tool; wenn das scheitert, versuche ich mit dem Export-Tool des Hexers nachzuarbeiten, was aber nur bei kleinen verbliebenen Resten sinnvoll ist. Was Das Tool von Benutzer:PerfektesChaos angeht, so habe ich mittlerweile meine diesbezügliche Diskussion mit ihm wiedergefunden – von daher ist also keine Hilfe zu erwarten. Wärest Du bereit, mir Dein Tool zur Verfügung zu stellen? -- M.ottenbruch ¿⇔! RM 19:51, 8. Aug. 2022 (CEST)
- P.S. Meinst Du mit: „hatten wir doch aber schon mal diskutiert“, vielleicht diese Diskussion? -- M.ottenbruch ¿⇔! RM 20:00, 8. Aug. 2022 (CEST)
Spezial:PermaLink/225457681
@M.ottenbruch: IMHO war es hier komplett unnötig einen Nachimport durchzuführen, da der Inhalt keine Schöpfungshöhe aufweist. Kannst du das rückgängigmachen? --Leyo 21:08, 3. Sep. 2022 (CEST)
- Welchen Vorteil hätte es Deines Erachtens, wenn man das rückgängig machte? -- M.ottenbruch ¿⇔! RM 06:27, 5. Sep. 2022 (CEST)
- IMHO wird da u.a. ein falscher Eindruck vermittelt. Von den 275 importierten Versionen sind nur die letzten 11 überhaupt (potentiell) relevant. Doc Taxon etwa hat schon diverse Importwünsche abgelehnt, bei welchen die Lage bezüglich SH IMHO weniger klar war. --Leyo 09:55, 5. Sep. 2022 (CEST)
- Welcher „falsche Eindruck“ wird denn da vermittelt? Wenn ich nur die letzten 11 Versionen vor der Auslagerung importiert hätte, dann würde in der Tat der falsche Eindruck vermittelt, der Nutzer, der als erster im Artikel über Perfluoroctansäureverbindungen geschrieben hat, hätte den ganzen Artikel geschrieben. Das kannst Du nicht ernsthaft wollen. Daß Doc Taxon diesbezüglich einen sehr restriktiven Standpunkt vertritt, ist mir bekannt. -- M.ottenbruch ¿⇔! RM 20:47, 5. Sep. 2022 (CEST)
- Natürlich nicht. Daher ist mein Vorschlag, alle importierten Versionen zu löschen. Gibt es weitere Meinungsäusserungen dazu? --Leyo 23:26, 5. Sep. 2022 (CEST)
- Ja, ihr liegt beide richtig. Wenn nur die inhaltlich übernommenen Versionen nachgewiesen werden, also z. B. die fraglichen 11 Versionen, ist der Anspruch auf Urhebernennung erfüllt. Wenn die komplette Versionsgeschichte importiert wird, ist er auch erfüllt und alles insgesamt nachvollziehbar - auch für die deutschsprachige Version Bedeutungsloses. Beide Varianten sind in Ordnung und haben kleine Nachteile. Allgemein wird es unklarere Fälle geben, in denen ein Heraussuchen der wesentlichen Versionen kaum zweckmäVorlage:SSig ist und im Zweifel eher die komplette Versionsgeschichte übernommen wird. Immerhin, auch zwischen 'kein Import mangels Schöpfungshöhe' und 'Import' gibt es knappe Entscheidungen. So oder so wird kein erheblicher Schaden angerichtet. Ein nachträgliches Löschen bestimmter bereits importierter Version erscheint als Erschwerung der Nachvollziehbarkeit, darauf würde ich spontan anraten zu verzichten. --Holmium (d) 23:51, 5. Sep. 2022 (CEST)
- Bitte achtet darauf, wann Ihr importiert. Es gibt keine urheberrechtliche Grundlage, Autoren zu nennen, wenn der Inhalt der Übernahme keine oder eine zu niedrige Schöpfungshöhe aufweist. Ein Import in diesem Fall weist eine Reproduktion der entsprechenden Versionen auf, die sich sowohl serverseitig als auch in Datenbankduplikaten bemerkbar machen. Solche unnötigen Belastungen sollten wir vermeiden. Das ist wirklich nicht schwer, sich Quelle und Ziel oder Zielwunsch anzuschauen und sinnvoll zu bewerten, bevor man einen Versionsimport erwägt. Eher sollten wir darüber nachdenken, die Krücke mit den Versionsimporten mal zu überdenken, stets reicht eine Liste der Autoren aus, genauer sogar eine Liste der Autoren, die schöpfungshohe Beiträge im Artikel geleistet haben. Ein Link auf eine solche Liste reicht meiner Meinung nach jedoch nicht aus, da das Linkziel dieser Liste im Nachhinein gelöscht oder ohne Umleitung verschoben werden könnte. Also Liste kreieren, hinzufügen, fertig, mehr muss urheberrechtlich nicht getan werden, um dem by-Attribut der CC-by-sa-Lizenz gerecht zu werden. Danke sehr, – Doc Taxon • Disk. • 00:18, 6. Sep. 2022 (CEST)
- Nebenbemerkung off topic: «wenn der Inhalt der Übernahme keine oder eine zu niedrige Schöpfungshöhe aufweist» → da fällt der Bot mit seinen automatisierten und des öfteren unnötigen Importanträgen auf. --Holmium (d) 09:44, 6. Sep. 2022 (CEST)
- @Holmium: dieser Bot schaut bei Neuanlagen in die Versionsgeschichte, ob diese mit "Inhaltsübersetzung" markiert ist. Da der Bot nicht übersetzen und somit keine Textübernahme-Menge berechnen kann, wird der Fall zur Überprüfung an die Importeure übergeben, sprich: ein Importantrag gestellt. Für eine eventuelle Optimierung bitte @Luke081515 ansprechen. Liebe Grüße, – Doc Taxon • Disk. • 07:29, 13. Sep. 2022 (CEST)
- Nebenbemerkung off topic: «wenn der Inhalt der Übernahme keine oder eine zu niedrige Schöpfungshöhe aufweist» → da fällt der Bot mit seinen automatisierten und des öfteren unnötigen Importanträgen auf. --Holmium (d) 09:44, 6. Sep. 2022 (CEST)
- Bitte achtet darauf, wann Ihr importiert. Es gibt keine urheberrechtliche Grundlage, Autoren zu nennen, wenn der Inhalt der Übernahme keine oder eine zu niedrige Schöpfungshöhe aufweist. Ein Import in diesem Fall weist eine Reproduktion der entsprechenden Versionen auf, die sich sowohl serverseitig als auch in Datenbankduplikaten bemerkbar machen. Solche unnötigen Belastungen sollten wir vermeiden. Das ist wirklich nicht schwer, sich Quelle und Ziel oder Zielwunsch anzuschauen und sinnvoll zu bewerten, bevor man einen Versionsimport erwägt. Eher sollten wir darüber nachdenken, die Krücke mit den Versionsimporten mal zu überdenken, stets reicht eine Liste der Autoren aus, genauer sogar eine Liste der Autoren, die schöpfungshohe Beiträge im Artikel geleistet haben. Ein Link auf eine solche Liste reicht meiner Meinung nach jedoch nicht aus, da das Linkziel dieser Liste im Nachhinein gelöscht oder ohne Umleitung verschoben werden könnte. Also Liste kreieren, hinzufügen, fertig, mehr muss urheberrechtlich nicht getan werden, um dem by-Attribut der CC-by-sa-Lizenz gerecht zu werden. Danke sehr, – Doc Taxon • Disk. • 00:18, 6. Sep. 2022 (CEST)
- @Leyo: wieso soll man jetzt die importierten Versionen wieder löschen? – Doc Taxon • Disk. • 11:30, 13. Sep. 2022 (CEST)
- Ich halte diese extrem aufgeblähte Versionsgeschichte weder für notwendig noch für nützlich, sondern für störend. Diese wird dem Inhalt der Liste in keiner Weise gerecht. --Leyo 12:02, 13. Sep. 2022 (CEST)
- Mich stört die Liste nicht, wenn ich diese aufliste, suche ich mir raus, was ich brauche und dann ist gut. Eine Löschung der Versionen ist wieder aufwändige Datenbankarbeit mit Verschiebung von Versionen von einer Tabelle in die nächste + Logbuchaktionen + Serverlast. Versionsgeschichten brauche ich nur, wenn ich mir was aus alten Versionen raussuchen will, und das geht in einer "aufgeblähten" (was immer das auch ist) Versionsgeschichte nicht wirklich minder gut. Blöderweise sind die Versionen jetzt da, stören aber nicht wirklich. Wenn Du das anders siehst und das unbedingt weg soll, dann nimm Deine Adminknöpfe und leg los. – Doc Taxon • Disk. • 12:16, 13. Sep. 2022 (CEST)
- Am liebsten wäre es mir, wenn dies M.ottenbruch tun würde. Ansonsten ein unbeteiligter Admin … --Leyo 12:20, 13. Sep. 2022 (CEST)
- Mich stört die Liste nicht, wenn ich diese aufliste, suche ich mir raus, was ich brauche und dann ist gut. Eine Löschung der Versionen ist wieder aufwändige Datenbankarbeit mit Verschiebung von Versionen von einer Tabelle in die nächste + Logbuchaktionen + Serverlast. Versionsgeschichten brauche ich nur, wenn ich mir was aus alten Versionen raussuchen will, und das geht in einer "aufgeblähten" (was immer das auch ist) Versionsgeschichte nicht wirklich minder gut. Blöderweise sind die Versionen jetzt da, stören aber nicht wirklich. Wenn Du das anders siehst und das unbedingt weg soll, dann nimm Deine Adminknöpfe und leg los. – Doc Taxon • Disk. • 12:16, 13. Sep. 2022 (CEST)
- Ich halte diese extrem aufgeblähte Versionsgeschichte weder für notwendig noch für nützlich, sondern für störend. Diese wird dem Inhalt der Liste in keiner Weise gerecht. --Leyo 12:02, 13. Sep. 2022 (CEST)
- Ja, ihr liegt beide richtig. Wenn nur die inhaltlich übernommenen Versionen nachgewiesen werden, also z. B. die fraglichen 11 Versionen, ist der Anspruch auf Urhebernennung erfüllt. Wenn die komplette Versionsgeschichte importiert wird, ist er auch erfüllt und alles insgesamt nachvollziehbar - auch für die deutschsprachige Version Bedeutungsloses. Beide Varianten sind in Ordnung und haben kleine Nachteile. Allgemein wird es unklarere Fälle geben, in denen ein Heraussuchen der wesentlichen Versionen kaum zweckmäVorlage:SSig ist und im Zweifel eher die komplette Versionsgeschichte übernommen wird. Immerhin, auch zwischen 'kein Import mangels Schöpfungshöhe' und 'Import' gibt es knappe Entscheidungen. So oder so wird kein erheblicher Schaden angerichtet. Ein nachträgliches Löschen bestimmter bereits importierter Version erscheint als Erschwerung der Nachvollziehbarkeit, darauf würde ich spontan anraten zu verzichten. --Holmium (d) 23:51, 5. Sep. 2022 (CEST)
- Natürlich nicht. Daher ist mein Vorschlag, alle importierten Versionen zu löschen. Gibt es weitere Meinungsäusserungen dazu? --Leyo 23:26, 5. Sep. 2022 (CEST)
- Welcher „falsche Eindruck“ wird denn da vermittelt? Wenn ich nur die letzten 11 Versionen vor der Auslagerung importiert hätte, dann würde in der Tat der falsche Eindruck vermittelt, der Nutzer, der als erster im Artikel über Perfluoroctansäureverbindungen geschrieben hat, hätte den ganzen Artikel geschrieben. Das kannst Du nicht ernsthaft wollen. Daß Doc Taxon diesbezüglich einen sehr restriktiven Standpunkt vertritt, ist mir bekannt. -- M.ottenbruch ¿⇔! RM 20:47, 5. Sep. 2022 (CEST)
- IMHO wird da u.a. ein falscher Eindruck vermittelt. Von den 275 importierten Versionen sind nur die letzten 11 überhaupt (potentiell) relevant. Doc Taxon etwa hat schon diverse Importwünsche abgelehnt, bei welchen die Lage bezüglich SH IMHO weniger klar war. --Leyo 09:55, 5. Sep. 2022 (CEST)