Benutzer Diskussion:ComillaBot/Archiv
Name des Bots
Frage: wie soll der Bot heißen? Wenn das geklärt ist, könnten wir ihm schon mal einen Account sichern und dann auch dort weiterdiskutieren. Ideen? --Tobias K. 20:58, 18. Jul 2006 (CEST)
Ein paar Vorschläge/Inspirationen:
- NBSP
- Plenk
- NBSPlenk
- NBSBot (Non-Breaking Space Bot)
- Spacer (soviel wie Abstandhalter)
- SpaceInvader (Leerzeichen Angreifer)
- doublequotemark
- guillemet (fr. Anführungszeichen)
- Comilla (sp. Anführungszeichen)
--Flea 16:26, 20. Jul 2006 (CEST)
- „NBSBot“ klingt gut, „Comilla“ gefällt mir auch. Ein „Bot“ oder ein vergleichbarer Namenszusatz sollte auf jeden Fall in den Namen aufgenommen werden, damit dem Betrachter (z.B. in der Versionsgeschichte) klar ist, dass es sich um einen Bot handelt. --Tobias K. 10:00, 21. Jul 2006 (CEST)
- ComillaBot find ich auch gut. Gegenvorschläge? --Flea 20:06, 25. Jul 2006 (CEST)
Aufgaben des Bots
Flea hat hier vorgeschlagen, damit anzufangen, eine Liste der möglichen Aufgaben des Bots zu erstellen. Also bitte eifrig Ideen sammeln! --Tobias K. 20:58, 18. Jul 2006 (CEST)
Ich benutz _ mal als Erzatz für das geschützte Leerzeichen. Bitte korrigiert mich, falls ich was falsch gemacht habe. --Flea 21:36, 18. Jul 2006 (CEST)
- <Zahl>°C -> <Zahl>_°C
- 5°C -> 5_°C
- 5° C -> 5_°C
Christopher ♒ 01:08, 30. Jul 2006 (CEST)
Pro –- <Zahl> - <Zahl> <Einheit> -> <Zahl> bis <Zahl>_Einheit
- 5-7m -> 5 bis 7_m
- 5 - 7m -> 5 bis 7_m
- 5-7 m -> 5 bis 7_m
- 5 - 7 m -> 5 bis 7_m
Meinst du das „bis“ als ausgeschriebenes Wort? Wenn ja: ist das in der Wikipedia so üblich?
- Ich weiß nicht ob das "bis" wikiüblich ist, aber es ist Standard in wissenschaftlichen Texten. Das "-" könnte als minus interpretiert werden und ist deshalb zu vermeiden. Alternativ kann man auch "–" nehmen. Allerdings sollte man es in der Nähe von Formeln meiden. Leider hält sich keiner daran. Auch in einer Doktorarbeit in Physik hab ich das "-" gefunden. Ganz genau muss es sogar 5 m bis 7 m heißen. Ganz schlimm ist 5 - 70000 kg. Mit Monatsbezeichnung meinst Du den ausgeschriebenen Monatsnamen? --Flea 23:33, 18. Jul 2006 (CEST)
- Dies sollte man mit Vorsicht genießen. In Tabellen ist „5–7_m“ sicher die bessere Lösung als „5 bis 7_m“. Können wir Tabellen ausschließen? Im Fließtext plädierte ich schließlich für „fünf bis sieben Meter“, nach der alten Regel, Zahlen bis einschließlich zwölf auszuschreiben. Christopher ♒ 01:08, 30. Jul 2006 (CEST)
- Wie wäre es mit folgender Vorgehensweise: Alle 5-7m (oder vergleichbare Schreibweisen) werden zunächst einmal in 5–7_m umgewandelt, was schon einmal eine Verbesserung ist. Die Formulierung mit „bis“ bzw. auch die Ausschreibung von Zahlen werden dann nach Bedarf vom Bearbeiter vorgenommen. Es dürfte dem Bot nämlich schwer fallen, zu entscheiden, wie es am besten ist, bei Jahreszahlen etwa ist ja auch außerhalb von Tabellen eine Schreibung ohne „bis“ gängig (1923–2003). --Tobias K. 09:06, 30. Jul 2006 (CEST)
- Ja, das erscheint mir keine schlechte Idee. Christopher ♒ 14:50, 30. Jul 2006 (CEST)
- Wie wäre es mit folgender Vorgehensweise: Alle 5-7m (oder vergleichbare Schreibweisen) werden zunächst einmal in 5–7_m umgewandelt, was schon einmal eine Verbesserung ist. Die Formulierung mit „bis“ bzw. auch die Ausschreibung von Zahlen werden dann nach Bedarf vom Bearbeiter vorgenommen. Es dürfte dem Bot nämlich schwer fallen, zu entscheiden, wie es am besten ist, bei Jahreszahlen etwa ist ja auch außerhalb von Tabellen eine Schreibung ohne „bis“ gängig (1923–2003). --Tobias K. 09:06, 30. Jul 2006 (CEST)
- Dies sollte man mit Vorsicht genießen. In Tabellen ist „5–7_m“ sicher die bessere Lösung als „5 bis 7_m“. Können wir Tabellen ausschließen? Im Fließtext plädierte ich schließlich für „fünf bis sieben Meter“, nach der alten Regel, Zahlen bis einschließlich zwölf auszuschreiben. Christopher ♒ 01:08, 30. Jul 2006 (CEST)
Weitere Ideen (<WS> sei Whitespace) --Tobias K. 22:17, 18. Jul 2006 (CEST)
- <WS>[,.!?] -> [,.!?]
- <Zahl>.<Monatsbezeichnung> -> <Zahl>. <Monatsbezeichnung>
Bis hierhin: Christopher ♒ 01:08, 30. Jul 2006 (CEST)
Pro –- <Buchstabe> - <Buchstabe> -> <Buchstabe> – <Buchstabe>
- Es gibt Schreibweisen wie „Pulitzer - Preis“, aus denen der Bot „Pulitzer – Preis“ machen würde. Kein echter Gewinn, oder? Christopher ♒ 01:08, 30. Jul 2006 (CEST)
- Ist die Schreibweise „Pulitzer - Preis“ denn korrekt? Eigentlich ist das doch einfach ein Bindestrich, und um Bindestriche stehen normalerweise nie Leerzeichen. Der Artikelname heißt ja auch „Pulitzer-Preis“. Demnach würde im Grunde nur eine falsche Schreibung in eine andere umgewandelt. Ansonsten müsste der Bot-Operator eben auf so etwas achten. --Tobias K. 09:06, 30. Jul 2006 (CEST)
- Nein, natürlich ist die Schreibweise nicht korrekt, aber sie existiert ab und an. Da ich inzwischen gesehen habe, dass es auf einen halbautomatischen Bot hinauslaufen wird, sind solche Zweifelsfälle manuell natürlich leicht zu korrigieren. Das Problem ist also keines. Christopher ♒ 14:50, 30. Jul 2006 (CEST)
S. a. Diskussionsseite --Simon Diskussion/Galerie 23:53, 18. Jul 2006 (CEST)
Ja, ich meine den ausgeschriebenen Monatsnamen, etwa 1.Januar nach 1. Januar. Könnte man das vielleicht sogar so erweitern? Bitte Einwände, wenn falsch! --Tobias K. 09:17, 19. Jul 2006 (CEST)
- <Zahl>.<Buchstabe> -> <Zahl>. <Buchstabe>
- <Zahl> <Einheit> -> <Zahl>_<Einheit>
Das wird knifflig, weil man alle verwendeten Einheiten wissen muss. --Flea 10:33, 19. Jul 2006 (CEST)
So schwierig ist das nicht: Wir geben einfach so viele Einheiten wie möglich vor. Standardeinheitentabelle (m, g, s, N, ...) eingeben, Liste der Präfixe eingeben, Kombinationen daraus sind Einheiten. --Tobias K. 19:27, 19. Jul 2006 (CEST)
Eine grundsätzliche Entscheidung: Soll der Bot in eindeutigen Fällen auch Rechtschreib- und Tippfehler korrigieren, in der Art von „Standart “->„Standard “?
- Simon Diskussion/Galerie 13:46, 20. Jul 2006 (CEST) Kontra, denn das kann ein vollatuomatischer Bot machen. Oder? --
- Tobias K. 15:37, 20. Jul 2006 (CEST) Kontra – ein gutes Argument, ich schließe mich dem an. Es gäbe auch wenig „Synergieefekte“, von daher kann das gut ein anderer Bot machen. Wir sollten uns auf syntaktisch-typographische Verbesserungen konzentrieren, die einen Menschen vor dem Bildschirm erfordern. (Wenn dahingehend Einigkeit bestehen sollte, wäre dies eine gute Richtlinie für das Projekt.) --
- Flea 16:07, 20. Jul 2006 (CEST) Kontra, dafür gibt's andere spezialisierte Bots. Ich denke die bisher gesammelten Aufgaben sind schon Arbeit genug. --
Gut, nachdem erst einmal kaum weitere Stimmen zu erwarten sind, ist das Ergebnis hinreichend eindeutig. Der Bot wird sich also auf Tätigkeiten im Umfeld der bereits gesammelten beschränken, mit halbautomatischer Arbeitsweise. --Tobias K. 11:28, 21. Jul 2006 (CEST)
Sollten wir entsprechend Wikipedia:Typografie#Auslassungspunkte eine Ersetzung von ... (3 Punkte) mit … (ein einzelnes, spezielles Zeichen für Auslassungspunkte, sieht aber meist gleich aus) durchführen? --Tobias K. 11:01, 23. Jul 2006 (CEST)
- Christopher ♒ 01:08, 30. Jul 2006 (CEST) Pro –
- Simon Diskussion/Galerie 10:10, 30. Jul 2006 (CEST) Pro, und wahrscheinlich muss man auch gerade (manuell) schauen, ob ein Leerschlag davor gehört, siehe Artikel oben ... Ich muss mal schauen, wo ich die unter Linux finde, Windows hat sie bei Alt-0133 (glaub ich). –
Weitere Diskussion
Wurde von der zum Artikel gehörigen Diskussionsseite hierher verschoben. --Tobias K. 14:17, 29. Mai 2007 (CEST)
- Zahlen 5-7: Evtl. auch 5–7!
- Bei Text wäre korrekt: Ich –_Simon_– bin müde. (Eingeschobener Satz)
- Abkürzungen am Anfang müssten weg! Z. B. diese in diesem Satz.
- Richtige „Anführungs- und Schlusszeichen“
- Aber die Zollzeichen (17"-Display) müssen so aussehen.
- Später müsste man sich überlegen, z. B. in z. B. zu ändern. Wird in einem Jahr etwa als Standard richtig dargestellt werden. (z. B. statt z. B.; thinsp bildet einen halbgeviert langen Leerschlag, nbsp einen ganzen oder beides die Hälfte, bin gerade nicht sicher)
--Simon Diskussion/Galerie 22:47, 18. Jul 2006 (CEST)
- Anmerkung: Zollzeichen sollten nicht so ( " ), sondern so ( ″ ) aussehen. Christopher ♒ 01:30, 30. Jul 2006 (CEST)
- Danke für den Hinweis. Ich werde versuchen, das so gut es geht in die Regeln einzuarbeiten. --Tobias K. 09:09, 30. Jul 2006 (CEST)
- Gibts nicht auch einen Unterschied zwischen Zoll- und Inchzeichen? Ist nicht das eine oben ein Inch, das andere ein Zoll? – Simon Diskussion/Galerie 10:07, 30. Jul 2006 (CEST)
- Meines Wissens: nein. Schließlich ist “inch” nur das englische Wort für „Zoll“ (siehe auch en:Prime). Christopher ♒ 14:46, 30. Jul 2006 (CEST)
Bei „Ich –_Simon_– bin müde.“ gibt es wohl das Problem, dass ein Bot nicht erkennen kann, welcher der erste und welcher der zweite Gedankenstrich ist, genauso bei „ “, wobei ein Zollzeichen wohl immer dann anzunehmen ist, wenn eine Zahl davor steht. Mit halbautomatischer Erkennung wäre das wohl vertretbar. --Tobias K. 09:03, 19. Jul 2006 (CEST)
Genau, nur sagte er: "Ich bin 28" – also halbautomatisch oder intelligenter. --Simon Diskussion/Galerie 10:08, 19. Jul 2006 (CEST)
Ich wäre ohnehin für einen halbautomatischen Bot, ein vollautomatischer ist ein zu großes Risiko. Man sollte auch mit Nachkontrolle recht schell arbeiten können. Intelligentere Lösung wäre trotzdem gut, hab aber gerade keine parat. --Tobias K. 19:27, 19. Jul 2006 (CEST)
Regeln für den Bot
Wem noch ganz neue Aufgaben einfallen, der kann sie unter „Aufgaben“ vorstellen. Für die bereits gefundenen könnten wir – als Vorstufe für die tatsächliche Umsetzung – möglichst exakte Regeln definieren. Ich schlage folgende (naheliegende) Vorgehensweise vor: Wir gehen von einem Regelvorschlag aus und perfektionieren ihn durch Einarbeitung aller Einwände und Verbesserungen, die uns einfallen. --Tobias K. 11:28, 21. Jul 2006 (CEST)
Ich habe in einem Artikel „Ko-fermentierung von 5C- und 6C-Zuckern aus Biomasse“ gefunden. Sowas sollte den Bot nicht in die Irre führe. --Flea 09:51, 22. Jul 2006 (CEST)
Wie wäre eine Angabe der Regeln mit Regulären Ausdrücken? --– Simon Diskussion/Galerie 19:01, 29. Jul 2006 (CEST)
Ich hatte auch daran gedacht, sie in regulären Ausdrücken anzugeben, bin aber dann davor zurückgeschreckt, weil die ja nicht unbedingt jeder versteht. Letztlich bietet es sich aber ohnehin an, sie in reguläre Ausdrücke zu überführen, siehe unten. --Tobias K. 20:46, 29. Jul 2006 (CEST)
Anführungszeichen
- <LZ oder Absatzanfang>"<beliebige Zeichen>" -> <LZ oder Absatzanfang>„<beliebige Zeichen>“
- Erkennt dann natürlich nicht Zollzeichen in Zitaten ("Ich habe mir einen 19"-Monitor gekauft."), aber die kommen ja nicht so oft vor. --Tobias K. 16:36, 25. Jul 2006 (CEST)
Striche
Gedankenstrich:
- <Buchstabe> - <beliebige Zeichen, aber kein Satzzeichen> - <Buchstabe> -> <Buchstabe> –_<beliebige Zeichen, aber kein Satzzeichen>_– <Buchstabe>
- <Buchstabe> - <Buchstabe> -> <Buchstabe> – <Buchstabe>
- Achtung: [[Bild:Heute - ein sonniger Tag.jpg]] – blöd, nicht?
- Aber dafür ist er ja halbautomatisch ;) – Simon Diskussion/Galerie 17:10, 21. Jul 2006 (CEST)
- Tja, ein berechtigter Einwand. Also: beim Bearbeiten später darauf achten, ob außen so kleine, unscheinbare eckige Klammern sind! Wenn es nicht zu aufwändig ist (abhängig von der verwendeten Technologie) wäre es natürlich auch gut, dem Bot beizubringen, dass er bestimmte Textteile gleich ignorieren soll. Mal sehen... --Tobias K. 20:25, 21. Jul 2006 (CEST)
Bis-Strich bei Jahreszahlen in Klammern
- (<bis zu 4 Ziffern><[LZ,_,nichts][-,–][LZ,_,nichts]><bis zu 4 Ziffern>) -> (<bis zu 4 Ziffern><[LZ,_,nichts][-,–][LZ,_,nichts]><bis zu 4 Ziffern>)
Zahlen mit Einheiten
- <Zahl><LZ, nichts><Einheit> -> <Zahl>_<Einheit>
- <Zahl><LZ, nichts>°C -> <Zahl>_°C
Sonstiges
x-ter (etwa in Datumsangaben):
- <Zahl>.<Buchstabe> -> <Zahl>._<Buchstabe>
überflüssige Leerzeichen entfernen:
- <LZ><!?.,;> -> <!?.,;>
- <beliebig viele LZ> -> <LZ>
Umsetzung
Nachdem jetzt ja schon einiges an Regeln vorhanden ist, sollten wir uns allmählich Gedanken über die Umsetzung des Projekts machen. Außer der noch nicht abschließend geklärten Namensfrage steht vor allem die Entscheidung für die technische Basis an: Pywikipediabot? Vorschläge bitte! --Tobias K. 16:37, 25. Jul 2006 (CEST)
Viele Vorschläge scheinen ja nicht gerade zu bekommen zu sein ... Von daher habe ich mal versucht, dem Pywikipediabot einige von den Regeln mit Hilfe regulärer Ausdrücke beizubringen. Das Ergebnis in Code seht ihr hier. Wenn ihr damit klarkommt, könnt ihr gerne daran weiterarbeiten (Änderungen in der Zusammenfassung oder auf der dortigen Diskussionsseite begründen), ansonsten bietet sich die dortige Diskussionsseite auch an, um Detailfragen zu der Umsetzung der Regeln zu klären.
Ich bin mit der Pywikip.-Lösung halbwegs zufrieden. Lasst doch auch mal einen Test laufen (z.B. an Benutzer:Tobias K./Bottest), um zu sehen, ob euch Pywikip. grundsätzlich zusagt. (Ich weiß nicht, ob ihr euch Pywikip. schon mal angeschaut habt, ansonsten werde ich versuchen, das Vorgehen zu erklären.)
Übrigens: wenn es gegen den Namen nicht doch noch Einwände gibt, werde ich morgen einen Account für „ComillaBot“ registrieren. --Tobias K. 20:46, 29. Jul 2006 (CEST)
- Simon Diskussion/Galerie 23:52, 29. Jul 2006 (CEST) Pro, ich find den Namen gut. –
- Christopher ♒ 14:47, 30. Jul 2006 (CEST) Pro – Finde ich auch angenehm. Klingt flüssiger als „NBSP-Bot“ und freundlicher als „PlenkBot“ oder Ähnliches.
Ok, anscheinend besteht ja Einigkeit, also habe ich jetzt einen Benutzeraccount für ComillaBot angelegt. Die Seiten mit dem Code und dem Testtext finden sich jetzt auch dort. Um die Kontinuiät der Diskussionen zu wahren: Bereits angefangene Fragestellungen HIER weiterdiskutieren (die Seite werde ich später ins Diskussionsarchiv von Comilla übertragen), andere Themen – einige habe ich dort schon angeschnitten – in Comillas Diskussion. --Tobias K. 15:04, 30. Jul 2006 (CEST)
Organisation
Auf jeden Fall sollten wir offen für neue Operatoren sein, für einen halbautomatischen Bot braucht es schließlich auch menschliche Arbeitskraft. Ich würde folgendes Verfahren vorschlagen: Wer mithelfen will, meldet sich auf der Diskussionsseite und bekommt dann per Mail Comillas Accountpasswort zugeschickt, damit er loslegen kann. Der Code ist auf Benutzer:ComillaBot/Code ohnehin öffentlich einsehbar. --Tobias K. 14:58, 30. Jul 2006 (CEST)
Noch etwas: Artikelkorrekturen wird jeder völlig selbstständig durchführen. Wir sollten uns aber auf einen „Hauptbetreuer“ für Comilla einigen, der dann später beispielsweise den Antrag auf Botstatus stellt und in der Botliste als Ansprechpartner eingetragen wird. Sollen wir eine Wahl oder so veranstalten? --Tobias K. 15:08, 30. Jul 2006 (CEST)
- Ich wähle dich :) – Simon Diskussion/Galerie 17:54, 4. Aug 2006 (CEST)
Na gut, ich werde mich mal daran machen, die Sache ins Rollen zu bringen – Botstatus beantragen, Benutzerseite erweitern… Die bisherige Diskussion wird bald ins Archiv verschoben. –Tobias K. 18:11, 20. Aug 2006 (CEST)
Technisches
Was wir auf jeden Fall brauchen, ist erst einmal ein funktionierender Bot. Hat denn jemand (außer mir) schon mal die Sache mit Pywikipediabot getestet? Wenn es alternative Vorschläge oder Probleme gibt oder ich eine Anleitung schreiben soll, sagt Bescheid! --Tobias K. 14:58, 30. Jul 2006 (CEST)
Anleitung gibt es jetzt unter Benutzer:ComillaBot/Anleitung. --Tobias K. 11:43, 1. Aug 2006 (CEST)
Zum aktuellen Stand: Das bislang implementierte Regelset arbeitet schon nicht schlecht, siehe den letzten Test an Benutzer:ComillaBot/Test, Vergleichsansicht hier: [[1]] (Dank an Flea für die zusätzlichen Testfälle). Meinungen zum derzeitigen Leistungsstand und zu möglichen Verbesserungen sowie Kommentare zur den organisatorischen Themen erbeten! --Tobias K. 11:12, 2. Aug 2006 (CEST)
Es gibt ein paar Aufgaben, bei denen Unterstützung hilfreich wäre:
- 1. Einheitensammlung komplettieren. Derzeit kennt Comilla nur einige wenige Einheiten zu Testzwecken. Wem Einheiten, Präfixe o.ä. einfallen: loslegen und ergänzen! (Keine Angst vor dem regulären Ausdruck am Schluss – den kann ich auch updaten, wenn nötig.)
- 2. Regeln dokumentieren. Die Aufgaben, die bereits implementiert sind (aus den Kommentaren im Code ersichtlich und auch aus den vorangegangenen Diskussionen bekannt), sollten auf der Benutzerseite unter der Überschrift Aufgaben schön aufgelistet und im Bedarfsfall kurz erläutert werden – nach Möglichkeit auch logisch sinvoll nach Aufgabenbereichen gegliedert. Schließlich sollen Besucher und Wiki-Admins auch wissen, was unser Bot so macht.
- 3. Ziemlich große Sache: Das Pywikipediabot-Framework hat gewisse Schwächen, wenn man es halbautomatisch einsetzen will. Zum einen ist die Anwendung eher anfängerfeindlich (da sie textbasiert ist und einiges an Installationen benötigt), zum anderen können Änderungen nur gruppenweise übernommen oder abgelehnt werden. Für vollautomatische Bots ist das in Ordnung, für unsere Zwecke wäre es aber eigentlich ideal, ein neues Programm zu schreiben, das sich auf betreute Ersetzungen spezialisiert und das eine grafische Benutzeroberfläche hat. So etwas wäre natürlich auch für andere Bots als unseren und für andere Zwecke geeignet. Ich wäre auch bereit, meine eigenen Programmierkenntnisse unterstützend beizusteuern. Wenn also jemand grundsätzlich bereit ist, sich da ranzusetzen – bitte zwecks weiterer Besprechung des Themas melden.
--Tobias K. 12:19, 5. Aug 2006 (CEST)
Hab da noch etwas interessantes gefunden: http://www.bipm.fr/en/CGPM/db/9/7/ --Flea 08:37, 11. Aug 2006 (CEST)
Falls sich jemand für den aktuellen Stand interessiert: Ich habe den bisherigen Code in ein Java-Programm integriert, da mich die bisherige Lösung mit Pywikipediabot nicht wirklich zufriedenstellen konnte. Sollte in ein oder zwei Tagen in einem akzeptablen und benutzbaren Zustand sein. Etwas inhaltliche Unterstützung wäre ganz nützlich bei den Abkürzungen: Ähnlich wie für die Einheiten habe ich eine Seite erstellt, um sie zu sammeln. Die Liste findet sich hier. –Tobias K. 19:16, 26. Aug 2006 (CEST)
Anfrage: Operatoren gesucht?
Hallo,
habe mich nach einem Kleinkrieg gegen "z.B."s in der deutschsprachigen Wikipedia auf die Suche nach effizienteren Methoden umgeschaut, dem Fehlerteufel Herr zu werden. Dabei bin ich auf Wikipedia:Bots gestoßen, wo ich auch schnell auf das ComillaBot-Projekt aufmerksam wurde. Die Aufgaben bzw. Funktionen des ComillaBots halte ich für sehr sinnvoll, weswegen ich dem unabdingbaren Vorschlag, mich hier zu melden, auch nachkommen möchte. Pro fehlerfreie Wikipedia. (Haha, das ist ja wie mit der Vollbeschäftigung...) -- Wampenseppl 23:48, 11. Sep 2006 (CEST)
- Hallo Wampenseppl,
- freut mich, dass du bei Comilla mithelfen willst!
- Zur weiteren Vorgehensweise:
- 1. Ich werde versuchen, dich per ICQ zu kontaktieren, damit man die weitere Vorgehensweise besser absprechen kann.
- 2. Die Programmdateien (und spätere Updates) schicke ich dir als Mailanhang.
- 3. Bis der Botantrag durch ist, musst du Änderungen noch unter deinem eigenen Namen vornehmen.
- --Tobias K. 11:02, 12. Sep 2006 (CEST)
Bot übersieht was...
Ich finde das Bot klasse, aber warum findet es auf der Seite Elamische Sprache alles außer „1000-550 vor Chr.,“, wo der Bindestrich natürlich auch ersetzt werden muss? Gruß, --Jens Lallensack 15:30, 28. Dez. 2006 (CET)
- Danke für den Hinweis – in diesem Fall zeigt sich folgendes Problem: Striche zwischen Zahlen sind dummerweise nicht immer „Bis-Striche“, sondern in manchen Fällen auch als Minuszeichen gemeint (eigentlich ein eigenes typografisches Zeichen, wird aber sehr selten richtig eingesetzt), wo diese Ersetzung dann natürlich falsch wäre. ComillaBot nimmt deshalb nur eine Ersetzung mit Bis-Strich vor, wenn die zweite Zahl größer als die erste ist, da ein Bis-Strich dann erheblich wahrscheinlicher als ein Minus ist. Dieser Fall ist leider die Ausnahme, die damit durchs Raster fällt … Für Ideen zu besseren Unterscheidungskriterien bin ich selbstverständlich dankbar. --Tobias K. 17:32, 28. Dez. 2006 (CET)
- CimillaBot nimmt nur eine Ersetzung mit Bis-Strich vor, wenn die zweite Zahl größer als die erste ist? Was für einen Sinn hat das? Beim Minuszeichen ist es doch häufiger, dass die erste Zahl größer ist als die zweite, oder? z. B.: 3-2=1 und nicht 2-3=-1.
- Außerdem stimmt das nicht, wie ich sehe. Siehe: http://de.wikipedia.org/w/index.php?title=Elamische_Sprache&diff=25640228&oldid=25639841
- Der Text ist über die uralte Elamische Sprache, fast sämtliche Zeitangaben mit Bis-Strich sind im Bereich vor Christus. Alle außer den einen hat der Bot korrigiert (ich bin ihn auch dankbar, war gerade dabei, das alles von Hand zu machen − ich würde jetzt noch hier sitzen).
- Z.B: 550–330 vor Chr., 2400–1500, alles hat er korrigiert, egal welche Zahl größer ist. --Jens Lallensack 18:58, 28. Dez. 2006 (CET)
- Das vorher gesagte trifft bei Zahlen mit gleich vielen Ziffern aus technischen Gründen nicht zu – nicht sehr logisch, ich weiß. :( Ich werde aber versuchen, hier zumindest die Möglichkeiten für feinere Unterscheidungen zu schaffen. (Im Moment habe ich studienbedingt nicht allzuviele Kapazitäten für die Programmierung frei …)
- Zum anderen Punkt: Gerade weil es beim Minuszeichen häufiger ist, dass die erste Zahl größer ist als die zweite, scheint es mir sinnvoll, dass in solchen Fällen nicht das Risiko eingegangen wird, ein Minus als Bis-Strich fehlzuinterpretieren. Bei 3-2 ist es eben wahrscheinlicher, dass „3 minus 2“ als „3 bis 2“ gemeint ist, bei 2-3 dagegen andersherum. Übrigens: Außer dem Minuszeichen gibt es ja auch noch andere Probleme, wie etwa technische Bezeichungen (fiktives Beispiel: CRT-264-33). --Tobias K. 21:31, 28. Dez. 2006 (CET)
- Danke für die Ausführungen! Vielleicht fallen mir ja ein paar Ideen ein… Gruß, Jens Lallensack 21:42, 28. Dez. 2006 (CET)
Ergänzende Ideen (Apostrophe) und Bewerbung als Operator
Der Bot könnte sich noch um Apostrophe kümmern, bzw. um alles, was stattdessen gerne benutzt wird, also einmal das ' und noch die „betonten Leeren“ ` und ´, welche so nur in absoluten Ausnahmefällen korrekt sind (z.B. gerade eben). Ins Besondere die Änderung ' -> ’ ist aber so geringfügig, dass sie nur zusammen mit anderen Änderungen erfolgen sollte. Also:
<Buchstabe> <'> <Buchstabe> -> <Buchstabe> <’> <Buchstabe>
<Buchstabe> <`> <Buchstabe> -> <Buchstabe> <’> <Buchstabe>
<Buchstabe> <´> <Buchstabe> -> <Buchstabe> <’> <Buchstabe>
Bei ' am Wortanfang oder -ende wird es dann leider gefährlicher, da man dieses Zeichen in der Wikipedia auch anderweitig verwenden kann und es außerdem noch für Fuß oder Minute stehen kann. Aber der Bot hat ja einen Operator. Also:
Wortanfang:
<Leerzeichen oder Zeilenumbruch> <'> <Buchstabe> -> <Leerzeichen oder Zeilenumbruch> <’> <Buchstabe>
<Leerzeichen oder Zeilenumbruch> <`> <Buchstabe> -> <Leerzeichen oder Zeilenumbruch> <’> <Buchstabe>
<Leerzeichen oder Zeilenumbruch> <´> <Buchstabe> -> <Leerzeichen oder Zeilenumbruch> <’> <Buchstabe>
Wortende:
<Buchstabe> <'> <Leer- oder Satzzeichen, aber kein '> -> <Buchstabe> <’> <Leer- oder Satzzeichen, aber kein '>
<Buchstabe> <`> <Leer- oder Satzzeichen> -> <Buchstabe> <’> <Leer- oder Satzzeichen>
<Buchstabe> <´> <Leer- oder Satzzeichen> -> <Buchstabe> <’> <Leer- oder Satzzeichen>
Des Weiteren könnte der Operator dabei Apostrophitis bekämpfen, wenn die GUI sowas zulässt. (Wie ist das eigentlich mit dem Leerzeichen, das fast immer zwischen … und Wörter gehört? (Aus dem Archiv werde ich nicht so ganz schlau.))
Schließlich biete ich mich an, den Bot zu bedienen, wenn es meine Zeit zulässt. --Wrzlprmft 13:26, 21. Jan. 2007 (CET)
- Hallo, ich finde die Idee gut.
>Wie ist das eigentlich mit dem Leerzeichen, das fast immer zwischen … und Wörter gehört?
- Es gibt doch auch Fälle, wo da eben kein Leerzeichen zwischen gehört, nämlich wenn nur Buchstaben weggelassen werden, und kein ganzes Wort. Also zum …, aber so ein sch…. --Jens Lallensack 14:22, 21. Jan. 2007 (CET)
- Hallo Wrzlprmft,
- danke für die ausgezeichnet formulierten Regelideen. Ich werde mit der endgültigen Entscheidung noch abwarten, ob jemand hier noch Einwände vorbringt, aber die Vorschläge zum Apostroph wirken sinnvoll und dürften soweit ungefährlich sein. Leerzeichen vor Auslassungspunkten werden derzeit nicht eingefügt. Den Grund hat Jens dir ja schon erklärt.
- Besonders freut es mich natürlich das Angebot zur Mitarbeit. Ich werde mich diesbezüglich per Mail an dich wenden.
- --Tobias K. 15:15, 21. Jan. 2007 (CET)
- Danke. Und mir ist schon klar, dass … nicht immer durch Leerzeichen abzutrennen ist, deswegen schrieb ich ja auch „Leerzeichen, das fast immer zwischen … und Wörter gehört“. Es ging mir eher um die Frage, ob es auch zum Aufgabengebiet des Bots gehört. Ein Operator kann sowas ja unterscheiden. Aber ich schau mir das Kind erstmal selbst an, sobald ich die Zeit dazu finde. --Wrzlprmft 16:37, 21. Jan. 2007 (CET)
Botführer
Hallo, Ich möchte gerne ebenfalls Botführer werden, falls Tobias K. Zeit hat mich einzuweisen. Mit solch einem Bot gehen die ganzen typografischen Korrekturen sicher viel schneller. Ich werde auch mit dem Bot regelmäßig auf Jagd gehen :-) Gruß, Jens Lallensack 13:22, 3. Mär. 2007 (CET)
- Hallo Jens – schön, dass du auch mitmachen willst! Ich werde dich per Mail kontaktieren, wirf also demnächst mal einen Blick in deinen Posteingang. ;-) --Tobias K. 15:13, 4. Mär. 2007 (CET)
AutoWikiBrowser für Typografieverbesserungen nutzen
Das Projekt hier scheint ein wenig eingeschlafen zu sein, deshalb hier mal eine neue Idee: Mit dem AutoWikiBrowser lässt sich die Aufgabe des "Bots" ebenfalls erledigen (mit dem eigenen Benutzerprofil). Wenn Interesse besteht bitte auf der dortigen Diskussionsseite melden. – Batrox 23:40, 30. Mär. 2007 (CEST)
- Ist dort beantwortet. --Tobias K. 11:14, 8. Apr. 2007 (CEST)
Problem?
Lieber Bot, beim Artikel Pamir (Schiff) hast Du einen auskommentierten Eintrag (< !--Das ist eine Übersetzung der englischen Seite: http://www.bruzelius.info/nautica/Ships/Fourmast_ships/Pamir(1905).html -- >) zu einem lapidaren "≑1" umgeändert. Vielleicht läßt Du Dich da von Deinem Herrchen noch einmal ein bißchen umprogrammieren?
Außerdem nur einmal als Anmerkung: Soweit ich mich richtig daran erinnere, habe ich mal zu Schulzeiten gelernt, ein Gedankenstrich solle bei Zeilenumbrüchen am Anfang der Zeile stehe, nicht am Ende. Du jedoch setzt bei Einschüben mit Gedankenstrichen ein "& nbsp;" vor den hintereren Gedankenstrich. Gibt's irgendwo eine Quelle, die Deine oder meine Version unterstützen könnte? (Ich komme zur Zeit nur sehr schwer an einen Duden o.ä. heran, hat Dein Herrchen so etwas?) Viele Grüße und danke für Deine Arbeit, Ibn Battuta 21:26, 12. Apr. 2007 (CEST)
- Oh, anscheinend hat sich Comilla an den vielen Kommentaren in dem Artikel verschluckt :| … ich werde sie erst einmal an die Leine nehmen, bis ich ihr das ausgetrieben habe.
- Zum Gedankenstrich: Derjenige, der das mal angeregt hatte, hat das gut begründet, darum hab ichs auch aufgenommen. Leider weiß ich die Begründung nicht mehr … Im Duden steht dazu ja: „Gesetzt wird er mit vorausgehendem und folgendem Wortabstand. Er soll nach Möglichkeit nicht am Zeilenanfang stehen.“ Das spricht zwar gegen deine Auffassung, hinsichtlich des ersten Gedankenstrichs – den ich ja im Zweifelsfall an den Zeilenanfang stelle – aber eigentlich auch gegen meine. Auf Halbgeviertstrich wiederum steht: „Der Gedankenstrich ist immer durch ein Leerzeichen vom umgebenden Text abzugrenzen. Dabei ist in der Textverarbeitung zu beachten, ihn mit einem geschützten Leerzeichen an den Satzteil zu binden, den er abgrenzt.“ In diesem Artikel selbst wird das auch so gehalten. WP:TYP schweigt sich dazu aus. Ich denke, das sollte man auf der dortigen Diskussionsseite mal thematisieren, bis dahin wird dieses Feature abgeschaltet. -- Das Herrchen, Tobias K. 10:12, 13. Apr. 2007 (CEST)
- Update: Der Fehler im Programm sollte jetzt behoben sein, ich habe auch ein paar zusätzliche Sicherheitsmaßnahmen eingebaut, um solche Fälle in Zukunft eher zu bemerken. Vielen Dank für deine aufmerksame Beobachtung! --Tobias K. 16:46, 13. Apr. 2007 (CEST)
- Danke fuer die Antwort ('tschuldige, gerade ohne Sonderzeichen)! Danke, jetzt kenne ich wenigstens mal eine Dudenmeinung zum Thema! Wuerde mich zwar noch interessieren, ob das schon zu Zeiten der "alten" Rechtschreibung so war (dann habe ich vielleicht einfach das Gegenteil von dem im Kopf, wie's wirklich sein sollte?), aber fuer die Wikipedia spielt das eh keine Rolle: Ich waere deswegen auch gegen die Abschaltung des Features, denn sinnvoll finde ich die von Dir vorgenommene Abtrennung allemal. Nochmals danke und viele Gruesse, Ibn Battuta 22:21, 13. Apr. 2007 (CEST)
z. B. (zum Beispiel)
Viele Leute können die Abkürzung für „zum Beispiel“ nicht richtig schreiben. Entweder wird kein Leerzeichen gemacht (z.B.) oder es wird statt eines nbsp ein normales Leerzeichen gemacht, was dazu führt, dass „z.“ am Zeilende steht und „B.“ am Anfang der nächsten Zeile.
Mein Vorschlag daher, sobald er Bot „z.B.“ oder „z. B.“ findet, wird dies durch „z. B.“ ersetzt. Zottmann 18:38, 13. Apr. 2007 (CEST)
- Ich bin ganz deiner Meinung, deshalb tut der Bot das bereits, siehe etwa [2]. Das gilt übrigens für alle Abkürzungen, die hier stehen. --Tobias K. 18:58, 13. Apr. 2007 (CEST)
- Klasse, ist mir gar nicht aufgefallen. Wie kommt es eigentlich, trotz des Bots, dass man relativ häufig solche Fehler in Artikeln findet? Geht der Bot eigentlich alphabetisch vor und wie viele Artikel schafft er pro Stunde? Zottmann 19:38, 13. Apr. 2007 (CEST)
- Das liegt vor allem daran, dass er halbautomatisch ist, d. h. ich sehe mir die Änderungen an (oder ein Helfer), bevor sie eingetragen werden. Die Frage ist also nicht, wieviel der Bot, sondern wieviel sein Operator pro Stunde schafft – und das schätze ich mal auf 40 Artikel (längere, ein Stub dauert fünf Sekunden …). Natürlich könnte man ihn einfach alles von A bis Z durcharbeiten lassen, aber da kann es zu Fehlern kommen, und fehlerhafte Bot-Edits sind inakzeptabel. Woher soll der Bot auch wissen, ob der Bindestrich in 1945-1988 ein Bis-Strich oder ein Minus sein soll? Ansonsten: Dass ein Artikel mal korrigiert wurde, hält Autoren natürlich nicht davon ab, neue Fehler zu produzieren.
- Kurz gesagt: Der Bot fährt mit Menschenblut. Und, wo wir dabei sind: Du willst nicht vielleicht ein wenig mithelfen? Die Typografie scheint dir ja nicht völlig egal zu sein. ;-) --Tobias K. 20:12, 13. Apr. 2007 (CEST)
- Habe gerade Eure Diskussion gesehen und daraufhin die Datei angeschaut: Da steht "U.S." ohne Leerzeichen, Absicht? Und ist "u. Ä." mittlerweile wirklich richtig [~schuettel~]? - Uebrigens faende ich eine "Dreiviertelautomatisierung" auch vertretbar - beispielsweise alle "z.B." vollautomatisch korrigieren, auch andere Fehler, die eigentlich nie "richtig" sein koennen. Bei Binde-/Gedankenstrichen usw. hingegen Halbautomatik. Was meinst Du? --Ibn Battuta 22:26, 13. Apr. 2007 (CEST)
- „U.S.“ ist Absicht. Allerdings wird die Schreibung mit Leerzeichen nicht angerührt, das steht nur da, um sicherzustellen, dass der Bot auch diese Schreibung verschont, da hier nicht unbedingt klar ist, wie es richtig ist (mir jedenfalls nicht). Das große Ä ist neue Rechtschreibung, tut mir leid. Ist durch den Duden abgesichert. Das bringt mich darauf, ich sollte noch „o. Ä.“ ergänzen …
- Ich meinerseits würde übrigens gerne die Sachen sammeln, die vollautomatisch möglich sind. Leider werden das dann wohl immer nur ein, zwei Änderungen pro Artikel sein, und dann steigen mir die Admins wegen meiner „unwichtigen“ Edits aufs Dach. Typografische Korrektheit ist kein hinreichendes Argument (vor allem bei „unsichtbaren“ Änderungen wie geschützten Leerzeichen). --Tobias K. 22:55, 13. Apr. 2007 (CEST)
- Besser als nachträgliche Bot-Edits wäre m. E. ein Plugin, welches bereits bei der Eingabe (also beim speichern bzw. Vorschau) bereits Korrekturen vornimmt (und den User darauf hinweist, was geändert wurde). Ich meine dabei die Sachen, die wirklich gesichert sind, wie eben z. B. Steigen Dir die Admins wegen diesen Änderungen da wirklich auf's Dach? Also mich stört das gewaltig, wenn mal typografische und mal normale Anführungszeichen drin stehen, genauso wie fehlende oder doppelte Leerzeichen. Was Dein Bot übrigens noch machen könnte, wäre ein geschütztes Leerzeichen vor dem %-Zeichen. Viele haben nämlich noch nicht kapiert, dass ein Zeichen wie z. B. das Prozentzeichen genauso behandelt wird, als wenn das Wort ausgeschrieben worden wäre. Und keiner schreibt 10Prozent, aber 10% ist für viele ok (Excel macht's ja schon falsch vor). Zottmann 00:59, 14. Apr. 2007 (CEST)
- Ein Plugin bzw. eine entsprechende MediaWiki-Funktion wäre wahrscheinlich am effektivsten (die könnte auch bei den Anführungszeichen zumindest warnen etc.). Das ist aber wohl nicht mein Zuständigkeitsbereich. Ich weiß nicht, ob es solche Bestrebungen schon gibt – du könntest ja auf der Diskussion von WP:TYP oder an einem anderen geeigneten Ort mal den Vorschlag einbringen und für Unterstützung werben.
- Zur potentiellen Haltung der Admins: Das hat schon mal jemand vorgeschlagen, die Reaktionen waren ablehnend. Ich zitiere etwa Benutzer:Augiasstallputzer: „Abzulehnen, da verantwortungslos. Eine derartige Flut an Edits ist wegen des Zeit- und Festplattenbedarfs (auf dem Server) nicht separat akzeptabel. Es geht nur nebenbei, zusammen mit anderen Bot-Edits.“
- Die Prozentzeichen werden übrigens auch bereits berücksichtigt, wie auf Benutzer:ComillaBot#Aufgaben unschwer zu erkennen ist. --Tobias K. 11:11, 14. Apr. 2007 (CEST)
Weitere Vorschläge
Ich weiß ja nicht, ob das schon angebracht wurde, aber ich halte es auch noch für sinnvoll, jegliche Zahlen unter 13, die in nicht formatiertem Fließtext (nicht kursiv, fett; keine Anführungszeichen, Links) als Wort auszuschreiben. Außerdem denke ich, Abkürzungen wie „u.a.“, „z.B.“ o.ä. sollten ausgeschrieben werden, sofern sie eindeutig sind. Außerdem gibt es auch schöne Methoden für Titelkursivschreibungen: Man kann jeden höchstens durch Zeichen, nicht Buchstaben ergänzten Fernsehserientitel (Kategorie [Oberkategorie muss Kategorie:Fernsehserie sein] des verlinkten Artikels überprüfen oder auf Infobox achten) ohne Probleme kursiv schreiben (dass heißt: aus „[[Hör mal, wer da hämmert|Hör-mal-wer-da-hämmert]]-Darsteller
“ würde beispielsweise „''[[Hör mal, wer da hämmert|Hör-mal-wer-da-hämmert]]''-Darsteller
“, beziehiehungsweise aus „[[Star Trek]]-Fan
“ „''[[Star Trek]]''-Fan
“ – hierbei könnte man auch gleich auf Durchkopplung achten: „''[[Star Trek|Star-Trek]]''-Fan
“, wenn ein Wort direkt mit Bindestrich an den Link angeschlossen ist). Wenn das ginge, könnte man ja gleich auch falsch benutzte Anführungszeichen ändern. Unbetroffen blieben dann natürlich Dinge, wie „[[Hör mal wer da hämmert|Hör mal wer da klingelt]]
“, da die Buchstaben sich geändert haben. Wäre es dabei nicht auch gleich noch zusätzlich allgemein möglich, Wikilinks zu vereinfachen, sowas wie „[[Wikipedia|Wikipedias]] Grundlagen
“ zu „[[Wikipedia]]s Grundlagen
“?…
Eiragorn Let's talk about... Ολλίμίνατορέ 17:10, 28. Mai 2007 (CEST)
- Ah, danke – das ist mal eine Menge interessanter Ideen. Am einfachsten und unproblematischsten dürfte wohl die Linkvereinfachung sein, so ich Zeit dafür finde, sollte das bald drin sein, die kursiven Titel ebenso. Bei tatsächlichen Änderungen am geschriebenen Text (Zahlen, Abkürzungen) dürfte es wohl kritischer werden – Autoren haben sich in einigen Fällen vielleicht bewusst dafür entschieden. Das dann gegen ihren Willen botgestützt reinzusetzen wäre zwar technisch machbar, aber es kommt mir etwas „gefährlich“ vor … Mitlesende mögen sich hiermit zur Meinungsäußerung aufgefordert fühlen. --Tobias K. 18:01, 28. Mai 2007 (CEST)
- Stimmt... Daran habe ich gar nicht gedacht, aber – um ehrlich zu sein – fällt mir kein Fall ein, der durch eine Änderung davon den Sinn verzerrt. Vielleicht kann man mal irgendwo nachfragen, ob sowas erwünscht ist. Ansonsten gilt das mit der Kursivschreibung natürlich ohne Einschränkung auch für Filme (Oberkategorie Kategorie:Filmtitel) und ist das mit der Durchkopplung möglich, sofern auf etwas zusammenfassendes (Wikilinks, Anführungszeichen, Kursiv- oder Fettschreibung) ein direkt mit Bindestrich angefügtes Wort folgt, möglich oder vielleicht sogar schon integriert? Ansonsten biete ich mich auch noch als Botbetreiber an…
Eiragorn Let's talk about... Ολλίμίνατορέ 22:35, 28. Mai 2007 (CEST)
- Stimmt... Daran habe ich gar nicht gedacht, aber – um ehrlich zu sein – fällt mir kein Fall ein, der durch eine Änderung davon den Sinn verzerrt. Vielleicht kann man mal irgendwo nachfragen, ob sowas erwünscht ist. Ansonsten gilt das mit der Kursivschreibung natürlich ohne Einschränkung auch für Filme (Oberkategorie Kategorie:Filmtitel) und ist das mit der Durchkopplung möglich, sofern auf etwas zusammenfassendes (Wikilinks, Anführungszeichen, Kursiv- oder Fettschreibung) ein direkt mit Bindestrich angefügtes Wort folgt, möglich oder vielleicht sogar schon integriert? Ansonsten biete ich mich auch noch als Botbetreiber an…
- Ja, bevor ich es implementieren würde, wäre auf jeden Fall eine Meinungssammlung an passender Stelle Voraussetzung. Erst einmal bin ich aber wohl auch mit den unkritischen Sachen gut beschäftigt. Die Durchkopplung sollte gut möglich sein, zumindest sehe ich grade keinen Hinderungsgrund.
- Ansonsten freut mich natürlich der letzte Satz. Deine ersten Schritte sollten dich hierhin und dorthin führen. Liegt bei dir, ob du unter eigener oder Comillas Flagge (sprich Benutzeraccount) operieren willst. Im letzteren Fall frag einfach nochmal bei mir an – ebenso, falls etwas nicht (auf Anhieb) funktioniert. --Tobias K. 10:29, 29. Mai 2007 (CEST)
- Erledigt der Bot eigentlich auch Selbstlinks oder löst Redirects auf, sofern sie nicht direkt eingebunden sind sondern in der Form
[[Der Redirect, auf die ich verlinke|irgendein Text]]
vorliegen. Vorlagenredirects sollten ja immer aus Datenbankbelastungsgründen aufgelöst werden…
Eiragorn Let's talk about... Ολλίμίνατορέ 22:49, 28. Mai 2007 (CEST)
- Erledigt der Bot eigentlich auch Selbstlinks oder löst Redirects auf, sofern sie nicht direkt eingebunden sind sondern in der Form
- Nein, tut er im Moment nicht. Aber nicht, weil ich was dagegen hätte, sondern nur, weil das noch ein wenig Programmierung erfordert. Und die wiederum erfordert Zeit … na ja, das übliche Problem. --Tobias K. 10:29, 29. Mai 2007 (CEST)
Ungültiges Archivierungsziel
Die Zielangabe bei der automatischen Archivierung dieser Seite ist ungültig. Sie muss mit demselben Namen wie diese Seite beginnen. Wende dich bitte an meinen Besitzer, wenn das ein Problem darstellen sollte. ArchivBot 03:03, 29. Mai 2007 (CEST)
- Habe mich drum gekümmert. Duplikat von 12:02 entfernt. --Tobias K. 14:28, 29. Mai 2007 (CEST)
Anfrage
Hallo Tobias! Wenn ich derzeit Artikel bearbeite, mache ich einige Dinge, die Dein Bot erledigt, händisch (was ziemlich nervt). Kann ich Deinen Bot dazu benutzen, den Artikel zu überarbeiten und dann schreibe ich noch mein Zeugs mit rein und speichere das ganze ab? Oder speichert der Bot die Änderungen direkt ab? Abgesehen davon habe ich Interesse daran, mit Deinem Bot auf Fehlerjagd zu gehen, könntest Du mir daher sagen, wie das funktioniert bzw. mir die entsprechende Berechtigung geben? Danke! Zottmann 19:06, 30. Mai 2007 (CEST)
- Hallo! Natürlich kannst du das Tool auch auf diese Weise einsetzen. Du benötigst – falls noch nicht vorhanden – eine Java-Laufzeitumgebung, das hier und das. Auf diese Anleitung kannst du einen Blick werfen, ist zwar nicht umfassend, aber vielleicht ganz nützlich. Denk daran, in den Konfigurationsdateien (in einem Ordner .JETERS, bei Windows XP war es irgendwo in „Dokumente und Einstellungen“) die deutschsprachige Wikipedia (de statt en) anzugeben.
- Wenn du das Programm zum Laufen gebracht hast, wählst du als Quelle (input) „MediaWikiIO“, als Ziel (output) nur „UserIO“ (damit erfolgt kein Schreibzugriff auf Wikipedia) und als „replacer“ den „ComillaReplacer“. Mit den Standardeinstellungen bekommst du die Änderungen dann häppchenweise zum Abnicken oder Ablehnen serviert. Das Ergebnis kopierst du dann (Ctrl-a, Ctrl-c geht eigentlich immer) ins Bearbeiten-Fenster des Artikels und machst den Rest.
- Für Botbetrieb musst du im Grunde nur den UserIO durch nochmal MediaWikiIO ersetzen – für etwas weniger Klickklick vielleicht noch ein paar Einstellungen anpassen. Die Accountdaten von Comilla schick ich dir dann per Mail, wenn du mir Bescheid gibst, dass sonst alles läuft. Und bei Problemen, einfach fragen – hier, Mail, Jabber oder ICQ. --Tobias K. 21:59, 30. Mai 2007 (CEST)
- Ich habe Jeters runtergeladen und nach C:\Programme\Jeters kopiert. Die Comilla.jar habe ich unter components reinkopiert. Wenn ich im Jeters-Verzeichnis den Befehl java -jar jeters.jar ausführe, kommt folgende Fehlermeldung:
Exception in thread "main" java.lang.UnsupportedClassVersionError: Bad version number in .class file at java.lang.ClassLoader.defineClass1(Native Method) at java.lang.ClassLoader.defineClass(Unknown Source) at java.security.SecureClassLoader.defineClass(Unknown Source) at java.net.URLClassLoader.defineClass(Unknown Source) at java.net.URLClassLoader.access$100(Unknown Source) at java.net.URLClassLoader$1.run(Unknown Source) at java.security.AccessController.doPrivileged(Native Method) at java.net.URLClassLoader.findClass(Unknown Source) at java.lang.ClassLoader.loadClass(Unknown Source) at java.lang.ClassLoader.loadClass(Unknown Source) at net.sf.jeters.core.Core.getComponentClassesFromJarFiles(Unknown Source) at net.sf.jeters.core.Core.getAvailableComponentClasses(Unknown Source) at net.sf.jeters.core.Core.initializeConfigurations(Unknown Source) at net.sf.jeters.core.Core.run(Unknown Source) at net.sf.jeters.core.JETERS.main(Unknown Source)
- Wenn ich jedoch die Comilla.jar z. B. in Comilla.bak umbenenne, kann ich Jeters starten. Ich habe unter %userprofile%\.Jeters auch eine ComillaReplacer.xml angelegt mit folgendem Inhalt:
<?xml version="1.0" encoding="UTF-8"?> <configuration> <conf name="removeWhitespace" type="boolean">1</conf> </configuration>
Aber funktioniert trotzdem nicht. Was soll ich machen? Zottmann 22:56, 30. Mai 2007 (CEST)
- Der erste Fehler weist darauf hin, dass deine Java-Runtime veraltet ist. Das Umbenennen löst das Problem deshalb, weil die Runtime für die anderen Klassen offenbar noch ausreicht, nur für Comilla nicht – und das Programm Comilla dann nicht mehr findet, also auch kein Problem bemerkt. Nimm wenn irgendwie möglich Java in Version 1.6 (Version prüfen geht mit
java -version
in einer Kommandozeilenumgebung). Sachen wie „5.0“ sind übrigens älter als 1.6. - Zur Konfigurationsdatei: Nach dem ersten Programmstart sollten schon Konfigurationsdateien irgendwo herumliegen. Neu anlegen muss man sie normalerweise nicht. Falls nur die ComillaReplacer.xml gefehlt hat, liegt das an Fehler #1 (das Programm wurde noch nie mit Comilla gestartet). Wenn da überhaupt keine waren, hat Windows sie woanders abgelegt.
- Lass mich wissen, ob es geholfen hat! --Tobias K. 23:32, 30. Mai 2007 (CEST)
- Das war's! Mit der aktuellen Version ging's auf Anhieb. Danke. Meine ICQ-Nr. is übrigens 326103925. Zottmann 00:27, 31. Mai 2007 (CEST)
- Der erste Fehler weist darauf hin, dass deine Java-Runtime veraltet ist. Das Umbenennen löst das Problem deshalb, weil die Runtime für die anderen Klassen offenbar noch ausreicht, nur für Comilla nicht – und das Programm Comilla dann nicht mehr findet, also auch kein Problem bemerkt. Nimm wenn irgendwie möglich Java in Version 1.6 (Version prüfen geht mit
Erklärung der Botbetreiber
Um zu verhindern, dass Lizenzfragen einer Weiterverwendung eines von Comilla bearbeiteten Textes im Wege stehen, möchte ich hier den Willen aller – auch ehemaliger – Betreiber zu einer Verwendung der Bearbeitungen nicht nur unter GFDL, sondern unter jeder beliebigen anderen Lizenz, die durch die Autoren des zugrundeliegenden Textmaterials jetzt oder in Zukunft ermöglicht wird, dokumentieren. Die Bearbeiter verzichten außerdem auf individuelle Namensnennung zugunsten einer Repräsentation durch den Account des ComillaBot. --Tobias K. 23:51, 5. Okt. 2007 (CEST)
- Ich selbst stimme hier selbstverständlich in vollem Umfang zu. --Tobias K. 23:51, 5. Okt. 2007 (CEST)
- Zustimmung in allen Punkten auch von mir. -- Wampenseppl 23:54, 5. Okt. 2007 (CEST)
- Ich stimme auch zu. --Jens Lallensack 11:40, 6. Okt. 2007 (CEST)
korrekte ISBN-Schreibung
Laut Benutzerseite kümmert sich ComillaBot um korrekte ISBN-Schreibung (darunter verstehe ich Bindestriche an den entsprechenden Stellen). Ich habe mir ein paar Edits angesehen, und ComillaBot scheint dies nicht zu tun? --° 10:10, 12. Nov. 2007 (CET)
- Die „korrekte ISBN-Schreibung“ bedeutet derzeit lediglich, dass überflüssige Zeichen wie Doppelpunkte nach dem ISBN rausgeworfen werden und die Schreibung auf Bindestrich-Schreibung vereinheitlicht wird (statt etwa Leerzeichen). Wenn noch keine Trennzeichen drin sind, wird im Moment da nichts gemacht. Das können wir aber gerne ändern – wenn ich mir FZW ansehe, bist du ja ein ISBN-Experte. ;-)
- Also: Wie genau geht man vor, wenn man etwas wie ISBN 978-0070072725 findet? Da die einzelnen Bestandteile ja unterschiedlich lang sein können, dürfte das nicht trivial sein. Nimmt man dafür eine Liste der möglichen Nummern für jeden Teil? Oder greifst du da auf externe Tools zurück? Klär mich auf, dann seh ich, ob ich es der Software beibringen kann.
- Ach ja – hast du noch einen Link zu einem der Fälle, wo Comilla eine Korrektur hätte vornehmen sollen? --Tobias K. 11:11, 12. Nov. 2007 (CET)
- Mein Vorschlag wäre, dass ComillaBot einen Aufruf auf mein Tool (zur Zeit allerdings ist dieser Teil vom Toolserver down) macht (beispielsweise durch Aufruf von [3]). Alternativ könnte ich Dir die relevanten Teile des Quellcodes schicken, aber da die ISBN-Organisation von Zeit zu Zeit Ändererungen an der ISBN-Definition vornimmt, rate ich davon eher ab. Ein Beipiel, wo ComillaBot, das bei einem Edit mitmachen hätte können, ist: [4]. --° 11:45, 12. Nov. 2007 (CET)
- Nun, wenn du schon so ein Werkzeug hast, werde ich Comilla wohl wirklich am besten darauf zugreifen lassen, wir brauchen ja keine unnötige Redundanz reinbringen. Kann ein wenig dauern, bis ich das eingebaut habe, weil ich gerade ein paar Umstrukturierungen im Kerncode vornehme. Im Grundsatz sollte das dann aber kein Problem sein. Danke schon einmal für die Anregung! --Tobias K. 12:13, 12. Nov. 2007 (CET)
- Gib mir dann doch bitte Bescheid, wenn es so weit ist. --° 12:20, 12. Nov. 2007 (CET)
- Klar, mach ich. --Tobias K. 13:50, 12. Nov. 2007 (CET)
Anführungszeichen bei Bedeutungsangaben
Der Bot hat im Artikel Altostslawische Sprache viel Sinnvolles angestellt, aber dann auch an vielen, vielen Stellen die in der Sprachwissenschaft üblichen einfachen Anführungszeichen oben, mit denen die Bedeutung objektsprachlicher Ausdrücke angegeben wird, durch deutsche Anführungszeichen zweiter Ebene ersetzt, die da nun wirklich überhaupt nichts zu suchen haben (vgl. Anführungszeichen#Anführungszeichen in der Wissenschaft). Ich habe diese Änderungen rückgängig gemacht und bitte darum, den Bot so umzuprogrammieren, dass so etwas nicht mehr passiert. (Solange das nicht der Fall ist, bitte ich, ihn nicht mehr auf Artikel loszulassen, die sprachwissenschaftliche Inhalte haben.) --Daniel Bunčić 12:13, 17. Nov. 2007 (CET)
- Sorry, war mir so nicht bewußt. Ich werde in Zukunft aufpassen. --Jaelle 13:28, 17. Nov. 2007 (CET)
- Da muss ich als Programmierer ebenfalls um Verzeihung bitten, von dieser Gepflogenheit hatte ich bislang auch nicht gehört. (Insofern ist es hilfreich, dass du es eben in WP:TYP angemerkt hast.) Dass das Problem nur bei Ersatzzeichen auftritt (' ', nicht bei ‘ ’), ist da wohl auch keine Entschuldigung, da die Ersatzzeichen ja doch noch wesentlich „richtiger“ sind. Ich werde versuchen, dem Bot das verständlich zu machen … wird schwierig, ist aber ohne Zweifel nötig. Bis zu einer technischen Lösung bitte ich das gesamte Team, bei so etwas aufzupassen und im Zweifelsfall einen Artikel in Ruhe zu lassen, Fehler sollten wir uns nicht erlauben. Auf jeden Fall vielen Dank für den Hinweis. --Tobias K. 14:03, 17. Nov. 2007 (CET)
Keine Ursache und danke für das Verständnis. Ich werde meinerseits in Zukunft immer die typographischen ‘…’ benutzen. --Daniel Bunčić 18:05, 17. Nov. 2007 (CET)
Anführungszeichen in englischen Sätzen
Hallo, mir ist aufgefallen, dass der Bot beim Artikel Organell "normale" gegen typoraphische ersetzt hat. Macht ja normalerweise auch Sinn. In einem Fall jedoch geht es um einen englischen Titel einer Referenz: Concerning the concept "Organelle". Da gehören die Zeichen dann ja tatsächlich nach oben. Ob man Sätze in Ref-Tags auslassen sollte? Einen besseren Vorschlag habe ich leider nicht. --Dietzel65 22:09, 16. Nov. 2007 (CET)
- Sorry, da hab ich wohl nicht aufgepasst, habs schon korrigiert. Ich habe den Artikel im Review gesehen und mal kurz den Bot durchgeschickt. Ref-Tags enthalten meistens viele Fehler, besonders Seitenangaben (Bis-Striche u. s. w.), ich währe nicht dafür, die auszuschließen.
- Unser Projektleiter und Bot-Programmierer Tobias K. hat mir mal erklärt, dass der Bot die englischen Anführungszeichen nicht ändert, wenn sie korrekt gesetzt sind. Normale Hochkommata ("") sind jedoch im Englischen genau so falsch wie im Deutschen, im Englischen müssen es diese hier sein: (“”).
- Warum? Sehen doch beide genauso aus. Wozu hab' ich die denn auf meiner Tastatur wenn nicht dafür? --Dietzel65 16:55, 17. Nov. 2007 (CET)
- Naja, sie unterscheiden sich schon, schau sie dir mal vom Nahen an. Bei den typografischen Anführungszeichen gibt es ein sich öffnendes und ein sich schließendes, die einfachen Hochkommata "" sind eigentlich Zollzeichen. Die typografischen Anführungszeichen sind nicht auf der Tastatur, ich glaub weil sie nicht im ASCII-Zeichensatz enthalten und in jedem Land verschieden sind. Weil das so ist, werden häufig fälschlicherweise die Hochkommata statt den richtigen Anführungszeichen genommen (besonders im Englischen). Typografische Anführungszeichen ergeben einfach ein besseres Schriftbild und lassen nicht einen solchen amateurhaften Eindruck entstehen. Näheres dazu siehe im Artikel Anführungszeichen.--Jens Lallensack 18:23, 17. Nov. 2007 (CET)
- ok, zwischen “…” und "…" kann ich in meinem Web-Browser (Firefox 2) einen Unterschied sehen. Aber “…” und "…" sehen für mich nach wie vor gleich aus. Da Anführungszeichen doch eher selten in <big><big>“…”</big></big>-Tags gepackt werden, würde ich bei der Aussage bleiben wollen, dass es im englischen Text egal ist. Heißt anders herum auch: ich werde mich nicht sträuben wenn sich jemand die Mühe macht sie einzuführen. Danke nochmal für's korrigieren der „echten“ Fehler. --Dietzel65 10:17, 18. Nov. 2007 (CET)
- Naja, sie unterscheiden sich schon, schau sie dir mal vom Nahen an. Bei den typografischen Anführungszeichen gibt es ein sich öffnendes und ein sich schließendes, die einfachen Hochkommata "" sind eigentlich Zollzeichen. Die typografischen Anführungszeichen sind nicht auf der Tastatur, ich glaub weil sie nicht im ASCII-Zeichensatz enthalten und in jedem Land verschieden sind. Weil das so ist, werden häufig fälschlicherweise die Hochkommata statt den richtigen Anführungszeichen genommen (besonders im Englischen). Typografische Anführungszeichen ergeben einfach ein besseres Schriftbild und lassen nicht einen solchen amateurhaften Eindruck entstehen. Näheres dazu siehe im Artikel Anführungszeichen.--Jens Lallensack 18:23, 17. Nov. 2007 (CET)
- Man darf halt nicht von seiner eigenen Computer-Betriebssystem-Bildschirm-Browser-Schriftarten-Konfiguration auf andere schließen, bei anderen Einstellungen sieht man den Unterschied durchaus. --Daniel Bunčić 12:34, 18. Nov. 2007 (CET)
- Die einzige Lösung die ich sehe: Botführer müssen besser aufpassen :-) Gruß, --Jens Lallensack 22:48, 16. Nov. 2007 (CET)
Geschützte Leerzeichen bei Abkürzungen
Hierher verschoben von Benutzer_Diskussion:ComillaBot/Abkürzungen. --Tobias K. 23:11, 24. Nov. 2007 (CET)
Davon halte ich _überhaupt_ nichts. Die nbsp-Zeichen vermüllen den Quelltext; die korrekte Anzeige muss softwaremäßig geschehen. Wenn man schon so eine kompakte Liste der wichtigsten Abkürzungen machen kann, kann man die doch auch irgendwie in eine Anzeige-Anweisung (Monobook?) einbauen, oder? --AndreasPraefcke ¿! 15:16, 24. Nov. 2007 (CET)
- Für eine softwareseitige Anzeige muss allerdings sichergestellt sein, dass etwa zwischen z. und B. immer ein Punkt gehört (mir fällt im Moment kein anderer Fall ein, müsste man prüfen). Wenn dies gegeben ist, würde ich voll hinter einer derartigen Lösung stehen – wie sie ja seit einiger Zeit auch für Prozentzeichen existiert. Wie stehen die Chancen, dass man so eine Änderung durchsetzt? Und wo würdest du empfehlen, sie vorzuschlagen? --Tobias K. 23:13, 24. Nov. 2007 (CET)
Ich finde das auch falsch. Bsp: Artikel über Technisches Hilfswerk. Zum einen ist die Abkürzung z.B. nicht falsch (s. Duden, Wörterbuch). Zum anderen stören die nbsp; Zeichen im Quelltext extrem. Wenn man der Meinung ist, das ist falsch, warum macht man nicht einfach ein Leerzeichen im Text? --Webmatrose 15:47, 24. Nov. 2007 (CET)
- (Separate Antwort, da es hier eher um die prinzipielle Richtigkeit als um die technische Umsetzung geht.)
- Nun, soweit ich informiert bin, wird „z.B.“ im Allgemeinen nicht zusammengeschrieben. Was mir an Duden-Material vorliegt, empfiehlt auch ein Leerzeichen. Das vom Schriftbild eigentlich optimale   ist wegen der Kompatibilität zu Problembrowsern in WP nicht erwünscht, also bleibt das normale . Ein ungeschütztes Leerzeichen ist für die Lesbarkeit definitiv wenig hilfreich – wenn eine Zeile mit einem „z.“ aufhört, stolpert man da beim Lesen zwangsläufig drüber.
- „Falsch“ finde ich es also definitiv nicht. Man muss aber natürlich abwägen, ob der Darstellungsvorteil beim Lesen den unintuitiveren Quelltext beim Bearbeiten rechtfertigt. Bisher hatte ich den Eindruck, dass das hier durchaus akzeptiert ist. (Einmal davon abgesehen, dass man nach den WP-Empfehlungen sowieso „zum Beispiel“ schreiben soll.) Aber ok, es ist wohl besser, da erstmal die Finger von zu lassen, bis das geklärt ist. --Tobias K. 23:16, 24. Nov. 2007 (CET)
- Diese WP-Empfehlung ist natürlich völliger Unfug. Ich bin zwar grundsätzlichdafür, Abkürzungen auszuschreiben, aber natürlich nur die, die ausgeschrieben leichter zu lesen sind. Das ist bei den Allerweltsabkürzungen "z. B." und bei "u. a." und bei "usw." schlicht nicht der Fall. --AndreasPraefcke ¿! 23:18, 24. Nov. 2007 (CET)
An die Botarbeiter
Ich hab auf der üblichen Seite eine neue Version bereitgestellt, die unter anderem erlaubt, das Hinzufügen geschützter Leerzeichen bei Abkürzungen zu deaktivieren (siehe oben). Bitte diese ab sofort einsetzen. --Tobias K. 23:18, 24. Nov. 2007 (CET)
Nichtüberprüfbarkeit von Artikeln
Bisher konnte ich die Artikel Negatives Stimmgewicht bei Wahlen sowie Bundesversammlung (Deutschland) nicht überprüfen, da sich JETERS dabei aufhängte. Tritt das bei euch auch auf? --Skyman gozilla 22:58, 15. Dez. 2007 (CET)
- Ja, passiert bei mir genauso. --Jaelle 00:08, 16. Dez. 2007 (CET)
- Bei mir das selbe; in beiden Artikeln sind solch lange Tabellen drin, glaub das hängt damit zusammen. --Jens Lallensack 09:13, 16. Dez. 2007 (CET)
- Nun, hab ich mir dann also auch mal angesehen, es handelt sich offenbar um einen StackOverflow in Javas vordefinierten Klassen für Reguläre Ausdrücke. Das könnte in der Tat an den ausladenden Tabellen mit Farbinformationen, mehrspaltigen Zellen etc. liegen, weil beim Suchen nach dem Ende (zum Zweck des Schutzes der Tabellensyntax vor Beschädigungen) der Ausdruck einfach zu lang wird. Muss ich sehen, was ich machen kann. --Tobias K. 09:35, 16. Dez. 2007 (CET)
- Wenn es am Stack liegt, könnte es vielleicht helfen, java mit der Option -Xss<size> zu starten? --° 11:03, 16. Dez. 2007 (CET)
- Stimmt, mit einem -Xss1M ist das Problem für den Stimmgewicht-Artikel behoben (weniger kann durchaus auch reichen, aber der Speicher kostet ja nichts …). Ist zwar nicht so schön wie eine Lösung durch effizienteres Programm – da eine solche aber auch erst mal geschrieben werden muss, empfehle ich, dass die Operatoren und Nutzer bei entsprechenden Problemen JETERS mit einem solchen Parameter starten. Ich hoffe, dass das bei allen für Abhilfe sorgt. Danke schon mal an alle für Fehlerbericht und Workaround! --Tobias K. 11:31, 16. Dez. 2007 (CET)
- Sehr schön! Mit dem Parameter lassen sich beide Artikel jetzt überprüfen. Danke! --Skyman gozilla 12:50, 16. Dez. 2007 (CET)
- Stimmt, mit einem -Xss1M ist das Problem für den Stimmgewicht-Artikel behoben (weniger kann durchaus auch reichen, aber der Speicher kostet ja nichts …). Ist zwar nicht so schön wie eine Lösung durch effizienteres Programm – da eine solche aber auch erst mal geschrieben werden muss, empfehle ich, dass die Operatoren und Nutzer bei entsprechenden Problemen JETERS mit einem solchen Parameter starten. Ich hoffe, dass das bei allen für Abhilfe sorgt. Danke schon mal an alle für Fehlerbericht und Workaround! --Tobias K. 11:31, 16. Dez. 2007 (CET)
Bei wem geht Insulinpräparat? --Skyman gozilla 15:30, 17. Dez. 2007 (CET)
- Das geht bei mir auch nicht. Ich habe Tests durchgeführt und bin zu den Schluss gekommen, dass es an diesen mit
Rinderinsulin -------------------
/ \
Gly-Ile-Val-Glu-Gln-Cys-Cys-Ala-Ser-Val-Cys-Ser-Leu-Tyr-Gln-Leu-Glu-Asn-Tyr-Cys-Asn
\ /
\ /
- Gruß, --Jens Lallensack 21:35, 17. Dez. 2007 (CET)
- Danke euch beiden auch hierfür. Als erste Lösung habe ich einen Mangel beim Tag-Schutz behoben (bei <code>-Tags), der auch andere Code-Elemente betreffen konnte. Denn eigentlich sollte Comilla da eh die Finger von lassen – egal, ob da Strukturformeln oder Quellcode drinsteht, es folgt jedenfalls normalerweise keiner gewöhnlichen Typografie. Version mit Korrektur gibts wie üblich auf [5]. Bei mir lässt sich der Artikel damit normal bearbeiten.
- Nebenbemerkung: Wenn ich mal Zeit habe, schau ich mir den Fall noch mal genauer an, wieso gerade solcher Inhalt zu Problemen führen kann, ist mir noch nicht klar. Der Artikel ist aber auch anderweitig etwas … herausfordernd, etwa durch unmotivierte Zeilenumbrüche im Fließtext zwischen zwei Anführungszeichen. (Beispiel: „Nach der[Zeilenumbruch]Injektion in das Subkutangewebe“) Das macht Ärger, weil dann natürlich nicht mehr erkennbar ist, welches Zeichen zu welchem Partner gehört. Hab mir die Version mal gespeichert, da kann man einige Optimierungspotentiale für Comilla finden. Wer diesen Artikel korrigiert, sollte idealerweise gleich noch etwas Handarbeit anlegen. (Die inhaltlichen Autoren übrigens auch, ich sehe da einige „TODO“ im Text stehen. *g*)
- --Tobias K. 22:37, 17. Dez. 2007 (CET)
- Jupp, geht. --Skyman gozilla 22:50, 17. Dez. 2007 (CET)
- Nekrolog 2007. --Skyman gozilla 18:47, 27. Dez. 2007 (CET)
- Funktioniert bei mir sowohl in der alten als auch in der aktuellen Version, sowohl mit als auch ohne -Xss-Option. --Jowereit 19:32, 27. Dez. 2007 (CET)
- Merkwürdig, ohne „-Xss“ hat es funktioniert, mit jedoch nicht. Danke! --Skyman gozilla 19:38, 27. Dez. 2007 (CET)
Operator-Bewerbung Jaelle
Auf der ComillaBot-Seite steht, dass Helfer (Operatoren) gebraucht werden können. Ich würde mich dafür interessieren. --Jaelle 21:28, 1. Nov. 2007 (CET)
- Na, das freut mich doch. :) E-Mail an dich ist gerade rausgegangen. --Tobias K. 20:43, 2. Nov. 2007 (CET)
Fragen und Operator-Bewerbung Jowereit
Hallöchen, ich habe mir Comilla mal runtergeladen und ihn auch schon einige Male zum Korrigieren von typografischen Fehlern auf Seiten genutzt. Ich könnte mir vorstellen, mich gelegentlich als "Operator" „Operator“ zu beteiligen, wollte aber davor mal nachfragen: Was genau bringt mir das? Oder ist das erforderlich, um den Bot sozusagen offiziell einsetzen zu können? Danke -- Jowereit 18:12, 8. Dez. 2007 (CET)
- Als Operator zu arbeiten bedeutet gegenüber der normalen Arbeit eigentlich nur, dass du unter Comillas Account statt unter deinem eigenen arbeitest, es bringt weder weiterreichende Möglichkeiten noch ist es in irgendeiner Weise verpflichtend. Der Sinn dahinter ist vor allem, dass die Edits ein Botflag bekommen – manche Nutzer blenden solche Routinekorrekturen gerne aus ihrer Beobachtungsliste aus. Außerdem laufen dann Fehlermeldungen von Usern direkt hier auf der Diskussionsseite auf. Kurzum, für eine Operatorposition würde sprechen:
- du möchtest keinen eigenen Botaccount anlegen (wäre aber unterhalb einer gewissen Arbeitsgeschwindigkeit ohnehin verzichtbar)
- es macht dir nichts aus, auf die Erhöhung der eigenen Beitragszahl, auf Namensnennung sowie auf sämtliche lizenzrechtlichen Ansprüche zu verzichten
- Nicht zu verwenden ist der Operatorstatus, wenn du die Korrekturen zusammen mit größeren anderen Bearbeitungen vornimmst, da diese sonst unzulässigerweise als Botedit „getarnt“ würden. Die Entscheidung liegt bei dir. --Tobias K. 20:59, 8. Dez. 2007 (CET)
- Hallo Tobias K., vielen Dank für deine ausführliche Antwort. In diesem Fall melde ich mich gerne als Operator. -- Jowereit 18:54, 9. Dez. 2007 (CET)
Operator-Bewerbung
Hallo,
ich interessiere mich versuchsweise als Operator tätig zu sein. Könntest du mir Infos schicken? -- Carl Steinbeißer 00:44, 12. Jan. 2008 (CET)
- Hallo! Da schick ich dir doch gleich mal eine Mail, sollte in Kürze eintreffen. --Tobias K. 01:20, 12. Jan. 2008 (CET)
Neues Feature: Kursive Klammern
’n Abend,
„Steht innerhalb von Klammern oder Anführungszeichen der gesamte Text in einer bestimmten Auszeichnung, werden die Klammern oder Anführungszeichen identisch formatiert: „So!“ (und nicht anders!). Dasselbe gilt sinngemäß auch für die übrigen Satzzeichen. Stehen sie in oder direkt nach kursiv bzw. fett formatiertem Text, werden sie auch kursiv bzw. fett ausgezeichnet: Es ist heiß!“
Momentan mache ich das bei meinen Korrekturen mit ComillaBot immer manuell, wenn es mir beim Durchlesen des Artikels auffällt. Vielleicht wäre das aber auch ein ganz praktisches Feature für ComillaBot. Man müsste nur darauf achten, dass die Korrektur abschaltbar ist, denn bei wissenschaftlichen Namen werden die Klammern nicht kursiv gesetzt. Wäre dieses Feature machbar bzw. was haltet ihr davon? – Jowereit (typografie.js) 22:18, 20. Jan. 2008 (CET)
- Zur Machbarkeit: Die Ersetzungsregeln sind vermutlich nichts, was über die Mächtigkeit regulärer Ausdrücke hinausgeht, also mit ein bisschen Arbeit sicher umsetzbar. An was hast du beim Abschalten gedacht? Pro Programmlauf, Absatz, Artikel, Einzelfall? --Tobias K. 23:01, 20. Jan. 2008 (CET)
- PS: Hübsches Skript in deiner Sig. Ich tippe meine Apostrophe zwar lieber selbst, aber es könnte doch den „Fehlernachschub“ wenigstens ein bisschen eindämmen helfen.
- Gute Frage – die Abschaltung sollte auf jeden Fall entweder pro Artikel oder pro Programmlauf erfolgen (da die Ersetzung bei der Korrektur von wissenschaftlichen Artikeln am besten gar nicht vorgenommen werden sollte, um Fehlersetzungen möglichst zu vermeiden). Ich habe spontan an eine Einstellung in der ComillaReplacer.xml gedacht, was aber nur sinnvoll ist, wenn man Artikel nicht wahllos, sondern nach Thema bearbeitet (beispielsweise alle Artikel einer Kategorie). Eine andere Möglichkeit fällt mir spontan nicht ein. – Jowereit (typografie.js) 19:38, 21. Jan. 2008 (CET)
- Die ComillaReplacer.xml ist programmiertechnisch die einfachste Lösung, wenn die also reicht, ist mir das recht. Ansonsten gäbe es noch die etwas aufwendigeren Möglichkeiten, etwa sicherzustellen, dass immer nur eine solche Korrektur auf einmal angezeigt wird, so dass Akzeptieren/Verwerfen per Ja/Nein schnell geht. --Tobias K. 12:42, 22. Jan. 2008 (CET)
- Stimmt, die Möglichkeit wäre sicher die optimale. Wenn es dir nicht zu viel Mühe bereitet … :-) – Jowereit (typografie.js) 19:40, 22. Jan. 2008 (CET)
Wenn gerade über neue Features geredet wird (mir würden die kursiven Klammern auch gefallen), kann man ComillaBot beibringen, dass er „Z.B.“ auch durch „Z. B.“ ersetzt? Mir ist auch noch die Abkürzung „v.a.“ aufgefallen, die nicht ersetzt wird. --Jaelle 19:58, 21. Jan. 2008 (CET)
- Meinst du „Z.B.“ am Anfang eines Satzes? Das sieht meiner Meinung nach ziemlich komisch aus – Folgendes habe ich beim Duden dazu gefunden:
„Einfache Abkürzungen am Satzanfang werden großgeschrieben, z. B. „Vgl.“ (für: vgl. = vergleiche), „Offz.“ (für: offz. = offiziell) oder „Heim.“ (für: heim. = heimisch). Man gerät jedoch leicht ins Grübeln, wenn am Satzanfang eine mehrteilige Abkürzung, die eigentlich mit kleinem Buchstaben beginnt, großgeschrieben wird. Da das ungewohnte Schriftbild verständnishemmend wirken könnte, sollten derartige Abkürzungen am Anfang eines Satzes besser ausgeschrieben werden, z. B.: „Mit anderen Worten“ statt „M. a. W.“, „Meiner Meinung nach“ und nicht „M. M. n.“.“
- (Hervorhebung von mir.) Sollte man „Z.B.“ also lieber durch „Zum Beispiel“ ersetzen (evtl. vorher den Operator warnen)? – Jowereit (typografie.js) 22:48, 21. Jan. 2008 (CET)
- Das wäre natürlich noch besser. --Jaelle 23:03, 21. Jan. 2008 (CET)
- Dann hoffe ich, dass ich am Wochenende Zeit finde, diese Features zu implementieren. Um aber hier mal etwas den Wikigedanken aufzugreifen, versuche ich einfach einmal folgendes: Benutzer:ComillaBot/Werkstatt. Ich bitte euch also, alles, was ihr gerne an großgeschriebenen Abkürzungen ausgeschrieben haben wollt, hier einzutragen – ich würde nämlich unter Garantie welche vergessen. Einfach einen der Beispielsbefehle kopieren und die Zeichenketten wie "Z[.]?[ ※]?B.", "Zum Beispiel" ändern. Kurzerklärung: [.]? heißt Punkt oder nichts, [ ※]? heißt Leerzeichen, geschütztes Leerzeichen oder nichts. Das erkennt also Z. B., Z. B., Z.B., Z B., Z B. ZB. Diese Werkzeuge sollten für die meisten Abkürzungen ausreichen, Fragen werden natürlich beantwortet. Und ich bin gespannt, ob es klappt. ;-) --Tobias K. 23:10, 22. Jan. 2008 (CET)
- Ihr seht, ich habe eine Vorliebe für zumindest oberflächliche rechtliche Absicherung. Da man einen GFDL-Text aber nicht so ohne weiteres in ein GPL-Programm einbauen kann …
Apostrophe bei Pinyin
Hallo,
bitte bei Pinyin keine Apostrophe ersetzten. Hier verwenden wir die "einfachen" [6]. Danke --chrislb disk 23:11, 11. Jan. 2008 (CET)
- Mh – ich nehme an, es gibt keine besonderen Kennzeichen, an denen ein Bot Pinyin-Wörter erkennen kann, oder? Das würde nämlich eine softwareseitige Absicherung erlauben. So müssten wir uns darauf verlassen, dass der menschliche Operator erkennt, dass hier ein Spezialfall vorliegt. Unabhängig davon werden wir die Konventionen eures Fachbereichs natürlich respektieren. --Tobias K. Signatur nachgetragen.
- Hmm, wieviele Wörter mit Apostroph gibt es, wo dieses nicht vor dem letzten Buchstaben steht? Los geht's, peter's book. Sprach's und ab. Damit bekommt man aber immer noch 1% der Pinyin ab (Chang'e), und wahrscheinlich werden dann 20% aller anderen übersehen. Ich könnte dir einen Regulären Ausdruck basteln, der Pinyin erkennt. --chrislb disk 00:10, 12. Jan. 2008 (CET)
- Na ja, es gibt leider noch die berühmten Fälle wie M’gladbach etc, und wenn es dann doch nicht alles schützt … Wenn du aber einen RegEx schreiben könntest, der eine signifikant bessere Quote erreicht, wäre das natürlich die perfekte Lösung. Von der Repräsentation her ist ein RegEx für Comilla nämlich ideal – so was kann ich in ein paar Minuten einbauen. --Tobias K. 00:24, 12. Jan. 2008 (CET)
- Folgende Regex frisst mehr, als sie eigentlich darf. Viele Silben kommen im Hochchinesischen nicht vor. Dies verschlechtert also etwas die Erkennungsrate, es gibt false possitives. Aber vielleicht kannst du sie testen, bevor ich weitere Eingrenzungen mache. Je mehr Regeln ich einfüge, desto größer wird das ganze Ding natürlich:
((?:(?:(?:[bcdfghjklmnpqrstwxyz]|[zcs]h)(?:i(?:ao|[uae])?|u(?:ai|[iaeo])?|üe?)) |er |(?:(?:(?:[bcdfghklmnprstwyz]|[zcs]h)|')?(?:a[oi]?|ei?|ou?)))(?:(?:ng|n)(?![aeo]))? |')*
- Woah. Das Ding lässt sich prinzipiell verwenden, frisst vor allem den Speicher auf. *g* Das erfordert dann wohl wirklich wortweise Erkennung (ich habs natürlich erst mal anders probiert, weil das programmiertechnisch besser gepasst hätte), und damit noch eine Handvoll Code. Dem false-positives-Problem könnte man wohl am besten beikommen, wenn es nur Warnungen für den Operator gäbe. Auf diese Weise könnte man auch einfacher mal eine Weile einfach in der Realität testen, welche Auswirkungen der Ausdruck hat und ob eine Verfeinerung eine entscheidende Verbesserung bringen könnte. Erfordert natürlich noch eine weitere Handvoll Code und wird in dieser Nacht nichts mehr, dürfte aber die praktikabelste Lösung sein. Sobald das drin ist, meld ich mich. Danke schon mal für den RegEx! --Tobias K. 01:58, 12. Jan. 2008 (CET)
- Hallo nochmal, ich habe den Ausdruck nocheinmal nachgebessert: a) '?:' entfernt, da sie hier unnötig sind und das lesen erschweren, b) die silbe 'er' hat jetzt ein look-ahead.
- Ich habe zudem noch vergessen, dass ich den Ausdruck damals nur als Demo erstellt habe, was noch fehlt sind die Tonmarker: ein einfacher Vokal drückt eine Klasse von "Vokalen mit Tonzeichen" aus. 'a' muss also durch '[āáǎàa]' ersetzt werden. Desweiteren gibt es [ēéěèe], [īíǐìi], [ōóǒòo], [ūúǔùu], [ǖǘǚǜü].
- Woah. Das Ding lässt sich prinzipiell verwenden, frisst vor allem den Speicher auf. *g* Das erfordert dann wohl wirklich wortweise Erkennung (ich habs natürlich erst mal anders probiert, weil das programmiertechnisch besser gepasst hätte), und damit noch eine Handvoll Code. Dem false-positives-Problem könnte man wohl am besten beikommen, wenn es nur Warnungen für den Operator gäbe. Auf diese Weise könnte man auch einfacher mal eine Weile einfach in der Realität testen, welche Auswirkungen der Ausdruck hat und ob eine Verfeinerung eine entscheidende Verbesserung bringen könnte. Erfordert natürlich noch eine weitere Handvoll Code und wird in dieser Nacht nichts mehr, dürfte aber die praktikabelste Lösung sein. Sobald das drin ist, meld ich mich. Danke schon mal für den RegEx! --Tobias K. 01:58, 12. Jan. 2008 (CET)
^(((([bcdfghjklmnpqrstwxyz]|[zcs]h)(i([āáǎàa][ōóǒòo]|[ūúǔùuāáǎàaēéěèe])?|[ūúǔùu] ([āáǎàa][īíǐìi]|[īíǐìiāáǎàaēéěèeōóǒòo])?|[ǖǘǚǜü][ēéěèe]?)) |er(?![āáǎàaēéěèeīíǐìiōóǒòoūúǔùu]) |((([bcdfghklmnprstwyz]|[zcs]h)|')?([āáǎàa][ōóǒòoīíǐìi]?|[ēéěèe][īíǐìi]?|[ōóǒòo][ūúǔùu]?))) ((ng|n)(?![āáǎàaēéěèeōóǒòo]))? |')*$
- Was ich im Endeffekt mache, ist die Tabelle unter Pinyin#Silben des Pinyin in einen Ausdruck zu gießen. Da diese Tabelle nicht vollbesetzt ist, kann also der Ausdruck optimiert werde, um nicht alle Silben zu enthalten.
- Wie gesagt, wenn Strings erkannt werden, die nachweislich kein Pinyin sind, dann könnte eine bessere Überdeckung der Tabelle verwendet werden. Ob der Ausdruck alle Pinyin-Schreibungen erfasst ist fraglich, da eine Chomsky-3 Gramatik für Pinyin nicht ausreicht und ich nicht sicher bin, ob diese 2 look-aheads alle Fälle abdecken. So solltest du nun aber den Ausdruck auf ein einzelnes Wort (ohne Leerzeichen) anwenden können, um zu testen ob es einen möglichen Pinyin-String darstellt. --chrislb disk 13:03, 12. Jan. 2008 (CET)
- Nun denn, ich habe deinen neuen Ausdruck soeben eingebaut. Meine Software warnt den Bediener jetzt, wenn ein Wort in der Sprache des Regex ist und ein ' enthält. Das sieht dann so aus. Fürs erste müsste das reichen, bei Gelegenheit baue ich aber noch eine Möglichkeit ein, zu entscheiden, ob die Wörter automatisch von der Bearbeitung auszunehmen sind. Das will ich aber dann wiederverwertbarer gestalten (auch für die Schweizer und die sonstigen Ausnahmen), weshalb das etwas längerfristiger anzugehen ist. Wie sich die Pinyin-Erkennung schlägt, muss man jetzt wohl mal in der Praxis feststellen. --Tobias K. 22:33, 12. Jan. 2008 (CET)
- PS: Wie steht es eigentlich mit Großschreibung? Dein Beispiel Chang'e oben ist ja groß geschrieben (da Eigenname?), der Regex enthält aber nur Kleinbuchstaben. Absicht so?
- Danke dir für die schnelle Übernahme. Kannst du die Großschreibung für den Ausdruck einstellen, oder muss ich ihn erweitern? Ich weiß nicht wie Java arbeitet, aber er müsste evtl. anhand des Locales entscheiden, was Groß- und was Kleinbuchstaben hat. --chrislb disk 11:09, 13. Jan. 2008 (CET)
- Na, das Programm ignoriert für die Überprüfung jetzt einfach mal Groß- und Kleinschreibung. Wohl die einfachste Lösung. Nach einigen eigenen Tests werd ich die neue Version jetzt jedenfalls den Operatoren zum Fraß vorwerfen. ;-) --Tobias K. 12:48, 13. Jan. 2008 (CET)
- Danke dir für die schnelle Übernahme. Kannst du die Großschreibung für den Ausdruck einstellen, oder muss ich ihn erweitern? Ich weiß nicht wie Java arbeitet, aber er müsste evtl. anhand des Locales entscheiden, was Groß- und was Kleinbuchstaben hat. --chrislb disk 11:09, 13. Jan. 2008 (CET)
- Konnte in Fantasiepass keinerlei Pinyin ausmachen, aber Comilla meldet welche. --Skyman gozilla 23:27, 18. Jan. 2008 (CET)
- Ergänzung hierzu: Es handelt sich um den Satz „Für zehn Mark konnte man am Schlagbaum, über dem in grün und gelb die Fahne der Wendenrepublik flatterte, einen Wendenpass mit Einreisestempel erhalten, der den Vermerk trug, gültig zu sein, 'so lange sein Inhaber noch lachen kann'“, in dem das 'so als Pinyin identifiziert wird … tja, keine Ahnung, ob man da was machen kann. --Tobias K. 01:17, 19. Jan. 2008 (CET)
- Morgen, dass sollte sich evtl. durch einen negativen Look-ahead realisieren lassen. Wörter in Pinyin fangen nicht mit einem Apostroph an. Eigentlich ist auch so keine Silbe im Hochchinesischen, während sou eine ist. Dies aber zu kodieren würde den Regulären Ausdruck immens vergrößern. Wenn man anstelle des einfachen Anfangsmarkers ^ folgends einfügt, sollte der Fall nicht auftreten:
^(?!\')
--chrislb disk 10:06, 19. Jan. 2008 (CET)
- Morgen, dass sollte sich evtl. durch einen negativen Look-ahead realisieren lassen. Wörter in Pinyin fangen nicht mit einem Apostroph an. Eigentlich ist auch so keine Silbe im Hochchinesischen, während sou eine ist. Dies aber zu kodieren würde den Regulären Ausdruck immens vergrößern. Wenn man anstelle des einfachen Anfangsmarkers ^ folgends einfügt, sollte der Fall nicht auftreten:
- Ergänzung hierzu: Es handelt sich um den Satz „Für zehn Mark konnte man am Schlagbaum, über dem in grün und gelb die Fahne der Wendenrepublik flatterte, einen Wendenpass mit Einreisestempel erhalten, der den Vermerk trug, gültig zu sein, 'so lange sein Inhaber noch lachen kann'“, in dem das 'so als Pinyin identifiziert wird … tja, keine Ahnung, ob man da was machen kann. --Tobias K. 01:17, 19. Jan. 2008 (CET)
- Hey, danke für die schelle und effiziente Problemlösung. Da will ich mich auch mal nicht lumpen lassen und habe das in die neueste Bugfix-Version 0801191227 eingebaut. Bitte alle verwenden. --Tobias K. 12:37, 19. Jan. 2008 (CET)
- Füenf Pinyin bei „Singin’“. --Skyman gozilla 20:39, 24. Jan. 2008 (CET)
Fehlerhafte Korrektur von Kaliberangabe
Ahoi, der Bot hat in Patrone (Munition) den Ausdruck "von .170" durch "von.170" ersetzt. Der Punkt ist hier kein Satzzeichen, sondern Bestandteil eines englischen Dezimalbruches ohne führende Null. Das .170 ist also ein Ausdruck mitten im Satz und sollte durch Leerzeichen von anderen Wörtern getrennt bleiben. Seltsamerweise hat der Bot die restlichen Kaliberangaben mit Punkt nicht angefaßt. grüßel --Thuringius 09:22, 25. Jan. 2008 (CET)
- Da es nur ein einziges Mal aufgetreten ist, handelt es sich wohl um einen menschlichen Fehler des Operators. Von vornherein unterbinden kann man das schwer, da eine Kaliberangabe im Fließtext für einen Bot nicht erkennbar ist, sie erfordert wohl semantisches Verständnis. Ich werde aber bei .[Zahlen] – besonders bei mehrmaligem Vorkommen – eine Warnung einbauen und die Funktionalität der LZ-Korrektur bei Satzzeichen evtl. standardmäßig deaktivieren, wenn kein Leerzeichen folgt. Die Beschädigung des Artikels tut mir leid – an diesen Fall hatte ich im Vorfeld nicht gedacht. --Tobias K. 15:12, 25. Jan. 2008 (CET)
- Tut mir leid, war mein Fehler. Ich dachte eigentlich, dass mir keine solche Ersetzung durchgerutscht wäre, aber ich habe wohl doch eine übersehen. --Jaelle 16:50, 25. Jan. 2008 (CET)
Neue Softwareversion
Hallo an alle Operatoren!
Um einmal die ganzen Änderungen, die sich in letzter Zeit angesammelt haben, zu veröffentlichen, habe ich eine aktuelle Version von JETERS einschließlich Comilla online gestellt. Ich würde euch bitten, diese einmal testweise einzusetzen, und eventuelle Fehler zu melden.
Im Einzelnen sind neu:
- Neue JETERS-Version, die als zentrales neues Feature die Möglichkeit bietet, mehrere Replacer-Klassen einzusetzen – dies sollte genutzt werden, um nach Comilla noch den ISBNChecker laufen zu lassen (siehe unten). Zwei Kleinigkeiten, die man vielleicht nicht sofort sieht: Es gibt jetzt die Möglichkeit, das Aussehen ans eigene OS anzupassen (useSystemLookAndFeel in der DefaultGUI.xml), und man kann den zu bearbeitenden Artikel automatisch im Browser öffnen lassen (showArticleInBrowser in MediaWikiIO.xml, das soll irgendwann auch Vorschau etc. erlauben, bisher ist die Funktionalität noch sehr limitiert). Wenn es geht, beides mal ausprobieren und Probleme melden.
- Aktualisierte (noch nicht separat verfügbare) Comilla-Ausgabe, mit ein paar Detailkorrekturen und unter anderem auch der Pinyin-Erkennung (siehe früherer Thread hier).
- ISBNChecker als neue Replacer-Klasse. Diese soll zukünftig zusammen mit dem ComillaReplacer eingesetzt werden, um vollständige ISBN-Korrekturfunktionalität zu Comillas Fähigkeiten hinzuzufügen. Die Klasse basiert auf einem Tool von Benutzer:°. Sie zeigt kurze erklärende Texte, also hoffe ich, dass ihre Funktionsweise klar wird.
Wenn erst einmal alle auftretenden Probleme beseitigt sind, schraube ich daraus dann eine stable-Version zusammen. --Tobias K. 15:42, 13. Jan. 2008 (CET)
- Bei mir funktioniert die Option useSystemLookAndFeel nicht – obwohl ich sie auf 1 setze, bekomme ich immer noch den „alten“ Java-Look. Ich arbeite unter Linux/KDE, muss ich eventuell zusätzliche Bibliotheken wie GTK installieren, um das native Aussehen zu bekommen? Entsprechende Fehlermeldungen werden auf der Konsole nicht angezeigt. – Jowereit (typografie.js) 21:09, 26. Jan. 2008 (CET)
Operation
Hi, ich würde mich auch hin und wieder als Operator betätigen. Gruß --Quilbert 問 01:43, 18. Jan. 2008 (CET)
- Würde auch gerne als Operator arbeiten. --Skyman gozilla 22:52, 26. Feb. 2008 (CET)
- Ok Mail verschickt. Herzlich willkommen! --Tobias K. 23:58, 26. Feb. 2008 (CET)
Operator
Hallöchen, würde mich auch gerne als Operator zur Verfügung stellen. Leider weiß ich nicht so genau, was man tun muss. -- RacoonyRE (Disk.) (+/-) ✉ 01:54, 2. Mär. 2008 (CET)
- Ich kümmere mich drum. – Jowereit (typografie.js) 22:30, 2. Mär. 2008 (CET)
Operator
Hallöchen, würde mich auch gerne als Operator zur Verfügung stellen. Leider weiß ich nicht so genau, was man tun muss. -- RacoonyRE (Disk.) (+/-) ✉ 01:54, 2. Mär. 2008 (CET)
- Ich kümmere mich drum. – Jowereit (typografie.js) 22:30, 2. Mär. 2008 (CET)
Request
Hi Kollegen,
ich wäre auch an der Arbeit mit dem ComillaBot interessiert. Vielleicht kann mich ja einer mal bzgl. der Details kontaktieren. Christian Bier Rede mit mir! 14:39, 7. Mär. 2008 (CET)
- Ich kümmere mich drum. – Jowereit (typografie.js) 17:39, 7. Mär. 2008 (CET)
geschützte Leerzeichen
Hat es einen Grund, dass vor Einheiten geschützte Leerzeichen gesetzt werden, aber nicht bei Abkürzungen wie z. B. und e. V.? -- Karlo 20:33, 7. Mär. 2008 (CET)
- Das ist möglich, nur standardmäßig deaktiviert, d. h. der Operator muss es manuell anschalten. Im Archiv findest du die entsprechende Diskussion. Grüße, Jowereit (typografie.js) 21:30, 7. Mär. 2008 (CET)
Deine typographischen Änderungen
Häufig änderst Du auch typographische Zeichen innerhalb direkter Zitate. Dies sollte bitte unterbleiben, da die Artikelautoren die Zitate meistens so aus ihren Quellen übernommen haben. Es ist im Nachhinein sehr mühselig, Deine sinnvollen Änderungen von den nichtsinnvollen Veränderungen des zitierten Originaltextes zu unterscheiden und manuell zu revertieren. Danke --Rosenkohl 23:17, 3. Mär. 2008 (CET)
Ich habe den Bot für 1 h gesperrt. Wenn der Bug schneller behoben ist, bitte kurz auf meiner Disk. Bescheid sagen. Gruß, Fritz @ 23:29, 3. Mär. 2008 (CET)
- Der Bot läuft nicht automatisch, sondern wird immer von einem Menschen gesteuert, der die Änderungen kontrolliert. Ich bin einer der Operatoren (und habe nicht das Gefühl, da in letzter Zeit solche Änderungen gemacht zu haben, weswegen ich auch nicht weiß, worauf Ihr Euch bezieht) und es würde meiner Meinung nach helfen, Beispiele von solchen fehlerhaften Änderungen zu haben, damit sowohl die Operatoren als auch Programmierer wissen, was das Problem ist, um es in Zukunft abzustellen. --Jaelle 00:44, 4. Mär. 2008 (CET)
Hallo, z.B. Roman Rosdolsky:
- Bisstriche in Leo Trotzki: Schriften 1.2. Sowjetgesellschaft und stalinistische Diktatur 1936–1940 und in Wie was Roman Rosdolsky (1898–1967)]
- zweites Apostroph in Marx’s Grundrisse and Hegel’s Logic
- innere Anführungsstriche in Über die „Grundrisse der Kritik der politischen Ökonomie“
(hier steht jetzt jeweils die veränderte Form), usw. Gruß, --Rosenkohl 01:24, 4. Mär. 2008 (CET)
- Bevor ich hier Maßnahmen gegen den „Bug“ ergreife, hätte ich gerne eine Begründung (idealerweise in Form eines Verweises auf eine entsprechende etablierte Richtlinie), dass die Typografie von Zitaten nicht angepasst werden darf. Der Winkel, in dem ein Apostroph geneigt ist, dürfte schließlich in der Regel ebensowenig sinntragend sein wie die Schriftart, in der der Originaltext steht (die auf das Aussehen der Zeichen weit größeren Einfluss hat als der exakte Unicode des Buchstabens). Bei gedruckten Quellen ist es ja nicht einmal möglich, herauszufinden, welcher Zeichencode einem schwarzen Fleck auf dem Papier zugrundeliegt. Von daher – und da ja selbst Anpassungen wie die Verwendung einfacher Anführungszeichen in Zitaten statt doppelter im Original nicht als sinnentstellend gelten, sondern als normale Anpassung an den umgebenden Text – bin ich von der Forderung, Zitate bei der Korrektur auszusparen, keineswegs überzeugt. --Tobias K. 09:30, 4. Mär. 2008 (CET)
- Ich stimme Tobias K. voll zu. Die genannten Änderungen halte ich (bei aller grunsätzlichen Skepsis gegen Bot-Änderungen in Zitaten) für völlig in Ordnung und auch sachlich geboten. --AndreasPraefcke ¿! 09:56, 4. Mär. 2008 (CET)
Hallo Tobias K., bei Wikipedia arbeitest Du mit anderen Autoren zusammen, die Zitate und Werktitel nach bestem Wissen aus ihren Quellen übernommen haben. Diese gemäß irgendwelcher formaler Regeln (welche Regeln genau werden von dem Roboter eigentlich zugrunde gelegt?) zu ändern und anpassen, ohne sich die Mühe zu machen, in der Quelle nachzugucken, ob dies auch dem Originaltext entspräche wäre meines Erachtens ein Mangel an Respekt sowohl gegenüber den Artikelautoren als auch den Autoren der Originalquellen. Weder würden also durch automatische Zitatveränderungen die Artikel verbessert, noch die Zusammenarbeit auf Wikipedia befördert. Gruß, --Rosenkohl 09:47, 4. Mär. 2008 (CET)
- Dass die Autoren nach bestem Wissen arbeiten, zweifle ich nicht an, nur gilt dies ebenso für den übrigen Text, so dass ich hinsichtlich der Zusammenarbeit keinen Unterschied zwischen Korrekturen inner- und außerhalb von Zitaten sehe. Allenfalls könnte der Respekt vor dem Original eine Rolle spielen. Da ich aber – wie oben erklärt – nicht sinnentstellende Typografieanpassungen für zulässig, ggf. sogar geboten, halte, erkenne ich auch bei nachträglicher Bearbeitung keine Notwendigkeit für einen Quellenabgleich. Eine Verbesserung der Artikel sehe ich aber im Gegensatz zu dir sehr wohl, da Zeichen mit korrekter Semantik (im Gegensatz zu „sieht in meinem Browser so ähnlich aus“) durchgehend auch in Zitaten verwendet werden und eine einheitliche Darstellung im gesamten Artikel gewährleistet ist – kurz: die Vorteile, die Typografie im sonstigen Text hat, hat sie natürlich auch in Zitaten.
- Bei den Kriterien des Bots handelt es sich übrigens um (so gut wie maschinenverständlich möglich) formalisierte Inhalte von WP:TYP. Ich möchte auch noch einmal darauf hinweisen, dass die Korrektur ja keineswegs vollautomatisch erfolgt, sondern jeder einzelne Absatz von Menschen noch einmal angesehen wird. Die Anpassungen geschehen also nicht ausschließlich wegen formaler Regeln, sondern werden von einem WP-Benutzer bewusst durchgeführt oder verworfen. --Tobias K. 10:30, 4. Mär. 2008 (CET)
Nun, die Beiträge werden jeweils unter dem Namen "ComillaBot" verfaßt, gehen unter diesem Benutzerkonto in die Versionsgeschichte ein und sind daher auch zunächst von diesem Account zu verantworten. Da ist es wenig hilfreich zu sagen, daß eine bestimmte Veränderung ja eigentlich durch einem anonymen menschlichen Benutzer erfolgt sei, wenn dieser gar nicht daraufhin angesprochen werden kann.
Danke für den Hinweis auf Wikipedia:Typografie. Dort wird man bezüglich Literaturangaben, Zitate und Datumskonventionen auf die Seiten Wikipedia:Literatur, Wikipedia:Zitate und Wikipedia:Datumskonventionen weiterverwiesen.
Auf Wikipedia:Zitate heißt es: „Ein wörtliches Zitat muss genau sein. Es ist nicht gestattet, den Text zu korrigieren, an die heutige Rechtschreibung anzupassen oder Verbformen zu beugen usw.“ Zwar werden typographische Änderungen nicht mit aufgezählt, eine Anpassung an irgendwelche Regeln wird aber auch nicht verlangt (mit Ausnahme des Gebotes einfacher Anführungsstriche innerhalb von Zitaten). Ebensowenig verlangt die Seite Wikipedia:Literatur die Anpassung von Werktiteln an irgendwelche Regeln.
Ob die Regelungen von Wikipedia:Typografie für die Typographie in Zitaten und Werktiteln gelten und für diese Fällte verfaßt worden sind ist etwas unklar. Meines Erachtens ist dies nicht der Fall, denn es wird an einigen Stellen Bezug auf den Duden genommen. Der Duden gilt aber nur für den selbst verfaßten Haupttext der Enzyklopaedie, kann aber dem Grundsatz der Unverfälschtheit von Zitaten und Werktiteln nicht übergeordnet werden.
Ich gebe zu, daß eine semantische Rekonstruktion eines Zitattextes möglich sein kann, also den Sinn des Textes zu verstehen, und ihn dann mit den am besten dafür geeigneten Zeichen neu zu setzen. Dies muß aber im Einzelfall gegen den Grundsatz der Nichtverfälschung abgewogen werden, sollte nicht in einem Serienverfahren geschehen, und nur, indem wirkliche Menschen den Text zunächst tatsächlich verstehen und die Änderung dann als Autoren kennzeichnen. Ich habe nichts gegen künstliche Intelligenz, aber solange die Enzyklopädie von und für Menschen geschrieben wird darf die Aufgabe, den Zitattext zu verstehen nicht dem Roboter überantwortet werden.
Gruß, --Rosenkohl 13:53, 4. Mär. 2008 (CET)
- Wir können natürlich fleißig Regeln interpretieren (für mich heißt die Existenz einer allgemeinen Richtlinie und das Fehlen einer Ausnahme für einen bestimmten Bereich, dass die Richtlinie auch für diesen Bereich gilt), aber das bringt uns nicht weiter. Worum geht es dir denn letzten Endes? Genügt es, wenn der Mensch, der die Botarbeit prüft und die Entscheidung fällt, ob das Zitat angepasst werden soll, im Bearbeitungskommentar seinen Namen hinterlässt und so Verantwortung für seine Entscheidung übernimmt? Denn Änderungen wie die obigen hätte ich auch ohne Bot vorgenommen. Wenn das nicht reicht, würde ich – wie ich hoffe, mit deiner Zustimmung – auf WP:TYP nachfragen, wie dort die Sache gesehen wird. --Tobias K. 21:41, 4. Mär. 2008 (CET)
- Um ein klareres Beispiel (aus Roman Rosdolsky) zu bringen: die Änderung des Werktitels Über die »Grundrisse der Kritik der politischen Ökonomie« in Über die „Grundrisse der Kritik der politischen Ökonomie“ ist eine eindeutige Veränderung der Zeichen, die nicht durch Vermutungen über ein vielleicht unklares Druckbild der Vorlage gerechtfertigt werden kann, noch dazu wo der Text in digitalisierter Form von einer Webseite übernommen wurde. Auf der Webseite wird deutlich, daß der dortige Setzer diese speziellen Anführungsstriche nur für die Titelüberschrift verwendet hat, welche noch zwei weitere Male wiederholt wird und an diesen Zeichen sofort als der Titel wiedererkannt werden kann. Würden » und « durch „ und “ ersetzt, so sähe der Wikipedia-Artikel einheitlicher aus, aber die Funktion von » und « als visueller Gedächtnisanker wäre unterbrochen. – Solche (zwar hochgradig nebensächlichen, dahergeholten, aber hier doch zu berücksichtigenden) Überlegungen könnte ein Roboter zur Zeit alleine nicht anstellen.
- Ja, mir wäre schonn wohler, wenn sich einrichten ließe, daß ein zuordnenbarer menschlicher Account als Autor für typographische Änderungen (mit) auftritt. Gruß, --Rosenkohl 22:51, 4. Mär. 2008 (CET)
- Danke für das nochmal aufgegriffene Beispiel, hier sehe ich in der Tat ein, dass eine Veränderung im Allgemeinen nicht erfolgen sollte – gerade bei den »« ist von einer bewussten Verwendung auszugehen. Ich werde dem Bot in dieser Frage etwas defensivere Verhaltensroutinen einbauen, so dass solche Dinge in der Voreinstellung unangetastet bleiben, die menschlichen Bediener haben diese Diskussionsseite ohnehin auf ihrer Beobachtungsliste und sollten daher sensibilisiert sein. Zur Angabe des Benutzernamens werde ich die Operatoren nun explizit auffordern, damit gehe ich davon aus, dass anonyme Edits ab morgen nicht mehr stattfinden werden. --Tobias K. 23:27, 4. Mär. 2008 (CET)
- Ich habe da nichts dagegen und werde bei meinen zukünftigen Bearbeitungen darauf achten, möchte aber noch anmerken, dass auf Wikipedia:Zitate sehr wohl etwas zu den Anführungszeichen steht: Kommen innerhalb des Zitates Anführungszeichen vor, so werden einfache typographische Anführungszeichen (‚‘) verwendet.. – Jowereit (typografie.js) 23:51, 4. Mär. 2008 (CET)
Ja Jowereit, dieser Richtlinie bezüglich Anführungszeichen ist mir bewußt, Tobias K. und auch ich haben sie oben schon erwähnt. Meines Erachtens sollte diese Richtlinie auch angewandt werden, anzumerken ist allerdings, daß sie sich offenbar zwar auf Zitate, aber nicht auf die Angabe von Werktiteln erstreckt.
Vielen Dank Tobias K. daß meine Bedenken ernst genommen werden, und auch für die Umprogrammierungen, Gruß, --Rosenkohl 13:24, 5. Mär. 2008 (CET)
Hi!
Also ich finde Bots immer cool - hab ja nicht umsonst Computerlinguistik studiert. :)
Nachdem ich das hier gelesen hab, noch eine Frage: Warum werden die mit Hilfe von ComillaBot durchgeführten Änderungen hier nicht vorgeschlagen? http://tools.wikimedia.de/~arnomane/cgi-bin/WP-autoreview.pl?url=http%3A%2F%2Fde.wikipedia.org%2Fwiki%2FRoman_Rosdolsky&do_typo_check=ON&l=de&Go%21=Go%21&.cgifields=rnd&.cgifields=testpage&.cgifields=remove_century&.cgifields=do_typo_check
Beim Bearbeiten des Textes hab ich ebenfalls versucht, mich an WP:TYP zu halten, und ich dachte eigentlich, ich hätte alles richtig gemacht. Mit Zitaten hat das noch nicht unbedingt etwas zu tun.
Zu den Regeln & Änderungen:
- Ist Österreichische Soziologinnen und Soziologen im Exil – 1933 bis 1945 statt Österreichische Soziologinnen und Soziologen im Exil – 1933 bis 1945 korrekt?
- Ist 1841–1895 statt 1841-1895 korrekt?
- Ist Marx’ statt Marx' korrekt?
- Ist größeren Nationen – in diesem Fall den Ungarn statt größeren Nationen — in diesem Fall den Ungarn korrekt?
Ich frage, weil es mich tatsächlich interessiert. Schließlich sind die genannten Zeichen bewusst so gesetzt worden, und sollten die Änderungen korrekt sein, wüsste ich, dass ich es falsch gemacht hab, und wie ich es in Zukunft richtig machen kann.
Zu den Zeichen:
- – ist bei mir auf der Sonderzeichen-Leiste unten das erste Zeichen.
- - ist mein Minus/Bindestrich auf der Tastatur.
- − ist das Zeichen nach dem + …
Im Lemma Roman Rosdolsky hab ich – (Gedankenstrich?) innerhalb eines Satzes oder bei Werktiteln und - (Bisstrich?) für Zeitangaben oder Seitenzahlen (z.B. 1841-1895) verwendet. War das inkorrekt? Außerdem ging ich davon aus, dass sich der Genitiv im Englischen Marx’ (bzw. Marx’s) schreibt, während es im Deutschen Marx' heißt (oder – veraltet: Marxsche/Marxsches/Marxscher). Ist das deiner Ansicht nach falsch so?
Danke schon einmal für die Antworten – und danke für den Bot! ;-)
--redtux 17:44, 5. Mär. 2008 (CET)
- Zu den Strichen: Es gibt den Gedankenstrich – damit kannst du Nebensätze anhängen, oder auch – wie du siehst – einschieben. Der Bis-Strich ist das selbe Zeichen, auch dieses hier: – (nur ohne Leerzeichen): Man kann es statt dem Wort bis verwenden, z. B. 1940–1960. Das Minus-Zeichen − benutzt Du in mathematischen Minus-Rechnungen, wie 4−2=2. Mit dem normalen Bindestrich, den du auf jeder Tastatur hast, trennst du Wörter: z. B. Chinesen-Auto, Morrison-Formation.
- Ist Marx’ statt Marx' korrekt? Ja. Da muss ein Apostroph hin. Gruß, --Jens Lallensack 18:17, 5. Mär. 2008 (CET)
Hallo Camilla!
Ich wollte dich fragen, ob du unter Roman Rosdolsky eventuell alle Bindestriche in Seiten- und Zeitangaben auf Bis-Striche ändern könntest. Das wäre wirklich toll von dir, weil es mir eine Menge Zeit sparen würde.
Eventuell kannst du ja auch Benutzer:Arnomane mitteilen, wie du das machst, denn sein Tool erkennt diese Bindestriche offenbar nicht als Fehler.
Ich hoffe, du bist O.K. und wirst von deinen Ops nicht zu sehr ausgebeutet. Sollte dir aber einmal langweilig werden, kannst du dir ja betreffendes Lemma auch inhaltlich vornehmen. *smile*
Danke & liebe Grüße,
--redtux 22:01, 7. Mär. 2008 (CET)
- Erledigt. Ich habe die Bis-Striche jetzt auch in Werktiteln ersetzt und hoffe, dass das so OK ist. Inhaltlich hat mir ComillaBot in meiner Version noch keine Verbesserungsvorschläge liefern können, aber da arbeitet Tobias K. ja gerade dran, gell? :-) – Jowereit (typografie.js) 00:27, 8. Mär. 2008 (CET)
Anfrage
Hallo liebe Bot-Betreiber, könntet ihr bitte euer geniales Helferlein über den Artikel Fluchtafel laufen lassen, bei dessen KLA typographische Fehler kritisiert wurden. Besten Dank im Voraus und schöne Grüße, --Anamnesis 12:02, 18. Mai 2008 (CEST)
- Erledigt. War aber nicht wahnsinnig viel. --Skyman gozilla 12:19, 18. Mai 2008 (CEST)
- Das ging ja unglaublich schnell, vielen Dank – bei so einem Service werde ich mich öfters bei euch melden. --Anamnesis 12:23, 18. Mai 2008 (CEST)
ISBNChecker läuft nicht mehr
Der ISBNChecker bricht immer mit der Fehlermeldung „java.io.IOException: HTTP Response from server (HTTP/1.1 301 Moved Permanently) was not okay“ ab. Gibts da schon einen Fix für? --Skyman gozilla 20:29, 4. Jun. 2008 (CEST)
- Der Toolserver ist von tools.wikimedia.de nach toolserver.org umgezogen. Web-Browser fangen das automatisch ab, aber im ComillaBot muss das berücksichtigt werden (Austausch eines Strings). --° 20:37, 4. Jun. 2008 (CEST)
- Muss ich den in einer Konfigurationsdatei austauschen oder muss ich auf eine neue Version warten? --Skyman gozilla 21:42, 4. Jun. 2008 (CEST)
- Ich weiss leider nicht, wie das programmiert wurde. Wenn der String "tools.wikimedia.de" in einer Konfig-Datei steht, dann sollte ein austauschen gegen "toolserver.org" in der Tat ausreichen. Andernfalls ist eine neue Version nötig. --° 21:54, 4. Jun. 2008 (CEST)
- Hab ich leider hartcodiert. Ich mach das bei Gelegenheit schöner, aber für jetzt tut es hoffentlich erst einmal dieses Update. --Tobias K. 22:12, 4. Jun. 2008 (CEST)
- Kann leider nicht das Funktionieren der neuen Version melden. :-( Hab mir von angegebener Adresse diese Datei heruntergeladen und im jeters-Unterverzeichnis „isbnchecker“ entpackt und die vorhandenen Dateien überschreiben lassen. Trotzdem erscheint selbige Fehlermeldung weiterhin. --Skyman gozilla 22:57, 4. Jun. 2008 (CEST)
- Das ist seltsam – bei mir hat es den Fehler behoben, und ich habe nichts anderes gemacht, als den String auszutauschen. Ich kann aus deiner Beschreibung aber nicht ganz herauslesen, wo du es genau entpackt hast. Entscheidend ist, dass die neue ISBNChecker.jar direkt im components-Ordner landet (einen isbnchecker-Unterordner sollte es eigentlich gar nicht geben, ist der vielleicht noch ein Rückstand vom Entpacken der letzten Version?). Am besten, du löschst im components-Ordner erst mal die alte Datei, damit diese garantiert nicht mehr verwendet wird, und legst die ISBNChecker.jar aus dem Archiv dann dorthin, wo ihre Vorgängerin war. --Tobias K. 23:42, 4. Jun. 2008 (CEST)
- Ja, du hast Recht, es war der falsche Unterordner. Nach Kopieren in „components“ funktioniert es bei mir auch wieder. --Skyman gozilla 17:37, 5. Jun. 2008 (CEST)
- Das ist seltsam – bei mir hat es den Fehler behoben, und ich habe nichts anderes gemacht, als den String auszutauschen. Ich kann aus deiner Beschreibung aber nicht ganz herauslesen, wo du es genau entpackt hast. Entscheidend ist, dass die neue ISBNChecker.jar direkt im components-Ordner landet (einen isbnchecker-Unterordner sollte es eigentlich gar nicht geben, ist der vielleicht noch ein Rückstand vom Entpacken der letzten Version?). Am besten, du löschst im components-Ordner erst mal die alte Datei, damit diese garantiert nicht mehr verwendet wird, und legst die ISBNChecker.jar aus dem Archiv dann dorthin, wo ihre Vorgängerin war. --Tobias K. 23:42, 4. Jun. 2008 (CEST)
- Kann leider nicht das Funktionieren der neuen Version melden. :-( Hab mir von angegebener Adresse diese Datei heruntergeladen und im jeters-Unterverzeichnis „isbnchecker“ entpackt und die vorhandenen Dateien überschreiben lassen. Trotzdem erscheint selbige Fehlermeldung weiterhin. --Skyman gozilla 22:57, 4. Jun. 2008 (CEST)
- Hab ich leider hartcodiert. Ich mach das bei Gelegenheit schöner, aber für jetzt tut es hoffentlich erst einmal dieses Update. --Tobias K. 22:12, 4. Jun. 2008 (CEST)
- Ich weiss leider nicht, wie das programmiert wurde. Wenn der String "tools.wikimedia.de" in einer Konfig-Datei steht, dann sollte ein austauschen gegen "toolserver.org" in der Tat ausreichen. Andernfalls ist eine neue Version nötig. --° 21:54, 4. Jun. 2008 (CEST)
- Muss ich den in einer Konfigurationsdatei austauschen oder muss ich auf eine neue Version warten? --Skyman gozilla 21:42, 4. Jun. 2008 (CEST)
ISBN-Checker scheint Timeout zu liefern
Hallo zusammen!
Vielleicht geht das ja nur mir so, aber ich ich kann keinerlei Artikel mehr überprüfen, wenn ich den ISBN-Checker mit drin hab. Scheint so, als würde er durch ein Timeout festzuhängen. Eine Fehlermeldung diesbezüglich hab ich bisher nur einmal erhalten, aber die lange Dauer deutet für mich auf einen Timeout hin. --Skyman gozilla 23:35, 10. Jul. 2008 (CEST)
- Hat sich anscheinend von selbst erledigt. --Skyman gozilla 13:53, 14. Jul. 2008 (CEST)
Anfrage
Hallo liebe Botbetreiber, könntet ihr euren Bot die Neufassung des Artikels Platon durchsuchen lassen, nachdem ihr mir schon einmal so prima geholfen habt? Besten Dank und schöne Grüße, --Anamnesis 13:50, 26. Jul. 2008 (CEST)
- Erledigt. --Skyman gozilla 14:41, 26. Jul. 2008 (CEST)
- Herzlichen Dank für die schnelle Erledigung. --Anamnesis 15:16, 26. Jul. 2008 (CEST)
Will Operator sein
bitte, bitte, bitte :-) Als TeX-Nutzer tut mir so manches in der Wikipedia weh...
Lemzwerg 21:02, 9. Aug. 2008 (CEST)
- Prinzipiell kein Problem. Bitte lade dir zunächst einmal die Software herunter und mache dich damit vertraut (hier findest du weitere Informationen hierzu). Wenn du ein paar Testedits unter deinem eigenen Account gemacht hast und sich soweit sicher bei der Bedienung fühlst, kannst du mir eine Nachricht hinterlassen. Ich lasse dir dann die Zugangsdaten und einige Hinweise zukommen. Könntest du dazu bitte deine E-Mail-Adresse eintragen oder mir (gerne auch per Mail) mitteilen, wie ich dich kontaktieren kann? Viele Grüße, Jowereit (typografie.js) 22:21, 9. Aug. 2008 (CEST)
Release von JETERS 0.3.00 0.3.02
Hallo Operatoren,
nach einer längeren Phase ohne neues Release gibt es mal wieder eine aktuelle Version von JETERS mit einigen Neuerungen. Auch für Comilla und den ISBNChecker gibt es Versionen, die aus Kompatibilitätsgründen verwendet werden müssen – aber natürlich auch Verbesserungen der eigentlichen Funktionalität umfassen. Ich würde euch bitten, für eure Arbeit ab sofort diesen Softwarestand einzusetzen. Downloads gibt es hier:
Beachtet auch, dass Comilla anders als zuvor nun bei Google Code Hosting veröffentlicht wird – dort werdet ihr also auch zukünftige Programmversionen erhalten. --Tobias K. 20:45, 5. Apr. 2008 (CEST)
- Aktualisierung: Einige neue Features in JETERS 0.3.02 (etwa: Schriftartanpassung, per Parameter änderbares Komponentenverzeichnis) --Tobias K. 17:17, 31. Aug. 2008 (CEST)
Einsatzwunsch
KLA Ubiquitin: Vor allem falsche Bis-Striche. --Leyo 17:27, 22. Okt. 2008 (CEST)
- schon erledigt --Jens Lallensack 20:20, 22. Okt. 2008 (CEST)
- Super, danke. Ich hab's schon mal händisch gemacht, die Änderungen aber wegen eines BK nicht speichern können. --Leyo 20:58, 22. Okt. 2008 (CEST)
Nicht überprüfbare Seite
Hallo! Deutsche Zeitung in den Niederlanden lässt sich selbst mit „-Xms60m“ nicht überprüfen. JETERS hängt einfach. --Skyman gozilla 01:35, 3. Jan. 2009 (CET)
- Seh ich mir an, sobald ich dazu komme. --Tobias K. 12:12, 3. Jan. 2009 (CET)
- Nur zur Info, bei mir funktioniert es (aktuelle SVN-Versionen von JETERS und Comilla, „ant run“ im JETERS-Verzeichnis). Erscheint auf der Konsole eine Fehlermeldung (Exception) o.Ä., bevor sich JETERS aufhängt? – Jowereit (typografie.js) 22:15, 3. Jan. 2009 (CET)
- Habs jetzt nebenher einfach mal laufen lassen und es hat funktioniert. Was ich als Aufhängen angesehen hab, war einfach nur die Zeit, die es gebraucht hat, bis der Artikel analysiert war. --Skyman gozilla 22:39, 3. Jan. 2009 (CET)
Ignorieren eines {Inuse}-Bausteins
Während die sehr komplexe Arbeit am Artikel Geodätisches Datum lief, wurden mit ComillaBot zahlreiche formale Änderungen "dazwischengefunkt" - dem von mir gesetzten {Inuse}-Baustein zum Trotz, und ohne mich darauf anzusprechen. Das hat die ohnehin schwierige Bearbeitung des Themas deutlich erschwert und steht NICHT im Einklang mit der allgemein üblichen Vorgangsweise.
Auch wenn der Bot ein gutes Werkzeug ist, seien seine Benützer DRINGEND ersucht, in Hinkunft solche Änderungen erst nach Beendigung von Inuse-Phasen vorzunehmen. Geof 22:10, 7. Feb. 2009 (CET)
- Hallo Geof, das ist tatsächlich sehr ärgerlich. Als Bot-Operator bekommt man allerdings nur die vom Bot vorgenommenen Änderungen in einer Vergleichsansicht zu Gesicht. Am Ende gibt es zwar eine Artikelvorschau, aber ich muss zugeben, dass ich mir die nicht jedes Mal auf Verwendung des {Inuse}-Bausteins durchsehe.
- Zur Unterstützung der Korrektoren habe ich deshalb nun eine deutliche Warnung einprogrammiert, die den Abbruch der Bearbeitung empfiehlt, wenn der {Inuse}-Baustein im Artikel verwendet wird. Die Änderung befindet sich in der aktuellen SVN-Version von ComillaBot. Viele Grüße, Jowereit (typografie.js) 23:15, 7. Feb. 2009 (CET)
- Wie schon gesagt, mea culpa. Ich werde darauf achten, dass es nicht wieder vorkommt. --Jaelle 00:08, 8. Feb. 2009 (CET)
Tätigkeit als Operator
Sofern immer noch Bedarf besteht, möchte ich gerne das Operator-Team verstärken.--Merlin G. 13:50, 8. Feb. 2009 (CET)
- Kein Problem. Ich würde dir eine Einführung in die Arbeit mit ComillaBot sowie, wenn du dich eingearbeitet hast, die Zugangsdaten per E-Mail schicken. Könntest du dazu bitte eine Mailadresse in deinen Einstellungen angeben? Viele Grüße, Jowereit (typografie.js) 21:56, 8. Feb. 2009 (CET)
- Adresse ist jetzt angegeben.-- Merlin G. 14:35, 9. Feb. 2009 (CET)
- Mail ist raus. – Jowereit (typografie.js) 21:49, 9. Feb. 2009 (CET)
- Adresse ist jetzt angegeben.-- Merlin G. 14:35, 9. Feb. 2009 (CET)
Urheberrechtsgesetz (Österreich)
Hinsichtlich der Darstellung von Zitaten erhebt sich die Frage, warum zu Beginn von Zitaten einmal das Anführungszeichten unten und dann wieder oben steht. z.B.: Artikel Urheberrechtsgesetz (Österreich)
- ″sind eigentümliche geistige Schöpfungen auf den Gebieten der Literatur, der Tonkunst, der bildenden Künste und der Filmkunst."
- Die herrschende Meinung geht davon aus, "dass … jeder Teil nur dann geschützt ist, wenn er als solcher eine ‚eigentümliche geistige Schöpfung‘ ist. Das Urheberrecht wird nur verletzt, wenn die schöpferischen Gestaltungselemente übernommen werden“; [14] „Auch der belanglose Teil kann als solcher geschützt sein, wenn er nur eine ‚eigentümliche geistige Schöpfung‘ ist“; [15] Es kann „vorkommen, das (Sic!) ein Werk aus mehreren Teilen besteht, keinem dieser Teile, wohl aber der Gesamtzusammenstellung Schutz zukommt, so bspw bei sog ‚Assemblagen‘ … “ [16]
LG --Kath Erich 20:48, 15. Feb. 2009 (CET)
- Soweit ich sehe, wurden diese Passagen bei der Korrektur durch Jaelle nicht angetastet; auch bei einem erneuten Durchlauf meinerseits hat ComillaBot daran nichts zu meckern gehabt. Das sieht mir also nach einem Bug im Bot aus. @Tobias K.: Anscheinend übersieht ComillaBot ein "-Zeichen oder Zollzeichen, das direkt nach zwei Hochkommata (Kursivschreibung) steht. – Jowereit (typografie.js) 22:10, 15. Feb. 2009 (CET)
- Kann die Analyse so nicht bestätigen, das Entfernen der Kursivschreibung hat zumindest in meinen Experimenten keine Änderung des Verhaltens bewirkt. Es scheint vielmehr an den hier verwendeten Anführungszeichenvarianten zu liegen. Hat die Korrektur von als Anführungszeichen missbrauchtem ″ überhaupt schon mal funktioniert? Ich habe den Eindruck, dass diese Funktionalität nie existiert hat und damit natürlich auch nicht defekt sein kann. ;-) --Tobias K. 18:38, 18. Feb. 2009 (CET)
- Jetzt, wo du’s sagst … Meine Erinnerung hat mich wohl getäuscht, tatsächlich existiert eine solche Funktionalität in ComillaBot nicht. – Jowereit (typografie.js) 23:13, 18. Feb. 2009 (CET)
- Kann die Analyse so nicht bestätigen, das Entfernen der Kursivschreibung hat zumindest in meinen Experimenten keine Änderung des Verhaltens bewirkt. Es scheint vielmehr an den hier verwendeten Anführungszeichenvarianten zu liegen. Hat die Korrektur von als Anführungszeichen missbrauchtem ″ überhaupt schon mal funktioniert? Ich habe den Eindruck, dass diese Funktionalität nie existiert hat und damit natürlich auch nicht defekt sein kann. ;-) --Tobias K. 18:38, 18. Feb. 2009 (CET)
Wikibooks – Lehrbücher
Kann man ComillaBot auch für für Wikibooks – Lehrbücher einsetzen oder nur für WIKIPEDIA - Artikel? Wenn ja, wie muss man vorgehen, um auf ComillaBot zugreifen zu können? LG--Kath Erich 20:49, 15. Feb. 2009 (CET)
- Hallo Kath Erich, das ist problemlos möglich. In der JETERS-Konfigurationsdatei muss nur ein weiterer Eintrag für das Wikibooks-Wiki angelegt werden. Das sieht dann etwa so aus:
<conf name="wikiURLs" type="string" list="true"> <entry>http://de.wikipedia.org/w/index.php</entry> <entry>http://de.wikibooks.org/w/index.php</entry> </conf>
- Dann kannst du einfach auf der „Startseite“ zusätzlich zum Artikel auch das entsprechende Wiki angeben, in dem die Korrektur stattfinden soll. – Jowereit (typografie.js) 22:10, 15. Feb. 2009 (CET)
- Bitte um Hilfe, auch wenn es sich teilweise um Banalitäten handelt. Beim Download erhalte ich nur die Datei ComillaBot.svg auf meinen Computer. Wie geht es weiter. Könntest du mirt, bitte die weiteren einzelnen Schritte beschreiben? --Kath Erich 18:38, 17. Feb. 2009 (CET)
- Hallo Kath Erich, eine gute Anleitung gibt es hier. Unter „Konfiguration“ steht auch, wo du die Einstellungsdatei findest, in der du dann die URL des Wikis eintragen musst. Grüße, Jowereit (typografie.js) 22:04, 17. Feb. 2009 (CET)
- Ich will nicht sagen, dass ich mich in Systemfragen überhaupt nicht auskenne, aber mein Wissen ist doch sehr beschränkt. Deshalb habe ich ein Softwareunternehmen unter Vertrag, das mir bei solchen behilflich ist. Dieses habe ich gebeten, mir bei der Installation von CamillaBot behilflich zu sein, doch dieses kennt sich auch nicht aus.
- Derzeit habe ich auf dem Desktop ungeöffnet heruntergeladen:
- comilla-0804052000-src
- comilla-0804052000-bin
- Unter Programme habe ich bereits Java installiert
- Jetters 03.02 - bin habe ich in eine eigene Datei unter Dokumente gespeichert.
- Wie soll ich bitte weitergehen, damit kein Murgs herauskommt? Insbesondere der Satz in der Anleitung Die Datei „Comilla.jar“ aus dem Zip muss in den „components“-Ordner von JETERS platziert werden. ist mir nicht klar.
- Mein System Vista homeversion.
- Mit der Bitte um Geduld mit einen Unbeholfenen und LG--Kath Erich 07:58, 27. Feb. 2009 (CET)
- Sämtliche dieser heruntergeladenen Dateien sind ZIP-Archive. Das Archiv von JETERS sowie comilla-0804052000-bin solltest du zunächst entpacken; ich bin mir jetzt nicht sicher, wie man dazu Schritt für Schritt unter Vista vorgeht (vielleicht liest hier ein Vista-Nutzer mit?). Beim Auspacken von JETERS sollte auch der genannte components-Ordner auftauchen, in den du dann die genannte Datei (die beim Auspacken des comilla-0804052000-bin zum Vorschein kommen sollte) verschieben kannst. comilla-0804052000-src benötigst du für deine Zwecke nicht.
- Danach kannst du beim Abschnitt "Einsatz" der Anleitung fortfahren. --Tobias K. 15:29, 28. Feb. 2009 (CET)
nbsp
http://de.wikipedia.org/w/index.php?title=Lik%C3%B6r&diff=prev&oldid=56074993
Nach welchen Regeln fügst du denn geschützte Leerzeichen ein? Warum bei „200 m²“, aber nicht bei „43 %“? Was ist mit (was man auch häufig findet) „2 Liter“, „zwei Liter“, „1. April“, „ein Drittel“? Gibt es denn einen Konsens, dass die wirklich benötigt werden? Mich stört diese Verkomplizierung des Quelltextes mehr als ein eventueller Zeilenumbruch an einer ungünstigen Stelle. Und statt einer verkünstelten Form wie „z. B.“ könnte man doch „zum Beispiel“ auch ausschreiben. Ich glaube, das steht auch irgendwo, dass man im Fließtext keine Abkürzungen benutzen sollte. --androl ☖☗ 20:32, 23. Feb. 2009 (CET)
- Bei Prozentzeichen zum Beispiel werden sie nicht eingefügt, weil da die Wikisoftware selbst erkennt, dass sie keinen Umbruch machen soll (siehe WP:SVZ#Maßeinheiten).
- Bei Maßeinheiten werden sie dort eingefügt, wo der Bot die Maßeinheit erkennt (welche Einheiten da genau erkannt werden, weiß ich gerade auch nicht; ich bin nicht der Programmierer). Mit ausgeschriebenen Maßeinheiten wie z. B. Liter ist das so eine Sache, siehe Wikipedia_Diskussion:Typografie#"Geschütztes" Leerzeichen. Tendenziell wird davon eher abgeraten.
- Ich glaube auch, mich zu erinnern, dass ein ausgeschriebenes „zum Beispiel“ besser wäre, der einzige Link zu diesem Thema, den ich gerade finde ist WP:TYP#Grundregeln und der ist etwas schwammig. --Jaelle 21:18, 23. Feb. 2009 (CET)
- Bitteschön: Einheitenliste und Abkürzungsliste. – Jowereit (typografie.js) 22:03, 23. Feb. 2009 (CET)
- Wieder was gelernt. (-: Diese Listen sind bis jetzt völlig an mir vorübergegangen. --Jaelle 23:17, 23. Feb. 2009 (CET)
- das wäre ein Grund. In der Einheitenliste steht das % allerdings drin, da sieht man auch, dass da sogar nach dem * in der Aufzählung automatisch ein   (nbsp) eingefügt wird, je nach dem, ob man ein Leerzeichen benutzt. Das stört da eher, ist wohl ein Fehler der Wiki-Software.
- Die Einheitenliste und der dortige reguläre Ausdruck werden nicht 1:1 in der Software verwendet, unter anderem, damit man die Korrektur bei % (und einigen anderen Fällen) in der Konfiguration aktivieren oder deaktivieren kann. Nicht jedes Wiki erledigt das schließlich selbst. --Tobias K. 15:16, 28. Feb. 2009 (CET)
Bug bei Apostroph?
Wenn der Seitentitel mit einem Apostroph beginnt, versucht der Bot, die Seite & zu überschreiben. Einige Beispiele: Versionsgeschichte von &
Ist das ein PEBKAC-Fehler oder ein Bug im Bot?--Merlin G. 22:42, 19. Feb. 2009 (CET)
- Ich habe testweise versucht, den Artikel „'Urwa ibn az-Zubair“ zu korrigieren, bei mir wurde die Änderung im korrekten Artikel gespeichert. Das Problem könnte mehrere Ursachen haben, etwa die Tatsache, dass du Java unter Mac OS X verwendest. Vielleicht liegt der Fehler auch in JETERS oder sogar im Java Wiki Bot Framework? Vielleicht weiß Tobias K. mehr. – Jowereit (typografie.js) 23:04, 19. Feb. 2009 (CET)
- Ich korrigiere mich, um den Fehler zu erhalten, muss eine alphabetische Liste abgearbeitet werden. Wenn man da „'“ eingibt, steht im „Bearbeiten von:“-Feld 'Alhan Nahfan und der Artikel & wird überschrieben.--Merlin G. 23:24, 19. Feb. 2009 (CET)
- OK, das war eine wichtige Info. Dieses Problem kann ich reproduzieren, es taucht ebenso beim Artikel „&RQ“ auf („&RQ“). Ich nehme an, dass vor dem „039“ bei dir ein Gatterzeichen (#) steht? Zum Vergleich: Aufrufen der URL http://de.wikipedia.org/wiki/'Alhan Nahfan führt auf den Artikel „&“ (bzw. zu seiner Weiterleitung „Et-Zeichen“). – Jowereit (typografie.js) 23:44, 19. Feb. 2009 (CET)
- Noch ein bisschen mehr Arbeit an der Reproduktion des Bugs: In der Liste von Artikeltiteln, die JETERS von MediaWiki zurückgeliefert bekommt, sind einige Zeichen durch ihre HTML-Äquivalente ersetzt. Dies sind: Ampersand (&), Apostroph (') und Anführungszeichen ("). Dieses Zeichen muss nicht am Anfang stehen, so wurde beispielsweise bei der testweisen Korrektur des Artikels „100'5 Das Hitradio“ der fertige Artikeltext unter „100&“ gespeichert. Ich weiß nicht, ob hier eine reine Textersetzung dieser drei HTML-Entities im Artikeltitel sinnvoll ist oder ob es eine bessere Lösung gibt. – Jowereit (typografie.js) 22:37, 20. Feb. 2009 (CET)
- Aktueller Status: Ich hab schon eine Weile die Kommunikation mit dem JWBF-Autor diesbezüglich aufgenommen, weil das Problem wohl dort zu verorten ist. Inzwischen soll eine Lösung existieren, es gibt allerdings noch ein paar Probleme beim Übersetzen und Integrieren der aktuellen JWBF-Version, von denen ich hoffe, dass wir sie bald beseitigen können. --Tobias K. 22:53, 26. Feb. 2009 (CET)
- Es existiert jetzt ein kleines Update von JETERS, das eine neue JWBF-Version einsetzt. Diese sollte das Problem eigentlich nicht mehr haben. --Tobias K. 23:34, 1. Mär. 2009 (CET)
- Nachtrag: Wartet lieber noch etwas mit dem Download, JWBF-Autor meldet potentiellen Bug in der eingesetzten Version. :-/ --Tobias K. 23:45, 1. Mär. 2009 (CET)
Leere Zusammenfassungszeile und Vergleichsansicht
Bei bestimmten Änderungen (ich glaube, solche, die mit whitespace in der Konfigurationsdatei eingeschaltet werden können) sind die Textfelder zur Vergleichsansicht und für die Zusammenfassungszeile leer. Das führt einerseits dazu, dass der Operator über eine Änderung entscheiden muss, ohne sie zu kennen, und andererseits dazu, dass, wenn der Bot keine anderen Bearbeitungen vornimmt, andere Benutzer schwer nachvollziehen können, wer der Operator war und was er gemacht hat (Beispiel: http://de.wikipedia.org/w/index.php?title=1._Division_(Deutsches_Kaiserreich)&diff=prev&oldid=57607135 ).
Noch eine Frage, die hiermit eigentlich nichts zu tun hat: Was bewirkt expandMarkup in ComillaReplacer.xml? – Merlin G. 17:45, 8. Mär. 2009 (CET)
- Bei mir bleibt die Zusammenfassungszeile unabhängig von dem Wert für „whitespace“ leer. Könnte es daran liegen, dass der Bot – wie anscheinend bei dieser Änderung auch – nichts zu korrigieren gefunden hat? (Warum trotzdem eine geänderte Zeile in der Wikipedia-Diff-Ansicht gezeigt wird, ist mir schleierhaft.)
- Übrigens ist mir aufgefallen, dass auf der Webseite „Anleitung zu ComillaBot“ die Option als „removeWhitespace“ bezeichnet wird. Ebenso fehlt die Dokumentation der Option „expandMarkup“ – die weitet Fett- und Kursivschreibung in Klammern und Anführungszeichen auf die Klammern bzw. Anführungszeichen aus, beispielsweise ändert sie (Test) nach (Test). – Jowereit (typografie.js) 22:17, 8. Mär. 2009 (CET)
- Doch, der Bot hat etwas korrigiert – er hat ein überschüssiges Leerzeichen entfernt.
- Danke für die Erklärung zu expandMarkup – interessantes Feature, setz ich gleichmal auf „true“. – Merlin G. 23:43, 8. Mär. 2009 (CET)
- Doch, der Bot hat etwas korrigiert – er hat ein überschüssiges Leerzeichen entfernt.
Aktualität der Anleitung
Es scheint, dass vor allem der Parameterteil der Anleitung veralteter ist, als ich gedacht hatte. Da aber offensichtlich Leute Fehler eher bemerken als ich: Wäre es eine gute Idee, die Anleitung hier ins Wiki zu packen? --Tobias K. 22:29, 9. Mär. 2009 (CET)
- Ich glaube, es wäre eine gute Idee. Die meisten Dinge werden durch das Wiki-Prinzip besser. – Merlin G. 22:52, 9. Mär. 2009 (CET)
- Nachdem ich mir bei dem Versuch, ComillaBot für mein wikibook zu generieren mein System in Probleme gestürzt habe, habe ich den Wunsch - wenigestens vorübergehend - aufgegeben, ComilloBot für mich zu verwenden. Siehe oben Lehrbuch Ersurf dir das Urheberrecht--Kath Erich 00:04, 10. Mär. 2009 (CET)
- So, die Anleitung ist jetzt auf Benutzer:ComillaBot/Anleitung zu finden. Wer mag, darf drauflosverbessern. --Tobias K. 12:24, 11. Mär. 2009 (CET)
Bug bei Abkürzungen
Beim Korrigieren des Artikels „Linienzugbeeinflussung“ macht der Bot komische Sachen mit der Abkürzung „LZB“:
- Original: „die LZB in der Schweiz“ – Nachher: „die LZum Beispielin der Schweiz“
- Original: „LZB-Variante“ – Nachher: „LZum BeispielVariante“
Offensichtlich ein Fehler in der Behandlung von Abkürzungen. Kann das jemand reproduzieren? – Jowereit (typografie.js) 22:17, 8. Mär. 2009 (CET)
- Ich nehme an, du hast startOfSentenceAbbrCheck aktiviert? In diesem Fall hab ich meinen Fehler gefunden: Ich habe einen regulären Ausdruck "Z[.]?[ ※]?B." definiert und vergessen, dass der Punkt am Schluss als beliebiges Zeichen statt als Punkt gewertet wird. --Tobias K. 22:52, 9. Mär. 2009 (CET)
- Ja, startOfSentenceAbbrCheck ist aktiviert. – Jowereit (typografie.js) 22:55, 10. Mär. 2009 (CET)
- So, mit der aktuellen SVN-Version tut’s jetzt. Vielen Dank fürs Beheben des Bugs. – Jowereit (typografie.js) 23:16, 16. Mär. 2009 (CET)
z.B. → zum Beispiel
Der ComillaBot hat hier die Abkürzung z.B. in z. B. umgewandelt. Daher mein Vorschlag: Wäre es nicht praktischer, wenn sowas gleich in zum Beispiel umgewandelt würde? Gruß --Zykure?! 23:49, 23. Mär. 2009 (CET)
- Das wäre halt keine rein typografische Verbesserung, sondern schon eine Änderung des Textstils, die wohl manchen Autoren nicht wirklich passen würde. Ich halte eine Leerzeichenformatierung für weniger kontrovers als eine Ausschreibung. Kann mich natürlich täuschen. --Tobias K. 15:48, 24. Mär. 2009 (CET)
Bot macht Dateinamen kaputt
Könnte man softwareseitig dafür sorgen, dass der Bot Dateinamen in Ruhe lässt? Als ich gerade die Typografie dieses Artikels korrigieren wollte, versuchte der Bot fünf Mal die Einbindung von Bildern zu verändern. – Merlin G. 10:39, 10. Apr. 2009 (CEST)
- Prinzipiell geht das wohl, ich schätze auch, dass ich das einbauen kann (sobald ich wieder einen Rechner mit vernünftiger Programmierumgebung da habe). Die Tatsache, dass diese ziemlich naheliegende Funktion bisher nicht eingebaut ist, finde ich allerdings "verdächtig", möglicherweise gabs da Probleme, an die ich grad nicht denke. --Tobias K. 11:58, 10. Apr. 2009 (CEST)
- So, mal wieder hierzu. Problem Teil 1: Bilder in Galerien haben eine andere Syntax als sonst. Problem Teil 2: Zeilenumbrüche in Galerien können zur Auftrennung des Textes bei der Verarbeitung führen, die Analyse erfolgt ja aus Performancegründen absatzweise. Im vorliegenden Fall kam noch eine parametrisierte Galerie vor, das ist jetzt zumindest kein Problem mehr. Für die eigentliche Angelegenheit sollte man wohl bei Problemteil #2 ansetzen, aber das ist nicht ganz trivial, fürchte ich. Kann keine Zusage geben, wann ich dazu komme. --Tobias K. 01:30, 22. Apr. 2009 (CEST)
Anfrage
Hallo liebe Bot-Betreiber, könntet ihr bitte euer Maschinchen über den Epiktet-Artikel schicken? Herzlichen Dank und schöne Grüße, -- Anamnesis 22:14, 23. Apr. 2009 (CEST)
- Erledigt (sogar besonders gründlich – zwei Mal :-) ) – Jowereit (typografie.js) 22:43, 23. Apr. 2009 (CEST)
- Vielen Dank für die schnelle Erledigung! -- Anamnesis 22:42, 23. Apr. 2009 (CEST)
Stopp!
Das kann doch nur ein Scherz sein. "minimale Änderungen und kleine Schönheitskorrekturen (z. B. überflüssige Leerzeichen entfernen) nur zusammen mit größeren, wirklich gravierenden Eingriffen vornehmen." Was ist hier [10] [11] [12] die große Änderung?? --Euku:⇄ 21:41, 21. Apr. 2009 (CEST)
- Dieser Bot macht nur typografische Verbesserungen. Das ganze läuft auch nicht automatisch sondern wird immer von einem Bot-Operator überwacht. Ich (nur Operator) bin bisher immer davon ausgegangen, dass es sich bei den dort erwähnten "Schönheitskorrekturen" um Sachen handelt, die man in der Anzeige nicht sieht, wie eben z. B. die mehrfachen Leerzeichen. Die typografischen Änderungen sind aber sichtbar. Ich mache jetzt aber vorest keine weiteren Änderungen, bis das geklärt ist. --Jaelle 21:57, 21. Apr. 2009 (CEST)
- Ob das halb- oder vollautomatisch läuft ist unwichtig. Solche Ersetzungen sind keinesfalls "gravierend" und der Leser bemerkt sie kaum bzw. gar nicht. Für Autoren heißt das aber, dass unnötig Beobachtungslisten voll werden und weitere Artikelversionen erzeugt werden. Sinnvoll sind solche Änderungen, allerdings bitte nur mit großen Änderungen. Der Pywikipediabot-Framework hat z. B. eine eigene separate Klasse für sowas, die auf Wunsch bei allen Änderungen mithilft. Bsp., das solltest du ähnlich machen. --Euku:⇄ 22:22, 21. Apr. 2009 (CEST)
- Ich bin nicht der Programmierer des Bots, sondern nur Operator, der Verweis auf das Pywikipediabot-Framework bringt mir jetzt nicht viel. Gibt's denn irgendwo eine Liste, was eine "gravierende Änderung" ist oder ist das auch der subjektiven Einschätzung des Lesers überlassen? --Jaelle 23:02, 21. Apr. 2009 (CEST)
- Unkritisch ist es z.B. wenn du Typos, BKL-Links korrigierst oder die sinnvollen Anfragen von WP:B/A übernimmst. Das Korrigieren von Weiterleitungen ist hier aber nicht gern gesehen. An diesen Beispielen kannst du auch solche Änderungen abschätzen. Du kannst dir gerne eine zweite Meinung einholen. --Euku:⇄ 00:10, 22. Apr. 2009 (CEST)
- Ich bin nicht der Programmierer des Bots, sondern nur Operator, der Verweis auf das Pywikipediabot-Framework bringt mir jetzt nicht viel. Gibt's denn irgendwo eine Liste, was eine "gravierende Änderung" ist oder ist das auch der subjektiven Einschätzung des Lesers überlassen? --Jaelle 23:02, 21. Apr. 2009 (CEST)
- Ob das halb- oder vollautomatisch läuft ist unwichtig. Solche Ersetzungen sind keinesfalls "gravierend" und der Leser bemerkt sie kaum bzw. gar nicht. Für Autoren heißt das aber, dass unnötig Beobachtungslisten voll werden und weitere Artikelversionen erzeugt werden. Sinnvoll sind solche Änderungen, allerdings bitte nur mit großen Änderungen. Der Pywikipediabot-Framework hat z. B. eine eigene separate Klasse für sowas, die auf Wunsch bei allen Änderungen mithilft. Bsp., das solltest du ähnlich machen. --Euku:⇄ 22:22, 21. Apr. 2009 (CEST)
- Ok, dann schalte ich mich als Programmierer dieses Bots mal ein. Es war damals bei der Vergabe des Bot-Flags prinzipiell klar, dass dieser Bot nichts als typografische Korrekturen tun würde, und auch ich bin immer noch der Meinung, dass das an sich reicht, wenn es in einem Artikel wirklich was zu korrigieren gibt – wenn etwa in weiten Teilen des Artikels Anführungszeichen umzustellen sind.
- Zu dieser speziellen Art Edits, die hier vorliegt, muss ich allerdings klar sagen: Das finde auch ich zu wenig. Als ich noch etwas mehr mit dem Bot gearbeitet habe, habe ich eigentlich immer darauf geachtet, dass in dem Artikel eine ausreichende Menge Korrekturen möglich ist. Es ist zwar unschön, dass das dazu zwingt, den einen oder anderen kleinen Fehler stehen zu lassen, aber das ist eben eine Folge dessen, wie unser Versionssystem funktioniert.
- Zusammenlegen mit anderen Bot-Edits geht leider aus technischen Gründen nicht ohne weiteres, weil wir hier nicht pywikipediabot verwenden, sondern ein selbstgestricktes Java-Framework. Es gibt meines Wissens keinen pywikipedia-Code, der die hier vorgenommenen Änderungen durchführt, und sie können prinzipiell auch nur halbautomatisch erfolgen – was pywikipedia wohl auch nicht in dieser Form unterstützt. Umgekehrt gibt es für die sonstigen möglichen Features keinen Java-Code. --Tobias K. 01:19, 22. Apr. 2009 (CEST)
- Es wäre ja schon geholfen, wenn er nur die Änderungen durchführt, die gleich ein ganzes Stück von dem was er kann auf einmal umfassen, und sowas z. B. auslässt. Wo da die Grenze liegt, ist natürlich schwammig, aber je mehr, desto besser. Wäre sicher auch nicht schlecht in diesem Zuge direkt auch den Bot um weitere Änderungsideen aus z.B. Benutzer:BLueFiSH.as/JS/markup.js (< nicht 100% sicher) zu erweitern. --Euku:⇄ 12:24, 22. Apr. 2009 (CEST)
- In manchen Artikeln ist typografisch einfach nicht mehr "falsch" (besondern bei kurzen Artikeln). Ich will da jetzt nicht einen Bot missbrauchen oder so, aber es zieht z. B. gerade ein Benutzer durch die Lande der im Wesentlichen ein Leerzeichen entfernt, z. B. hier (der selbe → derselbe). Die Änderung darin ist IMHO von gleicher "Wertigkeit" wie die, die Du oben mit sowas gekennzeichnet hast, nämlich ± ein Leerzeichen. Sind das dann auch keine "gravierenden Änderungen" oder liegt's daran, dass man davon ausgeht, dass ein Mensch manuell weniger Unfug anstellen kann als ein Bot? Mir wäre eine konkrete Aussage lieber als eine "schwammige" Definition, dann dann kommt der nächste, der das vielleicht wieder anders sieht usw. --Jaelle 18:52, 22. Apr. 2009 (CEST)
- Ich stimme Jaelle zu. Bei typografischen Fehlern handelt es sich um echte Fehler (keineswegs um vernachlässigbare Schönheitskorrekturen) die den Lesefluss stören, auf Leser einen unprofessionellen Eindruck machen und unbedingt korrigiert werden müssen. Ich korrigiere sie immer und werde sie immer korrigieren, wenn ich sie sehe (und Zeit habe), wobei ich das bei Einzelfällen dann schnell händisch mache. Wem stört es, wenn die Versionsgeschichte deswegen voller wird? Das ist doch vollkommen egal. Die Korrekturen erhöhren jedoch die Qualität der Artikel, und das ist das wichtigste. Serverbelastung ist nicht das Problem von uns Autoren, wenn zu viele Versionen tatsächlich die Server zu sehr belasten, muss eben die MediaWiki-Software angepasst werden, aber doch nicht das Verhalten der Benutzer. Siehe auch: en: Don’t worry about performance. Gruß, --Jens Lallensack 20:37, 22. Apr. 2009 (CEST)
- (nach BK)Seltsam, genau den Benutzer habe ich mir auch angeschaut, bevor ich diese Diskussion aufgerufen habe… In seinem Fall ist wenigstens ein Rechtschreibfehler korrigiert worden. Es wird zwar noch gestritten, ob es auch wirklich ein Fehler ist, aber es ist klar, dass es eine Änderung zur Behebung eines Rechtschreibfehlers war, wie z.B. auch die Korrektur von "nähmlich" → "nämlich" eine wäre. Das Einfügen von   ist aber von seiner Art schon keine notwendige Korrektur, da es in sehr vielen Fällen keine Verbesserung (=kein Umbruch) darstellt bzw. nicht wahrgenommen wird. Es wird immer schwammig bleiben. Was erwartest du denn nun von mir? Eine Tabelle mit allen möglichen Änderungen, die man einem Text zufügen kann, inklusive Bewertung, ob nützlich oder nicht, auch im Hinblick auf Kombinationen von möglichen Korrekturen, in Sinne von: "wenn du 4 ISBNs korrigierst, braucht es nur noch ein falsches Apostroph, dann kannst du die Änderung durchführen…"? --Euku:⇄ 20:58, 22. Apr. 2009 (CEST)
- Nur um hier Korinthen zu kacken (-: was Dir offenbar bei sowas nicht aufgefallen ist, ist, dass es sich hier um das Einfügen eines Leerzeichen handelt, das z.B. (kein Leerzeichen) wurde hier in ein z. B. (Anzeige also z. B.) umgewandelt. Der verhinderte Umbruch ist nur ein Nebeneffekt. Deswegen auch der Vergleich mit den Edits des Benutzers oben.
- Aber im Ernst, zumindest eine allgemeine Meinung der Nützlichkeit von typografischen Edits wäre schon hilfreich. Überflüssige Leerzeichen ( z. B. bei Klammern ) bzw. fehlende Leerzeichen (z.B.) stören meinen Lesefluss und irritieren mich, ein ’ statt einem ' ist zwar schöner, aber meiner Meinung eher unwichtig. Ob ISBN 978-3-89735-277-3 soviel besser als ISBN 9783897352773 ist kann ich auch nicht sagen, um ein anderes Beispiel zu nennen. Du hast offenbar eine andere Meinung dazu und der nächste Benutzer vermutlich wieder eine andere. Ich würde mich gerne nach dem Konsens richten (wenn ich ihn mal rausfinde) aber gar nichts mehr zu editieren, weil man Angst hat, jemanden auf die Zehen zu treten kann es doch auch nicht sein. Ich gebe zu, dass mir jetzt auch keine durchschlagende Lösung für das Problem einfällt. (Ist das nicht zufällig schon mal irgendwo anders durchdiskutiert worden?)
- Zum Thema Serverbelastung habe ich sooft das eine (überspitzt: "Nö, das ist überhaupt kein Problem") oder das andere gehört (überspitzt: "jede neue Version lässt die Server aus dem letzten Loch pfeifen"), so dass ich mich langsam frage, ob ich jetzt Schuldgefühle haben muss, weil ich hier rumlabere und Plattenplatz verbrauche. Vermüllte Versionsgeschichten sind natürlich schlecht, aber ich hoffe mal, dass wir jetzt nicht darüber diskutieren. --Jaelle 22:03, 22. Apr. 2009 (CEST)
- Der Konsens steht auf WP:Bots und ich zitierte ihn am Anfang dieses Abschnitts. Botsperren aus ähnlichen Gründen habe ich schon mehrmals gesehen. Die Links dazu finde ich jetzt aber bestimmt nicht mehr. --Euku:⇄ 23:36, 22. Apr. 2009 (CEST)
- Da habe ich mich wohl unklar ausgedrückt. Ich wollte wissen was eigentlich genau unter den "minimale Änderungen und kleine Schönheitskorrekturen (z. B. überflüssige Leerzeichen entfernen)" verstanden wird. Ich habe jetzt endlich auch wieder den Link gefunden, nach dem ich davon ausging, dass darunter "Quelltextkosmetik" verstanden wird (die Diskussion hier). Zum Thema Serverbelastung würde ich gerne mal die Quellen sehen (das würde mich auch unabhängig von dieser Sache hier interessieren). Diese Diskussion kommt offenbar auch nicht weiter.
- Leider scheint in der Wikipedia im Großen und Ganzen kein Verständnis für gute Typografie vorhanden zu sein (als Beispiel muss man nur einen Blick auf den heutigen Artikel des Tages werfen). --Jaelle 17:58, 24. Apr. 2009 (CEST)
- In manchen Artikeln ist typografisch einfach nicht mehr "falsch" (besondern bei kurzen Artikeln). Ich will da jetzt nicht einen Bot missbrauchen oder so, aber es zieht z. B. gerade ein Benutzer durch die Lande der im Wesentlichen ein Leerzeichen entfernt, z. B. hier (der selbe → derselbe). Die Änderung darin ist IMHO von gleicher "Wertigkeit" wie die, die Du oben mit sowas gekennzeichnet hast, nämlich ± ein Leerzeichen. Sind das dann auch keine "gravierenden Änderungen" oder liegt's daran, dass man davon ausgeht, dass ein Mensch manuell weniger Unfug anstellen kann als ein Bot? Mir wäre eine konkrete Aussage lieber als eine "schwammige" Definition, dann dann kommt der nächste, der das vielleicht wieder anders sieht usw. --Jaelle 18:52, 22. Apr. 2009 (CEST)
- Es wäre ja schon geholfen, wenn er nur die Änderungen durchführt, die gleich ein ganzes Stück von dem was er kann auf einmal umfassen, und sowas z. B. auslässt. Wo da die Grenze liegt, ist natürlich schwammig, aber je mehr, desto besser. Wäre sicher auch nicht schlecht in diesem Zuge direkt auch den Bot um weitere Änderungsideen aus z.B. Benutzer:BLueFiSH.as/JS/markup.js (< nicht 100% sicher) zu erweitern. --Euku:⇄ 12:24, 22. Apr. 2009 (CEST)
11&
Ich mußte gerade diese verunglückte Kopie von 11'09"01 – September 11 löschen [13]. Bitte überprüfen! Gruß, Fritz @ 22:39, 30. Mai 2009 (CEST)
- Das ist ein schon seit längerem bekannter Bug: Benutzer_Diskussion:ComillaBot/Archiv#Bug_bei_Apostroph.3F
- Er sollte eigentlich inzwischen (in der neusten JETERS-Version 0.3.04) behoben sein, allerdings funktioniert in dieser ein wesentliches Feature nicht, daher setze ich immer noch die ältere 0.3.02-Version ein. – Merlin G. 12:57, 2. Jun. 2009 (CEST)
JETERS-Version 0.3.04
Diese Version scheint einen Bug zu enthalten: Bei Auswahl der Funktion „Artikel alphabetisch ab …“ wird, unabhängig vom angegeben Startartikel, mit dem Artikel !!! begonnen. Bitte einfach mal testen, ob das bei euch auch so ist, um sicherzustellen, dass das nicht an meiner JRE/meinem OS liegt. (nicht signierter Beitrag von Merlin G. (Diskussion | Beiträge) 13:06, 2. Jun. 2009 CEST) – Merlin G. 13:21, 2. Jun. 2009 (CEST)
- Tritt auch bei mir auf. Irgendwie hab ich vergessen, dass ich hierauf auch noch antworten wollte... --Tobias K. 21:14, 12. Jun. 2009 (CEST)
- Bei mir ebenfalls (aktuelle SVN-Version) – Jowereit (typografie.js) 23:06, 12. Jun. 2009 (CEST)
verhunzt zöllige Kaliber
Es ist ne Weile her (Mai) und ist jetzt erst einem Leser aufgefallen: Der Bot macht aus einem englischen Dezimalpunkt ein Satzschlusszeichen [14]. Bei zölligen Kalibern wird auch im Deutschen die imperiale Schreibweise benutzt: .50 statt 0,5. Der Bot macht daraus ein. 50 (ganz falsch)
Also falls es noch keinem aufgefallen war: Hiermit gemeldet. Gruß.--Thuringius 22:54, 11. Aug. 2009 (CEST)
- Danke für die Meldung. Sowas kann der Bot nicht selbst erkennen, das muss dem Operator (in diesem Fall mir) auffallen. Ich dachte, ich hätte alle Änderungen dieser Art abgelehnt, aber eine ist offenbar durchgerutscht. Tut mir leid. – Merlin G. 10:01, 17. Aug. 2009 (CEST)
Anfrage: Heraklit
Liebe Bot-Betreiber, hoffentlich darf ich euch wieder mal auf die Nerven fallen: Nach einigen Überarbeitungen wäre ich dankbar, wenn ihr den Bot über den Heraklit-Artikel schicken könntet. Herzlichen Dank! Schöne Grüße, --Anamnesis 19:49, 21. Aug. 2009 (CEST)
- Erledigt. – Jowereit (typografie.js) 15:31, 22. Aug. 2009 (CEST)
- Vielen Dank. Gruß, --Anamnesis 15:37, 22. Aug. 2009 (CEST)
Anfrage: Gaius Musonius Rufus
Nachdem euer Bot mir schon mehrmals gute Dienste geleistet hat, würde ich euch bitten, dem Artikel Gaius Musonius Rufus, der sich gerade im Review befindet, einen Besuch abzustatten. Vielen Dank vorab. --Anamnesis 13:45, 4. Sep. 2009 (CEST)
- Erledigt. --Skyman gozilla 17:35, 4. Sep. 2009 (CEST)
- Prima, herzlichen Dank. --Anamnesis 17:49, 4. Sep. 2009 (CEST)
Anfrage: Timaios
Nach der Überarbeitung einer meiner alten Artikel würde ich euch bitten, mit eurem Bot für die Kosmetik zu sorgen. Herzlichen Dank! --Anamnesis 19:22, 30. Sep. 2009 (CEST)
- Erledigt. --Skyman gozilla 14:51, 1. Okt. 2009 (CEST)
Operatorenstelle
Ich würde mich für eine Arbeit im Operatorenteam interssieren.--Der Naturfreund 16:41, 23. Dez. 2009 (CET)
- Hallo Naturfreund! Ich war über die Weihnachtstage leider anderweitig beschäftigt, daher bitte ich um Entschuldigung für die späte Reaktion. Anscheinend hat dir auch noch niemand anderes geantwortet?
- Comilla könnte es durchaus vertragen, mal wieder von einem neuen Operator ausgeführt zu werden, also herzlich willkommen! Falls du es noch nicht getan hast, solltest du als erstes einen Blick in die Anleitung werfen und ausprobieren, ob die Software auf deinem Rechner problemlos arbeitet. Falls es technische Probleme gibt, frag einfach.
- Nach der Installation empfehle ich ein paar Edits unter deinem eigenen Account. Sobald du den Eindruck hast, dass alles funktioniert, melde dich wieder hier. Ich schicke dir dann die Login-Daten für den ComillaBot. --Tobias K. 23:34, 29. Dez. 2009 (CET)
Abkürzungen
Ich sehe immer öfter (und verwende ebenfalls) die Abkürzung zB statt z. B. Ist diese Abkürzung offiziell erlaubt? Im Duden steht sie jedenfalls nicht... --XanonymusX 20:17, 14. Mai 2010 (CEST)
- Ah, schon geklärt: Auf http://de.wiktionary.org/wiki/z._B. wird als offizielle österreichische Abkürzungen z.B. und zB angegeben. Leider fehlt der Nachweis! --XanonymusX 20:23, 14. Mai 2010 (CEST)
Mitarbeit?
Ich habe leider noch keinerlei Erfahrung mit halbautomatischen Bots, möchte aber trotzdem ganz gern mitmachen, da ich besonders gegen falsche Anführungszeichen empfindlich bin! --XanonymusX 19:38, 14. Mai 2010 (CEST)
- Freut mich, dass du Comilla ein wenig wiederbeleben willst. In letzter Zeit ist der Bot ja leider nur wenig ausgeführt worden, ein herzliches Willkommen also!
- Wirf doch mal einen Blick in die Anleitung und versuche, ob du die Software bei dir zum Laufen bringst. (Schon mal vorweg: Ich bin mir nicht sicher, ob es eine Chance gibt, den ISBNChecker zu benutzen, denn der verwendete eine möglicherweise nicht mehr aktive externe Website. Der Rest arbeitet aber hoffentlich normal.)
- Wenn du den Eindruck hast, dass alles funktioniert, melde dich wieder hier. Ich schicke dir dann die Login-Daten für den ComillaBot. Wenn etwas nicht funktioniert, melde dich auch wieder hier, dann kümmern wir uns gemeinsam um das Problem. --Tobias K. 20:11, 14. Mai 2010 (CEST)
- Ich habe JETERS installiert und auch die Comilla-Datei in components verschoben. Wenn ich aber darauf klicke, passiert gar nichts! --XanonymusX 20:32, 16. Mai 2010 (CEST)
- Oder, besser gesagt: Es erscheint die Meldung Failed to load Main-Class manifest attribute from... --XanonymusX 20:34, 16. Mai 2010 (CEST)
- Hast du auf die JETERS.jar (und nicht etwa die Comilla.jar) geklickt? Falls ja, könntest du es noch mal über die Kommandozeile/Eingabeaufforderung versuchen, oft sind die Fehlermeldungen dort besser. --Tobias K. 18:01, 17. Mai 2010 (CEST)
- Ach so! Wenn ich auf die JETERS-Datei klicke, passiert dafür gar nichts! --XanonymusX 19:17, 17. Mai 2010 (CEST)
- Hm, ok. Und wie siehts jetzt mit der Kommandozeile/Eingabeaufforderung aus? Sorry wegen der langen Reaktionszeiten, viel zu tun... --Tobias K. 00:14, 20. Mai 2010 (CEST)
- Tut mir leid, aber ich verstehe da nur nicht, wie ich ins Verzeichnis wechseln soll (laut Anleitung cd Verzeichnisname)?!--XanonymusX 19:57, 20. Mai 2010 (CEST)
- Du bekommst die Eingabeaufforderung aber schon einmal auf? Ich nehme mal an, dass du Windows verwendest - dann kannst du durch Eintippen von
dir
anzeigen, in welche Ordner du direkt wechseln kannst, und durch Eintippen voncd Ordnername
bzw.cd "Ordnername mit Leerzeichen"
dorthin wechseln. Auf diese Weise kommst du Schritt für Schritt bis in das Verzeichnis, wo JETERS.jar liegt. --Tobias K. 11:37, 22. Mai 2010 (CEST)
- Du bekommst die Eingabeaufforderung aber schon einmal auf? Ich nehme mal an, dass du Windows verwendest - dann kannst du durch Eintippen von
Die Datei wird bei mir als Executable Jar File angezeigt. Passt das? --XanonymusX 20:20, 28. Mai 2010 (CEST)
- Klingt korrekt. Jetzt wäre noch eine Programmausführung per
java -jar JETERS.jar
in diesem Verzeichnis eine Möglichkeit, evtl. aussagekräftigere Fehlermeldungen zu bekommen. --Tobias K. 23:24, 28. Mai 2010 (CEST)
- Nun ist erstmals etwas passiert:
- Nun ist erstmals etwas passiert:
Exception in thread "main" java.util.MissingResourceException: Can't find bundle
for base name translations\ComillaReplacer\lang, locale de_DE
at java.util.ResourceBundle.throwMissingResourceException(Unknown Source
)
at java.util.ResourceBundle.getBundleImpl(Unknown Source)
at java.util.ResourceBundle.getBundle(Unknown Source)
at net.sf.jeters.internationalization.TranslationReader.readTranslation(
Unknown Source)
at net.sf.jeters.componentInterface.ComponentManager.loadTranslation(Unk
nown Source)
at net.sf.jeters.componentInterface.ComponentManager.getLocalizedCompone
ntName(Unknown Source)
at net.sf.jeters.components.DefaultGUI.createComponentClassComboBox(Unkn
own Source)
at net.sf.jeters.components.DefaultGUI.presentHomeView(Unknown Source)
at net.sf.jeters.core.Core.run(Unknown Source)
at net.sf.jeters.core.JETERS.main(Unknown Source)
- --XanonymusX 17:37, 30. Mai 2010 (CEST)
- Ok, das ist jetzt eine brauchbare Fehlermeldung. :) Mal sehen, ob ich den Grund finden kann. --Tobias K. 23:36, 30. Mai 2010 (CEST)
- Erste Fortschritte: Den Fehler habe ich bei mir nachstellen können, allerdings nur unter Windows. Behoben habe ich ihn zwar noch nicht, aber einen Workaround gefunden. Wenn man die Comilla.jar mit einem zip-Programm (beispielsweise 7zip) öffnet und den Ordner ComillaReplacer aus dem Unterverzeichnis translations des Archivs in den translations-Ordner im JETERS-Verzeichnis kopiert, lässt sich das Programm wie vorgesehen benutzen. --Tobias K. 21:40, 7. Jun. 2010 (CEST)
- Ok, das ist jetzt eine brauchbare Fehlermeldung. :) Mal sehen, ob ich den Grund finden kann. --Tobias K. 23:36, 30. Mai 2010 (CEST)
- --XanonymusX 17:37, 30. Mai 2010 (CEST)
Ah, endlich funktioniert's! Zur Zeit werde ich Comilla wohl nicht allzu sehr verwenden können, aber dann im Sommer werde ich meine Aktivität beginnen! --XanonymusX 21:16, 8. Jun. 2010 (CEST)
- Ich habe mich inzwischen aber immerhin mit der Funktionsweise vertraut gemacht. Jetzt fehlen mir nur noch die Zugangsdaten! --XanonymusX 19:55, 11. Jun. 2010 (CEST)
- Schicke ich dir gerne. Könntest du dafür in deinen Einstellungen den Mail-Empfang freischalten oder einen anderen Kommunikationsweg nennen, bei dem nicht alles Geschriebene dauerhaft in einer Versionsgeschichte nachlesbar ist? ;-) --Tobias K. 20:23, 11. Jun. 2010 (CEST)
- Geht in Ordnung, habe ich freigeschalten! --XanonymusX 21:13, 11. Jun. 2010 (CEST)
Wunsch um Einweihung
Hallo liebe Botbetreiber!
Weil mich dieses Projekt hier sehr ansprach, als ich vorhin darübergestolpert bin, habe ich mir gleich mal die Java-Archive heruntergeladen und entpackt. Nach anfänglichen Schwierigkeiten, die aus meinem Ich-spiel-erstmal-überall-dran-herum-Verhalten resultiert sind, läuft jetzt auch alles reibungslos und ich kann Seiten nach Verbesserungspotential durchsuchen, die Änderungen ansehen usw. Nur beim Punkt »Benutzername und Passwort« komme ich natürlich noch nicht weit...
Um den Bot auch mal wirklich in Aktion zu erleben und auch nutzen zu können, bitte ich hiermit in die Einweihung in die Geheimnisse der Comillianer, namentlich das des Passwortes. Meine E-Mail-Funktion ist eingeschaltet; wenn das zur Sicherung noch nicht reicht, könnt ihr euch hier meinen GnuPG-Schlüssel besorgen. Freundliche Grüße --Thirafydion Feedback 17:20, 26. Jun. 2010 (CEST)
- Mail gesendet. --Tobias K. 02:15, 28. Jun. 2010 (CEST)
- Vielen Dank - auch für die Benachrichtigung wegen des Bugs. Ich hatte den Bot schonmal unter meinem Account testen wollen, aber konnte mich nicht einloggen. Nachdem auch eine Vereinfachung des Passworts auf bloße Zahlen nicht half, hatte ich gehofft, es sei wohl nur möglich, vom Comilla-Account aus Bearbeitungen zu tätigen. Wenn du möchtest, biete ich mich gerne an, dir bei der Beseitigung des Bugs zu helfen; ich habe immerhin ein bisschen Zeit übrig. Noch habe ich zwar keinen blassen Schimmer von Java, aufgrund meiner anderweitigen Programmiererfahrung lerne ich eine neue Sprache aber erfahrungsgemäß sehr schnell. Ich werde also demnächst mal versuchen, mich da reinzufuchsen und zu verstehen, wo das Problem liegt. Gibt es da noch irgendetwas, was ich wissen müsste und nicht aus dem Quelltext erschließen könnte? Grüße --Thirafydion Feedback 19:04, 28. Jun. 2010 (CEST) Hoffentlich habe ich den Mund nicht zu voll genommen :-)
- Na, du bist ja sehr engagiert. :-) Wie ich schon angedeutet habe, tritt das Login-Problem sogar in einfachen Testfällen mit der bisher verwendeten, veralteten Version der JWBF-Bibliothek auf, in der aktuellen Version jedoch nicht. Ein Update der Bibliothek wäre also die naheliegende Reaktion.
- Letztes Mal war das ziemlich einfach, da sich nicht viel an der Schnittstelle geändert hat:
- Diesmal sollte/müsste man mindestens noch:
- Verwendungen von MediaWikiAdapterBot (schon eine Weile "deprecated") durch MediaWikiBot ersetzen und Queries nicht mehr über Methodenaufrufe, sondern über das Erzeugen von Action-Objekten starten.
- Die Änderungen in ContentAccessable auf die eigenen Klassen übernehmen (es wurde mindestens getLabel durch getTitle ersetzt, ob es noch ernsthaftere Änderungen gab, weiß ich nicht)
- Die von JWBF seinerseits verwendeten Bibliotheken aktualisieren
- Da die entsprechenden Klassen meines Wissens schon in der jetzt verwendeten Version zur Verfügung stehen, kann man 1 und 2 schon vor dem Update vorbereiten - ggf. könntest du also mal versuchen, ob du die entsprechenden Änderungen hinbekommst.
- Wenn dir was unklar ist, frag mich; ich sehe zu, dass ich einigermaßen zeitnah antworte. --Tobias K. 16:01, 29. Jun. 2010 (CEST)
- Vielen Dank - auch für die Benachrichtigung wegen des Bugs. Ich hatte den Bot schonmal unter meinem Account testen wollen, aber konnte mich nicht einloggen. Nachdem auch eine Vereinfachung des Passworts auf bloße Zahlen nicht half, hatte ich gehofft, es sei wohl nur möglich, vom Comilla-Account aus Bearbeitungen zu tätigen. Wenn du möchtest, biete ich mich gerne an, dir bei der Beseitigung des Bugs zu helfen; ich habe immerhin ein bisschen Zeit übrig. Noch habe ich zwar keinen blassen Schimmer von Java, aufgrund meiner anderweitigen Programmiererfahrung lerne ich eine neue Sprache aber erfahrungsgemäß sehr schnell. Ich werde also demnächst mal versuchen, mich da reinzufuchsen und zu verstehen, wo das Problem liegt. Gibt es da noch irgendetwas, was ich wissen müsste und nicht aus dem Quelltext erschließen könnte? Grüße --Thirafydion Feedback 19:04, 28. Jun. 2010 (CEST) Hoffentlich habe ich den Mund nicht zu voll genommen :-)
- OK, dann werde wir uns mal an die Aktualisierung machen. Ich habe mir die Quellcodes mal angesehen und es ist doch um einiges komplexer, als ich gedacht habe. Leider hatte ich bisher noch nicht die Gelegenheit, mich wirklich einzuarbeiten und zu verstehen, wie das organisiert ist und funktioniert. Wegen des MediaWikiAdapterBots habe ich mal die Stellen herausgesucht, an denen er verwandt wird und werde mich bei nächster Gelegenheit mal mit dem MediaWikiBot beschäftigen, um die betreffenden Aufrufe zu ersetzen.
- Gibt es zu den Änderungen an ContentAccessable vielleicht irgendwo ein Changelog?
- Auf das Antworts-Angebot werde ich sicher noch häufiger zurückgreifen ;-). Viele Grüße bis dahin --Thirafydion Feedback 15:33, 30. Jun. 2010 (CEST)
- Falls du es noch nicht gefunden hast, das jetzige SVN-Changelog für ContentAccessable findest du hier [16]. Die Datei wurde wohl allerdings im Rahmen der sehr umfangreichen Rev. 231 "change project structure step 3" verschoben, die Vorgeschichte reicht daher nicht allzu weit zurück. Genauer habe ich mir die Situation selber noch nicht angeschaut, ich weiß nur, dass a) es ohne Änderung nicht mehr compiliert und b) in der CHANGELOG.txt im JWBF-Download ein "ContentAccessable#getLabel() is now getTitle()" steht. --Tobias K. 22:02, 30. Jun. 2010 (CEST)
- Ich hoffe jedenfalls auch auf schnelle Behebung des Problems, ich bin noch nie zur Anwendung gekommen! --XanonymusX 22:04, 30. Jun. 2010 (CEST)
- Wie sieht's aus? Ist das Problem gelöst? --XanonymusX 19:19, 9. Jul. 2010 (CEST)
- Ich bin leider bisher nicht mehr dazu gekommen, daran zu arbeiten, weil ich die gesamte Woche nur ca. 1-2 Stunden am Tag zu Hause bin. Nächste Woche werde ich voraussichtlich wieder mehr Zeit haben, mich damit zu befassen. Wenn Tobias also das Problem nicht schon gelöst hat, ist es noch offen. --Thirafydion Feedback 11:17, 10. Jul. 2010 (CEST)
- Hallo nochmal!
- Wie versprochen habe ich mir die Sache mit den Bots mal vorgenommen und das ist jetzt der Stand meines Wissens:
- Die meisten MediaWikiAdapterBot-Methoden, die in MediaWikiIO.java aufgerufen werden, sind ja von MediaWikiBot geerbt und daher kein Problem. Das einzige Problem sind diese ganzen get*-Methoden, für die der MediaWikiBot keine Entsprechungen bereitstellt. So wie ich deinen obigen Post verstanden habe, möchtest du ja auch keine Methoden im MediaWikiBot verwenden, sondern direkt die action-Klassen einbinden und daraus Objekte erzeugen.
- Da ich aber absolut keine Ahnung von Java habe, sondern den Code bisher nur aufgrund meiner PHP-Erfahrung verstehen konnte, erkenne ich jetzt überhaupt nicht, was die MediaWikiAdapterBot-Methode tut, was eine einfache Objekterzeugung nicht leisten könnte. Mit anderen Worten: Reicht es, einfach die entsprechenden Klassen direkt einzubinden und Objekte zu erzeugen oder muss man da vorher die Parameter noch präparieren wie es die MediaWikiAdapterBot-Methode vielleicht tut?
- Viele Grüße --Thirafydion Feedback 11:43, 13. Jul. 2010 (CEST)
- Eigentlich sollte genau das ausreichen: Objekte direkt erzeugen, beim Konstruktor-Aufruf das MediaWikiBot-Objekt und die sonstigen Parameter (die man beim MWAB der get*-Methode übergebenen hätte) verwenden. Es kann sein, dass sich die Signaturen der get* und des Konstruktors in Details unterscheiden, dann eben sinnerhaltend anpassen. --Tobias K. 17:39, 13. Jul. 2010 (CEST)
Neue Version behebt Login-Probleme
Ich habe heute eine neue Version von JETERS veröffentlicht, sie ist wie üblich auf Sourceforge erhältlich. Mit dieser Version sollte die Software für den Einsatz in Wikipedia wieder voll funktionsfähig sein und die bisherigen Login-Probleme nicht mehr existieren. Vergesst bei einer Neuinstallation nicht, die Comilla.jar (Download hier) in den components-Ordner zu platzieren, wie auch in der Anleitung erwähnt! --Tobias K. 15:06, 12. Sep. 2010 (CEST)
- Puh, endlich kann ich mich an die Arbeit machen! --XanonymusX 13:01, 13. Sep. 2010 (CEST)
Sonderzeichen
Nach einer Bearbeitung hier sieht das Schriftbild ziemlich schlecht aus! Muss man noch was einstellen? Ich mach die Änderungen mal vorerst rückgängig! --XanonymusX 17:52, 14. Sep. 2010 (CEST)
- Hm, irgendein Encoding-Problem. Nein, eigentlich sollte man nichts einstellen müssen, bei mir läuft dieser Artikel auch problemlos durch.
- Jetzt stellt sich natürlich die Frage, woran das wieder liegt. Für eine erste Einschränkung der Problemursachen wäre ganz interessant: Welches Betriebssystem, welche Sprachversion? Welche Java-Version? Und: Wenn du den Artikel mal bis zur Zusammenfassungs-Seite am Ende durchlaufen lässt (wo der gesamte Artikeltext noch mal steht, bevor man ihn normalerweise abschicken würde), sind die fehlerhaften Zeichen dort dann auch schon drin? --Tobias K. 11:37, 15. Sep. 2010 (CEST)
- Ja, schon in den Bearbeitungsfenstern ist alles falsch. (hab's an Die Memoiren des Grafen probiert). Ich verwende Windows XP (ganz normale deutsche Version) und Java müsste völlig aktuell sein (ich weiß grad nicht, wo ich's kontrollieren könnte). --XanonymusX 19:55, 16. Sep. 2010 (CEST)
- Ok, ich habe den Fehler jetzt reproduzieren können, und leider hilft auch eine aktuelle Java-Version nichts. Ich sehe, was ich tun kann. --Tobias K. 23:03, 16. Sep. 2010 (CEST)
- Ja, schon in den Bearbeitungsfenstern ist alles falsch. (hab's an Die Memoiren des Grafen probiert). Ich verwende Windows XP (ganz normale deutsche Version) und Java müsste völlig aktuell sein (ich weiß grad nicht, wo ich's kontrollieren könnte). --XanonymusX 19:55, 16. Sep. 2010 (CEST)
Abschied als Botbetreiber
Hallo Operatoren,
ich weiß nicht, wie viele von euch überhaupt noch ein Interesse daran haben, hier mitzuarbeiten. In den letzten Monaten hat Comilla jedenfalls nicht allzu viel Aktivität gesehen.
Bei einigen von euch sind leider auch die gehäuften technischen Probleme schuld daran, dass sie gar nicht wirklich aktiv werden konnten. Diese Schwierigkeiten sind ein deutliches Symptom dafür, dass ich mich nicht ausreichend um das Projekt Comilla kümmere und zu viele andere Aktivitäten gleichzeitig laufen habe.
Diesen Zeitmangel sieht man auch der Software JETERS an. Ich habe aber wenig Motivation, daran noch etwas zu ändern. Denn während die Hand in Hand mit JETERS entstandene Java-Bibliothek JWBF mittlerweile einen weiteren Nutzerkreis gefunden hat und kontinuierlich verbessert wird – was mich sehr freut! –, rechtfertigt das geringe Interesse an JETERS eine Weiterentwicklung des Programms nicht.
Ich sehe es daher als ein Gebot der Ehrlichkeit mir selbst, euch und der Wikipedia gegenüber an, meine Tätigkeit als Bot-Betreiber nicht nur innerlich, sondern auch offiziell aufzugeben.
Und wie geht es jetzt mit Comilla weiter? Wenn jemand von euch mich als Hauptbetreuer beerben möchte, dann lasst es mich wissen. Ich werde meinem Nachfolger noch für kleinere technische Belange zur Verfügung stehen, falls kleinere Aufgaben anfallen – wie etwa die vorhin angekündigte Aktualisierung der verwendeten Bibliotheken. Sollte keiner diese Position übernehmen wollen, wird das Projekt Comilla eingestellt.
Ich danke allen Beteiligten am Projekt Comilla für den Beitrag, den sie mit ihrer Mitarbeit zur Qualität der Wikipedia geleistet haben. --Tobias K. 20:14, 17. Okt. 2010 (CEST)
- Oh, schade. Die technischen Kenntnisse fehlen mir jedoch, sodass ich nicht in Frage komme. Es wäre schade, wenn der Bot ausgeschaltet würde, es gäbe nämlich viel Arbeit für ihn. --XanonymusX 21:02, 18. Okt. 2010 (CEST)