Benutzer Diskussion:Stefan Kühn/Check Wikipedia/Archiv/2013/Februar

aus Wikipedia, der freien Enzyklopädie

dewiki - more

Hallo Stefan,
anfangs stand in der Spalte "More" nicht "more", sondern die Zahl der Fehler. Das ist wohl irgendwann verschütt gegangen. Reparierbar?
Gruß --RonMeier (Diskussion) 21:12, 10. Feb. 2013 (CET)

Das hab ich ausgebaut, weil dadurch die Abfragen richtig langsam wurden. -- sk (Diskussion) 21:35, 15. Feb. 2013 (CET)
Das Problem ist halt nun, dass man nicht mehr sieht, ob weitere Fehler bei einem Lemma vorhanden sind. Andim (Diskussion) 22:01, 15. Feb. 2013 (CET)

de wikipedia ID: 37 SORTIERUNG fehlt und Lemma mit Sonderzeichen

Hallo Stefan, änderst Du da in letzter Zeit etwas an deinen Suchalgorithmen ? Bis ca. Dezember 2012, kamen da jeden Tag einige Einträge hinzu, die zeitnah abgearbeitet wurden. Im Dezember begann die Zahl stetig zu steigen, bis sie Ende Januar über 50000 erreichte, wobei das found-Date teilweise mehrer Jahre zurückliegt. seit ungefähr 2 Wochen sinkt die Anzahl wieder um ca. 1000/Tag, obwohl nur ca 50 pro Tag abgearbeitet werden. --Varina (Diskussion) 16:12, 24. Feb. 2013 (CET)

Hallo Varina, nein ich hab seit langer Zeit eigentlich nix am Code geändert. Außer vor ein paar Tagen einige Bugfixes am Fehler 46 und anderen Kleinkram. Das sollte aber nichts mit Nr.36 zu tun haben. (Hier kannst du die Änderungen sehen). Ich weiß auch nicht warum diese Fehlerzahl sinkt. Könnte ein Bot sein oder das ein anderes Skript wie AWB das gleich mit macht. Wenn die Fehler wirklich weg sind, dann findet sie mein Skript auch nicht beim nächsten Scan. Ansonsten tauchen die beim nächsten Scan auch wieder auf. -- sk (Diskussion) 15:19, 26. Feb. 2013 (CET)

False positive in nested brackets or braces

I think there is a false positive with error 46, in entries like ca:Cavall frisi or ca:Mercantilisme, which have a link inside a File:

Same thing for error 47, with braces, in ca:Aphelocoma californica or ca:Història d'Hondures. Can you look into it? --Joutbis (Diskussion) 20:13, 21. Feb. 2013 (CET)

At the moment I see a change in Cavall frisi. But at ca:Mercantilisme I can not see a problem. This is a bug. At 47 I can not find a problem. Maybe this is solved. -- sk (Diskussion) 15:30, 26. Feb. 2013 (CET)
You are right, problems in 47 are not related to nested braces. They are rather related to <math> tags. See ca:Esforç intern or ca:Producte mixt. Only ca:Fal·làcia de Hoyle doesn't have math tags (but it's got a rather complicated expression). The problem with braces happens in 43, too (ca:Barrera de potencial).
Similar math-related problems can be found in error 59 with ca:Distribució hipergeomètrica or ca:Dinàmica del sòlid rígid, and error 54 with ca:Angle
I still nesting problems with brackets in 46 (ca:Mercantilisme, ca:Hàbitat espacial, ...). --Joutbis (Diskussion) 19:17, 8. Mär. 2013 (CET)
I think I found it!; they are not really nesting problems, even in 46. The thing is that brackets were missing in the article; just not where the tool said. I think I've fixed most of them now. All that's left is probably related to math tags. --Joutbis (Diskussion) 19:22, 22. Mär. 2013 (CET)

Patches for checkwiki.cgi ?

Hi Stefan,

I'd like to propose at least one patch for checkwiki.cgi: I'd like to have a second list for bots (view=bots2 or something like that) that would have 2 modifications from the current list for bots:

  • In basic text, no HTML formatting => easier for parsing
  • Each line containing the pageid and the page title => allowing to manage deleted articles and moved articles

Would you be ok for that ? Where can I get my hand on checkwiki.cgi source ?

Thanks --NicoV (Talk on frwiki) 11:30, 1. Feb. 2013 (CET)

Hello NicoV, I have add the cgi to github. You can add your source there. Maybe it is easier to add a second cgi-file only for bots (bots.cgi) .-- sk (Diskussion) 21:04, 9. Feb. 2013 (CET)
Thanks Stefan, I will try to create a new cgi-file for bots. Is there any way to test it on the toolserver with the real database or should I do all the tests on my own computer ? --NicoV (Talk on frwiki) 16:08, 11. Feb. 2013 (CET)
I've committed a first version on github, but it's totally untested. I'm leaving on holidays after the weekend, I don't think I will have time to finish this before leaving. I will finish when back home. --NicoV (Talk on frwiki) 00:48, 15. Feb. 2013 (CET)
Now you can test it. I have fix a little bit. -- sk (Diskussion) 21:34, 15. Feb. 2013 (CET)
Thanks a lot Stefan. This was my first script in Perl so I made errors with newlines (using \n between single quotes instead of double quotes) : instead of newlines in the output, I get \n text. I've fixed this (+ applied your fix also) and committed it again in github. Can you update the script on the tool server so that I can test it more now that the newlines are correct ? --NicoV (Talk on frwiki) 22:44, 16. Feb. 2013 (CET)
Apart from the newlines problem, the output seems ok (example). --NicoV (Talk on frwiki) 22:48, 16. Feb. 2013 (CET)

Hi Stefan, would you have time to apply the last modification I did on checkwiki_bots.cgi ? Back from holidays and eager to test that ;) Cheers --NicoV (Talk on frwiki) 09:27, 23. Mär. 2013 (CET)

Hi Stefan, I managed to use the currently deployed version of checkwiki_bots.cgi in WPCleaner. It's a lot better for managing deleted or moved articles. I coded it so that it should also work with the fixed version of checkwiki_bots.cgi. --NicoV (Talk on frwiki) 07:56, 13. Apr. 2013 (CEST)