Benutzer Diskussion:Ordercrazy/Denkmalparser

aus Wikipedia, der freien Enzyklopädie

... geodaten bayern de tomcat viewerServlets query?art=denkmalOeff&denkmal=D-7-77-121-3&limit=200 antwort in java parsen html auslesen.

Probleme mit Parser

Lieber Thomas,

ich bin gerade dabei, meine vor über einem Jahr "händisch" abgetippten alten Listen der Gemeinden im Landkreis Dachau mit Hilfe Deines Parsers in Tabellenlisten zu verwandeln. Ein Grundproblem - das ist mir in der Oberpfalz besonders aufgefallen, taucht jetzt in Oberbayern auch auf - ist, dass die Baudenkmäler in der PDF-Liste oft keine genaue Adresse und keine Bezeichnung tragen (Filialkirchennamen fehlen, Kapellen muss man erraten!) und man im BayernViewer nach der Bezeichnung suchen und sie nachtragen muss. Die PDF-Liste - ich weiß nicht, wie sie generiert wird, ist also sehr schlampig gemacht und nicht einheitlich "gebaut", so dass der Parser häufig scheitert und man eigentlich alles nachkontrollieren muss (Du könntest Dir mal Altomünster anschauen, das sehr viele kleine OT hat!).

Der Parser kann natürlich die Adresse nicht richtig ausweisen, wenn sie nicht oder ungenau angegeben ist! Und die meisten "Parser-Koordinaten" sind für die katz, denn bei Kirchen ist die angegebene "Zustelladresse" das Pfarramt und nicht der Kircheneingang, den man gerne in den Koordinaten haben will. Also muss man bei den Ortsteilen im BayernViewer zuerst das kleine Objekt suchen (wenn man erraten hat, was es sein könnte!), dann in den Koordinatenfinder gehen und dort dasselbe Objekt suchen, um dann die Koordinaten korrekt einzutragen. Man stellt dann fest, dass die Parserkoordinaten zu zwei Dritteln nicht stimmen. Und wie kann man sicher sein, dass das restliche Drittel stimmt? Alle noch einmal bestimmen? Da kann man ja gleich alles "händisch" machen.

Wie Du hoffentlich bemerkt hast, kritisiere ich nicht den Parser - ein Algorithmus funktioniert eben nur, wenn die Daten, auf die er zugreift, stimmen und immer die gleiche Struktur haben. Ich habe mich schon mehrfach beim Dr. I. im BLfD beschwert, aber in dieser Hinsicht noch keine Antwort bekommen. Aber ich werde wieder einmal persönlich bei ihm vorsprechen, um herauszukriegen, ob es nur am Geld- und Personalmangel liegt, dass vieles so schlampig "nachqualifiziert" und dokumentiert ist!!

Herzliche Grüße im Advent, schade, dass Du nicht zum Stammtisch kommen kannst! --Didi43 (Diskussion) 10:32, 12. Dez. 2012 (CET)

Probleme mit dem Link

Hallo Thomas, angeregt von unserer Diskussion zu den ehemaligen Denkmälern auf der Denkmalpflegeseite wollte ich mich nochmal an ein oder zwei Listen machen. Mir scheint der Link zum Parser nicht mehr zu funktionieren. Wäre schön wenn Du da mal drauf schauen könntest. Oder stell' ich mich nur dumm an? Danke und Grüße, Philipp --Daribbah76 (Diskussion) 20:50, 23. Sep. 2013 (CEST)

Sorry - ich hab den Parser mit dem Server versehentlich plattgemacht. Ich bitte um Geduld bis etwa Mitte Oktober, dann wird es eine neue Parserversion geben. --Ordercrazy (Diskussion) 18:15, 27. Sep. 2013 (CEST)
https://hochnebel.net/denkmalparser/index.html