Diskussion:Recall und Precision

aus Wikipedia, der freien Enzyklopädie

Begriff

Gibt es da keine deutschen Begriffe? Stern !? 12:13, 19. Okt 2005 (CEST)

Fehler in der Literatur

Das Buch "Information Retrieval" ist von einem C.J. van Rijsbergen und nicht C.V.! (nicht signierter Beitrag von 134.76.81.25 (Diskussion | Beiträge) 15:01, 14. Jan. 2010 (CET))

Effektivitätsmaß

Das Effektivitätsmaß ist eine Methode zur Bewertung von Retrievalsystemen. Die Effektivität eines Systems liegt bei der von van Rijsbergen erstellten Methode zwischen 0 (beste Effektivität) und 1 (schlechte Effektivität). Erreicht die Effektivität den Wert 0, so ist sie auf den Recall reduziert. Erreicht sie den Wert 1 ist sie auf die Precision reduziert.

Berechnung des Effektivitätsmaß:

E: Effektivität, R: Recall, P: Precision

Bitte mit weiteren Informationen füllen und dann in den Artikel einpflegen --Kswtch 10:45, 26. Jul 2006 (CEST)

Kannst du bitte eine Quelle ausfindig machen? -- Nichtich 22:50, 26. Jul 2006 (CEST)

Lücken im Artikel

Es fehlen typische Angaben, in welchen Größenordnungen sich Recall und Precision bei üblichen IR-Systemen bewegen und wie sich diese Werte in den letzten 50 Jahren verbessert haben. Grundsätzlich sollte etwas genauer ausgeführt werden, wie die Werte in der Praxis ermittelt werden, wo die einzelnen Teilmengen nicht von vorneherein bekannt sind.

Inzwischen habe ich den Artikel umgebaut, um ihn richtig gut zu bekommen, fehlen noch Bilder, konkrete Beispiele (mit Rechnung und PR-Graph, etwas zur Geschichte und zur Abgrenzung (Warum wurden nicht einfach die Termini aus der statistischen Klassifikation übernommen? Wie beurteilt man wenn Ranking ins Spiel kommt...?), (siehe auch en:Receiver operating characteristic), Quellen und Weiterführendes. -- Nichtich 00:42, 10. Dez. 2007 (CET)

Verständnisfrage zu Precision

Das denkbar schlechteste aller Retrievel-Verfahren liefert für das Maß Precision den Bruch 0/0. Bekanntlich ist dieser Bruch ein klassisches Problem der Mathematik, das häufig mit „nicht vernünftig lösbar“ angegeben wird. Was ist die Lösung in diesem Fall? 0, 1 oder NaN? --155.56.68.221 10:38, 25. Jan. 2008 (CET)

Auch das beste Verfahren liefert 0/0, wenn es zu einer Suche keine Treffer gibt. Genaugenommen darf ein Verfahren, das ausschließlich richtige Treffer liefert in dem Fall auch keine Treffer liefern, da eine Suche nach einem nicht vorhandenem Dokument auch keine Treffer liefern darf (ohne falsche Treffer zu liefern). --Locked 13:15, 25. Jan. 2008 (CET)
Selbstverständlich ist die Precision in diesem Fall nicht definiert - es macht ja auch gar keinen Sinn für eine konklrete, leere Menge noch irgendwelche Eigenschaften der Elemente anzugeben. Falls du die Precision als Wahrscheinlichkeit angibst, hat ein Verfahren, dass im Zweifellsfall auch mal gar keine Treffer liefert, vermutlich eine höhere Precision - aber dann rechnest du ja auch nicht mit Einzelfällen. Wenn ein Verfahren immer Null treffer liefert, kann die als bedingte Wahrscheinlichkeit definiertbare Precision ebenfalls nicht angegeben werden. -- Nichtich 03:41, 3. Feb. 2008 (CET)

Möglicher Fehler bei der Erklärung des F1-Maß

Alle anderen Quellen (inkl. z.B. englische Wikipedia) verwenden bei dem gewichteten F1-Maß das Quadrat des Parameters zur Berechnung, nicht den Parameter (hier Alpha) selbst. Die Formel bleibt dadurch zwar äquivalent, die Aussage, dass F2 den Recall doppelt so stark wichtet dürfte dann aber falsch sein (in diesem Fall wäre hier F4 = F(2^2) erst die doppelte Gewichtung).

Möglicher Fehler (oder Verständnisproblem) beim Begriff 'Fallout'

im artikel steht:

Der Fallout ergibt sich aus dem Verhältnis nicht gefundener, irrelevanter Dokumente (richtig negativ) zu allen nicht relevanten Dokumenten TN / (FP + TN). Er entspricht der statistischen false positive rate (FPR) und ist das Gegenteil der Spezifität (1 − FPR).

im artikel 'Spezifität' ist die selbe formel angegeben, obwohl es lt. dem obigen satz eine andere hätte sein müssen.

Übernahme der Artikelinhalte in eine neue Version von "Beurteilung eines Klassifikators"

Hallo, ich habe auf meiner Benutzerseite eine neue Version des Artikels "Beurteilung eines Klassifikators erstellt, die die vielen Redundanzen unter anderem auch dieses Artikels (siehe Portal:Mathematik/Qualitätssicherung#Mutter_aller_Redundanzen:_Fehlerklassifikation) auflösen und darüber hinaus die verschiedenen Maße sowie ihr Bezug zur statistischen Testtheorie (bzw. auch die Abgrenzung dazu) besser darstellen soll. Über Feedback zu der neuen Version wäre ich dankbar, wenn keine größeren Bedenken geäußert werden, werde ich in den nächsten Tagen die neue Version schrittweise einstellen und diesen und die anderen Artikel in Weiterleitungen umgewandeln. Gruss --Darian 22:49, 22. Okt. 2010 (CEST)

"Recall und Precision" leitet jetzt auf Beurteilung eines Klassifikators. Dort kommen die Wörter aber überhaupt nicht vor. Das finde ich nicht gut. In Information_Retrieval#Recall_und_Precision gibts auch noch mal Recall und Precision. (nicht signierter Beitrag von 84.147.191.62 (Diskussion) 20:26, 18. Feb. 2011 (CET))