Browse Prior Art Database

Apparatur und Verfahren zur Filterung von Daten

IP.com Disclosure Number: IPCOM000017745D
Original Publication Date: 2001-Jul-01
Included in the Prior Art Database: 2003-Jul-23
Document File: 1 page(s) / 13K

Publishing Venue

Siemens

Related People

Rainer Kuth: AUTHOR

Abstract

Die Idee ist es, aus einer grossen Anzahl von digitalen Informationen, anhand von generellen oder benutzerspezifischen Merkmalen die Datensätze herauszufiltern, welche für eine individuelle Person wichtig sind.

This text was extracted from an ASCII text file.
This is the abbreviated version, containing approximately 84% of the total text.

- 160 -

Information / Kommunikation

Apparatur und Verfahren zur Filterung von Daten

Idee: Rainer Kuth, Herzogenaurach

Die Idee ist es, aus einer grossen Anzahl von digitalen Informationen, anhand von generellen oderbenutzerspezifischen Merkmalen die Datensätze herauszufiltern, welche für eine individuellePerson wichtig sind.

Bisher sind Filter bekannt, die anhand von vorgebbaren Merkmalen in bestimmten Feldern eineFilterung vornehmen können.

Die Idee besteht nun darin, dass der Benutzer Datensätze in zumindest zwei Stufen(wichtig/unwichtig) bewertet und dass darauf basierend sukzessive eine Datenbank aufgebautwird. Auf Basis der Datenbank ermittelt eine Filtersoftware einen Wichtigskeitsgrad, die demBenutzer eine Hilfe bei der Einteilung nach Bedeutsamkeit der eingegangenen Dokumente liefert.Die Filtersoftware wertet diese aus, indem sie ein Wörterbuch führt, in welches sie allevorkommenden Wörter sammelt und zu jedem Wort einen Zähler führt: „Vorgekommen inunwichtigem Datensatz“ und „Vorgekommen in unwichtigem Datensatz“. Nach entsprechenderBewertung vieler Datensätze bildet sich so eine Struktur heraus, in der es Worte gibt, die inwichtigen und unwichtigen Datensätzen etwa gleich oft vorkommen und Worte, die besondershäufig in wichtigen und unwichtigen Datensätzen auftreten. Nach einer gewissen Lernphase kannder Filter dann für jedes neue Dokument einen Wichtigkeitsgrad ermitteln, indem er prüft, inwelchem Masse das betreffende Dokument wichtige und...