Sciweavers

TREC
2007

Three Non-Bayesian Methods of Spam Filtration: CRM114 at TREC 2007

13 years 12 months ago
Three Non-Bayesian Methods of Spam Filtration: CRM114 at TREC 2007
:        For the TREC 2007 conference, the CRM114 team considered three non­Bayesian methods of spam  filtration in the CRM114 framework – an SVM based on the “hyperspace” feature==document  paradigm, a bit­entropy matcher, and substring compression based on LZ77.  As a calibration  yardstick, we used the well­tested and widely used CRM114 OSB markov random field system  (basically unchanged since 2003).   The results show that the SVM has a spam­filtering accuracy of  about a factor of two to three better accuracy than the OSB system, that substring compression is  somewhat more accurate than OSB, and that bit entropy is somewhat less accurate for the TREC  2007 test sets.
Mamoru Kato, Joseph Langeway, Yimin Wu, William S.
Added 07 Nov 2010
Updated 07 Nov 2010
Type Conference
Year 2007
Where TREC
Authors Mamoru Kato, Joseph Langeway, Yimin Wu, William S. Yerazunis
Comments (0)