Development of a Multi-Classifier Approach for Multilingual Text Categorization

15 years 8 months ago

Download ww1.ucmss.com

- Research work related to applying text categorization methods to a monolingual corpus such as English text collections has been well established by several research teams in recent years. However, little attention has been paid to applying the techniques to classify the documents in multiple languages such as English and Chinese by means of a unified model. In this paper we propose a multi-classifier system platform to enable multilingual documents be effectively categorized. First, we utilized a number of selected corpora in multiple languages collected from internet to train several text classifiers based on the Support Vector Machines (SVM) model. Subsequently, the multilingual texts of unknown category were classified by the trained classifiers. Finally, we evaluated our experimental results by accuracy, recall, precision, and F1 measures. The preliminary results show that our platform model has the potential for multilingual text categorization.

Chung-Hong Lee, Hsin-Chang Yang, Ting-Chung Chen,

Real-time Traffic

DMIN 2006 | DMIN 2007 | Multiple Languages | Text Categorization | Text Categorization Methods |

claim paper

» An EM Based Training Algorithm for CrossLanguage Text Categorization

» Exploiting Comparable Corpora and Bilingual Dictionaries for CrossLanguage Text Categoriza...

» Combining coregularization and consensusbased selftraining for multilingual text categoriz...

» Multilingual document clusters discovery

» Design of a CrossMedia Indexing System

» Multilinguality in a Text Generation System For Three Slavic Languages

» Exploiting multilingual text potentialities in EBMT systems

» Holistic Sentiment Analysis Across Languages Multilingual Supervised Latent Dirichlet Allo...

Post Info
More Details (n/a)

Added	30 Oct 2010
Updated	30 Oct 2010
Type	Conference
Year	2006
Where	DMIN
Authors	Chung-Hong Lee, Hsin-Chang Yang, Ting-Chung Chen, Sheng-Min Ma

Comments (0)

Sciweavers

Development of a Multi-Classifier Approach for Multilingual Text Categorization

DMIN 2006 | DMIN 2007 | Multiple Languages | Text Categorization | Text Categorization Methods |

Explore & Download

Productivity Tools

Sciweavers