Sciweavers

Free Online Productivity Tools i2Speak i2Symbol i2OCR iTex2Img iWeb2Print iWeb2Shot i2Type iPdf2Split iPdf2Merge i2Bopomofo i2Arabic i2Style i2Image i2PDF iLatex2Rtf Sci2ools

134

Voted

EMNLP
2009

152views Natural Language Processing» more EMNLP 2009»

Improved Statistical Machine Translation Using Monolingually-Derived Paraphrases

15 years 16 days ago

Improved Statistical Machine Translation Using Monolingually-Derived Paraphrases

Download www.cs.jhu.edu

Untranslated words still constitute a major problem for Statistical Machine Translation (SMT), and current SMT systems are limited by the quantity of parallel training texts. Augmenting the training data with paraphrases generated by pivoting through other languages alleviates this problem, especially for the so-called "low density" languages. But pivoting requires additional parallel texts. We address this problem by deriving paraphrases monolingually, using distributional semantic similarity measures, thus providing access to larger training resources, such as comparable and unrelated monolingual corpora. We present what is to our knowledge the first successful integration of a collocational approach to untranslated words with an end-to-end, state of the art SMT system demonstrating significant translation improvements in a low-resource setting.

Yuval Marton, Chris Callison-Burch, Philip Resnik

Real-time Traffic

Current Smt Systems | EMNLP 2009 | Natural Language Processing | Unrelated Monolingual Corpora | Untranslated Words |

claim paper

Related Content

» Improved Statistical Machine Translation Using Monolingual Paraphrases

» Combining Multiple Resources to Improve SMTbased Paraphrasing Model

» ExampleBased Paraphrasing for Improved PhraseBased Statistical Machine Translation

» Paraphrase Lattice for Statistical Machine Translation

» Statistical Machine Translation for Query Expansion in Answer Retrieval

» Dynamic Translation Memory Using Statistical Machine Translation to Improve Translation Me...

» Improving Translation via Targeted Paraphrasing

» Reevaluating Machine Translation Results with Paraphrase Support

» Translation Model Pruning via Usage Statistics for Statistical Machine Translation

Post Info
More Details (n/a)

Added	17 Feb 2011
Updated	17 Feb 2011
Type	Journal
Year	2009
Where	EMNLP
Authors	Yuval Marton, Chris Callison-Burch, Philip Resnik

Comments (0)