Large margin estimation of n-gram language models for speech recognition via linear programming

14 years 7 months ago

Download www.cse.yorku.ca

We present a novel discriminative training algorithm for n-gram language models for use in large vocabulary continuous speech recognition. The algorithm uses large margin estimation (LME) to build an objective function for maximizing the minimum margin between correct transcriptions and their competing hypotheses, which are encoded as word graphs generated from the Viterbi decoding process. The nonlinear LME objective function is approximated by a linear EM-style auxiliary function that leads to a linear programing problem, which is efﬁciently solved by convex optimization algorithms. Experimental results have shown that the proposed discriminative training method can outperform the conventional discounting-based maximum likelihood estimation methods. A relative reduction in word error rate of over 2.5% has been observed on the SPINE1 speech recognition task.

Vladimir Magdin, Hui Jiang

Real-time Traffic

Discriminative Training | Discriminative Training Algorithm | ICASSP 2010 | Signal Processing | Speech Recognition |

claim paper

Added	06 Dec 2010
Updated	06 Dec 2010
Type	Conference
Year	2010
Where	ICASSP
Authors	Vladimir Magdin, Hui Jiang

Sciweavers

Large margin estimation of n-gram language models for speech recognition via linear programming

Discriminative Training | Discriminative Training Algorithm | ICASSP 2010 | Signal Processing | Speech Recognition |

Explore & Download

Productivity Tools

Document Tools

Image Tools

Sciweavers