High-Level Feature Extraction Using SIFT GMMs and Audio Models

15 years 6 months ago

Download www.furui.cs.titech.ac.jp

—We propose a statistical framework for high-level feature extraction that uses SIFT Gaussian mixture models (GMMs) and audio models. SIFT features were extracted from all the image frames and modeled by a GMM. In addition, we used mel-frequency cepstral coefﬁcients and ergodic hidden Markov models to detect high-level features in audio streams. The best result obtained by using SIFT GMMs in terms of mean average precision on the TRECVID 2009 corpus was 0.150 and was improved to 0.164 by using audio information.

Nakamasa Inoue, Tatsuhiko Saito, Koichi Shinoda, S

Real-time Traffic

Computer Vision | Hidden Markov Models | ICPR 2010 | Mel-frequency Cepstral Coefﬁcients | SIFT Gaussian Mixture |

claim paper

» Eurecom at TRECVid 2007 Extraction of Highlevel Features

» Audiovisual sports highlights extraction using Coupled Hidden Markov Models

» Databionic Visualization of Music Collections According to Perceptual Distance

» Automatic extraction of music descriptors from acoustic signals

Post Info
More Details (n/a)

Added	07 Dec 2010
Updated	07 Dec 2010
Type	Conference
Year	2010
Where	ICPR
Authors	Nakamasa Inoue, Tatsuhiko Saito, Koichi Shinoda, Sadaoki Furui

Comments (0)

Sciweavers

High-Level Feature Extraction Using SIFT GMMs and Audio Models

Computer Vision | Hidden Markov Models | ICPR 2010 | Mel-frequency Cepstral Coefﬁcients | SIFT Gaussian Mixture |

Explore & Download

Productivity Tools

Sciweavers