Analyse du contenu vidéo par apprentissage actif

Topic outline

  • Section publique

    Thèse doctorat 2007 FR

    Catégorie : Traitement de l'image et du signal

    Universidade federal de Minas Gerais (Cergy-Pontoise, Val d'Oise)

    Mots clés : segmentation vidéoarecherche par le contenuaanalyse de contenu vidéoadétection de plansavideo segmentationacontent-based retrievalavideo content analysisashot boundary detection,

    Auteur : Guillermo CÂamara ChÂavez

    Directeur de thèse : sous la direction de Sylvie Philipp-Foliguet

    Résumé : L objet de cette thèse est de proposer un système d indexation semi-automatique et de recherche interactive pour la vidéo. Nous avons développé un algorithme de détection des plans automatique sans paramètre, ni seuil. Nous avons choisi un classifieur SVM pour sa capacité à traiter des caractéristiques de grandes dimensions tout en préservant des garanties de généralisation pour peu d exemples d apprentissage. Nous avons étudié plusieurs combinaisons de caractéristiques et de fonctions noyaux et présenté des résultats intéressants pour la tâche de détection de plan de TRECVID 2006. Nous avons proposé un système interactif de recherche de contenu vidéo : RETINVID, qui permet de réduire le nombre d images à annoter par l utilisateur. Ces images sont sélectionnées pour leur capacité à accroître la connaissance sur les données. Nous avons effectué de nombreuses simulations sur les données de la tâche de concepts haut-niveaux de TRECVID 2005.

    Résumé : This thesis presents work towards a unified framework for semi-automated video indexing and interactive retrieval. To create an efficient index, a set of representative key frames are selected from the entire video content. We developed an automatic shot boundary detection algorithm to get rid of parameters and thresholds. We adopted a SVM classifier due to its ability to use very high dimensional feature spaces while at the same time keeping strong generalization guarantees from few training examples. We deeply evaluated the combination of features and kernels and present interesting results obtained, for shot extraction TRECVID 2006 Task. We then propose an interactive video retrieval system: RETINVID, to significantly reduce the number of key frames annotated by the user. The key frames are selected based on their ability to increase the knowledge of the data. We perform an experiment against the 2005 TRECVID benchmark for high-level task.

    • Section à accès restreint (connexion obligatoire)

      Not available unless: Your Surname is not empty
    Skip Thesis Finder

    Thesis Finder