NAVER LABS Europe

Comprendre des données visuelles à grande échelle (Understanding Big Visual Data)   

ceci est la page du cours de 2017/2018. Nouveau site créé pour le cours 2018/2019 disponible en suivant ce lien

Cours ENSIMAG 2017/2018 -  5MMDVGE7 - Filière MMIS

Présentation du cours :

Les données multimédia dans toutes leurs formes (photos, vidéos, et musique) se sont imposées depuis plusieurs dizaines d’années dans nos vies. Leur impact s’est renforcé avec l’expansion rapide d’internet, et des réseaux sociaux en particulier. À titre d’exemple, 300 heures de vidéo sont envoyées sur YouTube chaque minute. On estime que ce déluge de données va s’accélérer pendant les prochaines années, et qu’en 2020, 80% du trafic internet sera composé de données visuelles. Dans ce contexte, la gestion des données multimédia devient plus importante que jamais. Ce cours propose une introduction aux techniques qui permettent de gérer ces bases de données et de résoudre les différents problèmes liés à l’accès à ces données.

Ce cours est donné par deux chercheurs qui travaillent dans les domaines de la vision par ordinateur et de l’apprentissage automatique, à Inria Grenoble (Karteek Alahari), et au centre de recherche européen de NAVER LABS (Diane Larlus). Les deux enseignants contribueront de leur expertise en recherche académique mais aussi industrielle lors de la présentation de ce cours. Ils présenteront des applications concrètes ainsi que les tous derniers développements dans les sujets suivants : la recherche d’image et de vidéo, la reconnaissance d’objet à grande échelle, la reconnaissance d’action, ainsi que les problèmes de vision par ordinateur liés aux données massives (« big data »).

----------------------

Planning et support de cours 

Note: les supports de cours sont susceptibles de changer jusqu’au tout dernier moment, et seront mis à jour juste après chaque cours. 

07/12/17, 08:15 – 11 :15, ENSIMAG H 2016  -  Introduction, contexte et applications, évaluation
Support de cours pour l’impression:  Download cours1.pdf (5.2 MB)

14/12/17, 08:15 – 11 :15, ENSIMAG H 2016 - Représentation des images: introduction et représentations locales 
   + présentation de l'article de Viola & Jones
Support de cours pour l’impression: Download cours2_for_print.pdf (3.2 MB)

21/12/17, 08:15 – 11 :15, ENSIMAG H 2016 - Représentation des images: représentations globales
   + présentation de l'article de Dalal & Triggs
Support de cours pour l’impression: Download cours3_for_print.pdf (2.8 MB)

11/01/18, 08:15 – 11 :15, ENSIMAG H 2016 - Représentation des images: réseaux de neurones
   + présentation de l'article de Lazebnik et al
Support de cours pour l’impression: cours4

18/01/18, 08:15 – 11 :15, ENSIMAG H 2016 - Reseau de neurones, classification, representation des videos
   + présentation de l'article de Krizhevsky et al
Support de cours pour l’impression: cours5

25/01/18, 08:15 – 11 :15, ENSIMAG H 2016 - Méthodes Avancées
   + présentation de l'article de Redmon et al
Support de cours pour l’impression: cours6

 

Examens des années précédentes: PDF

----------------------

Présentation d’articles de recherche

Liste des articles:

  • Deuxième cours: Rapid object detection using a boosted cascade of simple features (PDF)
    P. Viola ; M. Jones
    Computer Vision and Pattern Recognition (CVPR), 2001
  • Troisième cours: Histograms of oriented gradients for human detection (PDF)
    Navneet Dalal and Bill Triggs
    Computer Vision and Pattern Recognition (CVPR), 2005.
  • Quatrième cours: Beyond Bags of Features: Spatial Pyramid Matching for Recognizing Natural Scene Categories (PDF)
    S. Lazebnik ; C. Schmid ; J. Ponce
    Computer Vision and Pattern Recognition (CVPR), 2006
  • Cinquième cours: ImageNet Classification with Deep Convolutional Neural Networks (PDF)
    Alex Krizhevsky, Ilya Sutskever, Geoffrey E. Hinton
    Neural Information Processing Systems (NIPS), 2012
  • Sixième cours: You Only Look Once: Unified, Real-Time Object Detection (PDF
    Joseph Redmon ; Santosh Divvala ; Ross Girshick ; Ali Farhadi
    Computer Vision and Pattern Recognition (CVPR), 2016

----------------------

Evaluation du cours

  • Examen final écrit: 80%
  • Quizz sur les articles: 20% (4% par quizz)
  • Présentation bonus: 5 points max (2 personnes par papier max)