Nipdev 17 – Une introduction au Machine Learning avec Vincent Heuschling

Podcast: Téléchargement

Dans ce numéro,  Vincent Heuschling nous parle de Machine Learning et nous en décrit les principes de base.

Contenu

  1. Qu’est ce que le Machine Learning

    1. Différence ML et stats (descriptives, Inférences, Bayes)

    2. Data driven décision, dépasser le cadre de la Business Intelligence traditionnelle

    3. pourquoi c’est Indispensable qd on a beaucoup de données

  1. A quoi ça sert (rapidement)

    1. Web – Personnalisation

    2. Web – Recommandation
      à lire :
      http://www.mapr.com/practical-machine-learning
      à ecouter : http://www.podcastscience.fm/dossiers/2012/04/25/les-algorithmes-de-recommandation/

    3. Modèles prédictifs

    4. Segmentation marketing

  2. Comment ça marche

    1. Différences entre Supervisé et Non-supervisé

    2. Classification

    3. Regression

    4. Similarité (recommenders)

    5. Clustering

    6. Co-occurence

    7. Prédictions

    8. Overfitting

  3. Panorama des outils disponibles :

    1. R avec Rstudio  => l’option du statisticien, c’est pas à la base un outil de développeur. Facile à prendre en main, avec un bel environnement de travail

    2. Python / Scikitlearn  => l’option du développeur, orienté sur la construction d’applications

    3. Hadoop / Mahout => La scalabilité infinie par le Map-Reduce

    4. Spark (in-memory bigdata en scala, python et R, avec la bibliothèque MLLib ) => Les très hautes performances…

    5. Les librairies Scala dédiées au ML et à l’analyse métier http://www.scalanlp.org/

    6. Davavisualisation: http://d3js.org/

  4. R

    1. Scripté

    2. Pas dans la JVM (important qd on travaille dans un contexte bigdata / hadoop)

    3. RStudio

    4. Très performant sur la manipulation de vecteurs, de matrices <= tout est matrice en ML

    5. Un très grand nombre de bibliothèques techniques et ‘métier’ (la richesse majeure de R).

    6. Outils pour la datavisualisation.

    7. Des app web avec Shiny. 

    8. Une façon fun de découvrir R: https://www.datacamp.com/

    9. Le pb de la scalabilité et des traitements distribués

Conférences sur le sujet:

  • O’Reilly Strata (http://strata.oreilly.com/)

Une réflexion au sujet de « Nipdev 17 – Une introduction au Machine Learning avec Vincent Heuschling »

Laisser un commentaire