Objectifs de la formation

Approfondir les outils permettant de représenter et manipuler des données complexes, utiliser efficacement la librairie pandas, importer des sources de données (CSV, JSON, XML, SQL), réaliser un modèle de régression linéaire simple ou multiple avec la librairie statmodels, perfectionner ses connaissances de matplotlib et savoir utiliser seaborn ou plotly.

Infos pratiques

Dates inter-entreprises

20 et 21 avril 2020

}

Durée de la formation

2 journées soit 14h

Niveau de la formation

Intermédiaire

Nombre de participants

1 à 8 personnes - conseillé

Pré-requis

Avoir suivi Outils de base, Python ou niveau équivalent

Formateur

Non renseigné

Tarif

1095€ HT

Le programme

JOUR 1

Les traitements avancés des données :

  • La librairie numpy :
    • Les fonctions avancées (views, slices)
    • L’interface avec scipy
  • La librairie pandas :
    • L’importation de sources de données externes
    • L’agrégation de données
    • Le reshaping
    • L’indexation,
    • La fusion de sources de données
  • La librairie statmodels :
    • La régression simple et multiple
    • Les tests des coefficients de régression
    • Le diagnostic du modèle
    • La prédiction ponctuelle et par intervalle
  • Le traitement des chaînes de caractères, regex
  • Le traitement des dates et gestion des séries chronologiques

JOUR 2

  • Les générateurs, itertools, lazy evaluation
  • L’interface base de données (SQL, NoSQL)
  • Le package Seaborn : les fonctionnalités graphiques avancées (graphiques en trellis, distributions statistiques, heatmap)
  • Les graphiques interactifs avec le package Bokeh et Plotly

En savoir plus

Cette formation comprend

  • Supports de cours numériques
  • Audit et formation avec vos données
  • Formation métier adaptée
  • Animation par un expert
  • SAV illimité par email d’un an

Démarrez votre projet !

RITME

72 rue des archives
75003, PARIS

Par téléphone

+33 (0)1 42 46 42 10

Courriel

datasolutions@ritme.com