+ - 0:00:00
Notes for current slide
Notes for next slide

Ressources Python pour s’autoformer sur le SSPCloud

Onyxia ScaleUp

Lino Galiana

Insee

11 mars 2022

1 / 11

Présentation catalogue

Catalogue (1/2)

1. Modules d'autoformation sur sspcloud.fr/documentation;

  • Notebooks pédagogiques, différents niveaux accessibles
  • Environnements normalisés: pas de problèmes d'installation de packages
  • Formation aux bonnes pratiques: modularité, contrôle de version, stockage séparé du code
2 / 11

Présentation catalogue

Catalogue (1/2)

1. Modules d'autoformation sur sspcloud.fr/documentation;

  • Notebooks pédagogiques, différents niveaux accessibles
  • Environnements normalisés: pas de problèmes d'installation de packages
  • Formation aux bonnes pratiques: modularité, contrôle de version, stockage séparé du code

2. Ressources Python (et Git ):

2 / 11

Présentation catalogue

Catalogue (2/2)

3. Ressources R (et Git ):

  • Formations sur des points plus spécifiques. ex: Travail collaboratif avec R
  • utilitR: environnement normalisés pour tester les exemples de la documentation
  • Autres ressources R ou Python
3 / 11

Ressources : cours de l'ENSAE

https://linogaliana-teaching.netlify.app/ (dépôt )

Un parcours complet pour la data-science :

  • Manipulation et structuration de données ;
  • Visualisation ;
  • Modélisation (économétrie et machine learning) ;
  • Données textuelles (NLP) ;
  • Git et Github .

Les notebooks sont ici

4 / 11

Ressources : cours de l'ENSAE

https://linogaliana-teaching.netlify.app/ (dépôt )

Introduire à la philosophie de la data-science :

  • Reproductibilité et pérennité des projets
  • Versioning et partage des codes
  • Réduction des coûts de mise en prod

5 / 11

Ressources : cours de l'ENSAE

https://linogaliana-teaching.netlify.app/ (dépôt )

Introduire à la philosophie de la data-science :

  • Reproductibilité et pérennité des projets
  • Versioning et partage des codes
  • Réduction des coûts de mise en prod

Mise à disposition tutoriels et exercices facilitée:

5 / 11

Comment déployer sur le SSPCloud ?

Pourquoi ?

  • Des notebooks sont disponibles sur Github
    (exemple)
6 / 11

Comment déployer sur le SSPCloud ?

Pourquoi ?

  • Des notebooks sont disponibles sur Github
    (exemple)
  • Objectifs:
    • permettre aux personnes intéressées de tester les exemples/exercices dans un environnment Jupyter
    • contrôler l'environnement d'exécution pour éviter les problèmes d'installation
6 / 11

Comment déployer sur le SSPCloud ?

Pourquoi ?

  • Des notebooks sont disponibles sur Github
    (exemple)
  • Objectifs:
    • permettre aux personnes intéressées de tester les exemples/exercices dans un environnment Jupyter
    • contrôler l'environnement d'exécution pour éviter les problèmes d'installation
  • Solution: déploiement automatique sur le SSPCloud
6 / 11

Comment déployer sur le SSPCloud

Avantages

  • Pour les formés:
    • Pas d'installation d'Anaconda, Jupyter, modules Python sur Windows, etc.
    • Très simple d'usage : un click et on a un notebook opérationnel
7 / 11

Comment déployer sur le SSPCloud

Avantages

  • Pour les formés:
    • Pas d'installation d'Anaconda, Jupyter, modules Python sur Windows, etc.
    • Très simple d'usage : un click et on a un notebook opérationnel
  • Pour les formateurs:
    • Plus à gérer plusieurs configurations ou des spécificités propres à chaque OS ou poste de travail
    • Possibilité d'associer ça à l'intégration continue pour tester la reproductibilité
7 / 11

Comment déployer sur le SSPCloud

Avantages

  • Pour les formés:
    • Pas d'installation d'Anaconda, Jupyter, modules Python sur Windows, etc.
    • Très simple d'usage : un click et on a un notebook opérationnel
  • Pour les formateurs:
    • Plus à gérer plusieurs configurations ou des spécificités propres à chaque OS ou poste de travail
    • Possibilité d'associer ça à l'intégration continue pour tester la reproductibilité
  • Challenge:
    • Mise en place assez exigeante initialement...
    • ... mais gains de confort rapidement
7 / 11

Comment déployer sur le SSPCloud ?

Contrôler la portabilité de sa formation (1/2)

  • L'idéal est que les formés aient un environnement prêt à l'emploi:
    • Un environnement de développement avec des modules adéquats (auto-complétion, Gitlens...)
    • Pas de dépendance à installer..
    • ... ou installation facile de celles-ci
8 / 11

Comment déployer sur le SSPCloud ?

Contrôler la portabilité de sa formation (1/2)

  • L'idéal est que les formés aient un environnement prêt à l'emploi:

    • Un environnement de développement avec des modules adéquats (auto-complétion, Gitlens...)
    • Pas de dépendance à installer..
    • ... ou installation facile de celles-ci
  • Pour les formés, possibilité de sauvegarder les codes avec Git (formation aux bonnes pratiques par l'usage)

8 / 11

Comment déployer sur le SSPCloud ?

Contrôler la portabilité de sa formation (2/2)



  • Construire une image Docker qui contient les éléments minimaux pour pouvoir démarrer :
    • Exemple Python : un environnement Anaconda prêt à l'emploi ;
    • Exemple R : dépendances listées (ou préinstallées) dans un fichier Description
9 / 11

Comment déployer sur le SSPCloud ?

Contrôler la portabilité de sa formation (2/2)



  • Construire une image Docker qui contient les éléments minimaux pour pouvoir démarrer :

    • Exemple Python : un environnement Anaconda prêt à l'emploi ;
    • Exemple R : dépendances listées (ou préinstallées) dans un fichier Description
  • Chaque commit sur Github permet de mettre à jour les notebooks disponibles dans le catalogue

9 / 11

Comment déployer sur le SSPCloud ?

Mettre à disposition sa formation

  • Créer un script init.sh pour, quand l'image est active, automatiquement :
  1. Clôner le dépôt / télécharger les fichiers d'intérêt
  2. Définir les fichiers à ouvrir automatiquement
10 / 11

Comment déployer sur le SSPCloud ?

Mettre à disposition sa formation

  • Créer un script init.sh pour, quand l'image est active, automatiquement :
  1. Clôner le dépôt / télécharger les fichiers d'intérêt
  2. Définir les fichiers à ouvrir automatiquement
10 / 11

Retour d'expérience de l'ENSAE



  • Plus à galérer entre les étudiants utilisant les postes de l'ENSAE et ceux ayant leur propre ordinateur ;
  • Installation des modules très pratique (merci Linux !) ;
  • Beaucoup de ressources RAM et CPU sur SSPCloud (vs réseau ENSAE) ;
  • Formation à Git par l'usage
11 / 11

Présentation catalogue

Catalogue (1/2)

1. Modules d'autoformation sur sspcloud.fr/documentation;

  • Notebooks pédagogiques, différents niveaux accessibles
  • Environnements normalisés: pas de problèmes d'installation de packages
  • Formation aux bonnes pratiques: modularité, contrôle de version, stockage séparé du code
2 / 11
Paused

Help

Keyboard shortcuts

, , Pg Up, k Go to previous slide
, , Pg Dn, Space, j Go to next slide
Home Go to first slide
End Go to last slide
Number + Return Go to specific slide
b / m / f Toggle blackout / mirrored / fullscreen mode
c Clone slideshow
p Toggle presenter mode
t Restart the presentation timer
?, h Toggle this help
Esc Back to slideshow