On peut distinguer 3 niveaux du métier d’Analyste des données des systèmes d’Information d’une entreprise :
- Data Ingénieur : Récupérer, Structurer, Rationnaliser, Créer et Actualiser les entrepôts de données décisionnelles (DWH : Data Ware House, Data Lake) provenant des différentes sources internes ou externes à l’activité de l’Entreprise.
Le Data ingénieurs est responsable de l’actualisation et de la synchronicité des données.
Le Data ingénieurs maitrise l’exploration des différents types de Base de données : SQL/NoSQL, Hiérarchiques, Relationnelles, Orientées Objet, Réseau et Graphe, Séquentielles, etc. - Data Analyste : Appréhender et analyser les données pour les mettre à disposition des métiers soit sous forme brute ou au travers d’Indicateurs précalculés clés de la performance d’un Système d’Information (KPI). Il prépare les Dimensions et les Mesures d’analyse.
Le Data Analyste maitrise les différentes applications de manipulation et de présentation des données : Calculs statistiques et ensemblistes, Dimensions et Mesures Graphiques
Il nettoie et analyse des jeux de données. - Data Scientist : Mettre en place des prévisions ou projections pertinentes et des veilles relatives aux tendances d’évolution et aux conséquences des décisions prises.
La Data scientist maîtrise : l’entrainement des réseaux de neurones profonds, le Datamining, le Machine Learning, le Deep Learning et il est capable d’élaborer ou de paramétrer des formules complexes. Il est spécialisé dans les algorithmes d’apprentissage automatiques, permettant de traiter des données volumineuses et de différentes natures.
Il pourra mener des projets de recherche et réaliser des preuves de concept (POC)
Le Data Analyste doit répondre à de nombreuses missions :
Collecter et fiabiliser des données :
- Connaitre les Sources de données et les données de références pour les unifier et fournir un Modèle métier synchrone (MDM : Master Data Management)
- Identifier des sources d’informations fiables et pertinentes
- Collecter, agréger et nettoyer des données en vue de réaliser un Référentiel unifiée des données de l’entreprise
- Effectuer des opérations de nettoyage sur des données structurées
- Prétraiter des données texte pour obtenir un jeu de données exploitable
- Etablir les descriptifs des données de référence de l’entreprise
- Dénoncer les désynchronisations et les aberrations des données (formats, types, incohérences, incompatibilités)
- Fournir des données de confiance pour garantir la pertinence des Dimensions et des Mesures
- Déployer des modèles via des API dans le Web
- Concevoir des architectures Big Data
Recueillir des Besoins et problématiques métier et Calcul d’Indicateurs clés
- Traduire les besoins métier en des problématiques d’analyse de données
- Identifier les méthodes « état de l’art » pour résoudre un besoin d’indicateur
- Analyser un besoin métier pour formuler des questions analytiques
- Utiliser les outils du cloud
- Mettre en place un environnement Big Data
- Manipuler des données dans un environnement Big Data
- Définir les Dimensions et les Mesures d’analyse à mettre à disposition
- Rédiger une note méthodologique afin de communiquer sa démarche de modélisation
- Développer une preuve de concept pour résoudre un besoin d’indicateur
- Analyser les Process métier en vue d’améliorer la stratégie de l’entreprise
- Réaliser des Modélisations de données
- Segmenter, classifier ou scorer l’audience marketing et les résultats financiers
- Mesurer l’Activités externes et internes impactant le Système d’Information
Communiquer l’Etat du Parc et e l’activité de l’Entreprise
- Interroger une base de données statistiques pour répondre à des questions business
- Opérer des classifications automatiques pour partitionner les données
- Mettre en œuvre des techniques de réduction de dimension
- Réaliser des Tableaux de bord avec graphiques et indicateurs répondant à des questions analytiques de suivi de l’activité et d’analyse des résultats
- Communiquer les résultats à des spécialistes ou des néophytes à l’aide de représentations graphiques lisibles et pertinentes
- Générer des graphiques adaptés aux types de données
- Représenter graphiquement des données à grandes dimensions
- Synthétiser des résultats à destination d’un client
- Effectuer une analyse statistique univariée ou multivariée
- Réaliser une analyse prédictive
- Utiliser des modèles de régression linéaire, de régression logistique (Machine Learning)
- Réalisez des calculs distribués sur des données massives
Le Data Analyste maîtrise les Environnements de Bases de données, les Librairies et le langage Python, Jupyter Notebook, R, Rstudio, MySQL, PostgreSQL, ORACLE, SQL Server, SQL, MongoDB, Elasticsearch, KNIME, Qlik, Tableau, Power BI, Pandas, NumPy, Matplotlib, Seaborn, etc…