CMO LEADERS

Data lake : pourquoi est-il indispensable de migrer ses infrastructures dans le cloud ?

5 min
CMO LEADERS
temps de visionnage :
5 min

Data lake : pourquoi est-il indispensable de migrer ses infrastructures dans le cloud ?

Ecouter cet article
Partager cet article
No items found.
No items found.
No items found.
En partenariat avec
À mesure qu’elles sont amenées à interagir avec de plus en plus de données, les entreprises cherchent à faire évoluer leurs infrastructures technologiques. De fait, les solutions cloud s’avèrent fortement plébiscitées sur le sujet. Daniel Snook et Hervé Mignot, respectivement Directeur Data Technologies et Directeur Associé Data Science, Technologie et R&D d’Equancy, font le point sur ce type d’infrastructures et sur les avantages qu’elles proposent.

HUB Institute : Quels sont les avantages à adopter les logiques dites d’ “infrastructure as code” ?

Daniel Snook : Lorsque j’ai démarré sur le cloud, j’utilisais la console web pour construire mes infrastructures. Aujourd'hui, ce temps est révolu ! Désormais, la quasi-totalité des déploiements s'effectue dans une mouvance DevOps qu'on appelle "infrastructure as code". Cela signifie que l'implémentation technique de l'infrastructure cloud est décrite par du code. Ce code est ensuite exécuté par un interpréteur chargé de traduire ces lignes de codes par la création de ressources cloud. Par exemple : un serveur virtuel, une base de données, des règles de firewall ou n'importe quel service managé...I l y a essentiellement 3 avantages à adopter l’infrastructure as code :

  1. Le premier est d’accélérer les déploiements.
  2. Le second de permettre le versionning de son architecture. 
  3. Et enfin le troisième, de faciliter les déploiements.

HUB Institute : Quelle est votre démarche dans le déploiement des infrastructures type data lake ?

Hervé Mignot : Nous avons développé une expertise et des assets techniques qui nous permettent de déployer très rapidement, de l’ordre de quelques mois, des data lake fonctionnels c'est-à-dire avec des cas d’usages qui fonctionnent en production et qui sont mis à disposition du métier. Pour faire cela, nous nous appuyons sur les services managés proposés par les fournisseurs de cloud. Il s’agit de briques techniques exploitées par les équipes du fournisseur, il y a donc beaucoup de bénéfices à exploiter ce type de service. Les avantages sont multiples :

  • Peu ou pas de charges d’administration technique de notre côté ou dans les équipes du client.
  • Une fiabilité accrue, puisque les services sont mis au point et développés par les équipes du fournisseur.
  • Une grande facilité pour étendre les capacités de la plateforme en cas de besoin.

À lire également : "Les 4P d’une transformation data réussie selon Equancy"

HUB Institute : Equancy s’appuie sur de nombreuses briques d’open source. Pourquoi?

Nous utilisons beaucoup de briques open source dans nos projets, en convergence avec les stratégies des éditeurs de services cloud. Eux-mêmes s’appuient sur ces briques open sources, les packagent et en font des services gérés par eux même ce qui permet d’avoir à disposition des briques réutilisables s’appuyant sur des technologies reconnues pour le stockage, l’ordonnancement des traitements, etc… C’est une stratégie intéressante qui apporte de nombreux avantages :

  • Éviter un effet “vendor lock in”, c'est-à-dire d’être verrouillé auprès d’un unique vendeur dont la solution ne répondrait pas à tous les besoins.
  • Assurer l’attractivité du projet, en s’assurant que les collaborateurs ne se spécialisent pas sur une solution qu’ils ne trouveront pas ailleurs.
  • Profiter d’une communauté de référence importante, ancrée dans la culture du partage, permettant de trouver diverses ressources pour exploiter au mieux la solution.

HUB Institute : Comment assurez-vous le passage à l’échelle des cas d’usage?

DS: Pendant longtemps, les plateformes data, type data lake ne dépassaient pas le stade du PoC. Les principales raisons sont d’abord des intervenants techniques qui travaillent en mode couteau suisse. Et ensuite, la prise en compte des sujets de mise en production qui arrive souvent en fin de course, voire sans même avoir sensibilisé tous les acteurs en avance de phase. L'industrialisation des cas d'usage est essentiellement portée par 2 enjeux :

  1. Le premier est de permettre à chaque intervenant de se focaliser sur son expertise sans être brouillé par des considérations techniques hors de son périmètre de responsabilité. Par exemple, le data scientist se concentre sur son algorithme, le data engineer sur ses pipelines de données, ou encore le développeur sur ses interfaces de restitution. En résumé, il s'agit de tirer l'excellence de chacun, et aucun d'eux ne devrait se poser des questions du type "Au fait, comment va-t-on faire pour qu'on passe en production la bonne version de mon application ?"
  2. Le second enjeu est d'automatiser le déploiement, pour assurer des mises en production rapides et sans oubli.

Sur un sujet similaire : "Nébuleuse MarTech : comment sortir du brouillard ?"

De ce constat, notre vision a été de développer grâce aux services cloud ce que nous appelons une usine à cas d'usage. Ce framework repose sur le principe de containerisation associé à des workflows d'intégration et de déploiement continu. Il a la vertu, par le biais de quelques lignes de configuration, de permettre très simplement d'embarquer au sein du data lake des nouveaux cas d'usage. Et cerise sur le gâteau : quel que soit le langage de programmation utilisé, puisque la technologie de conteneurisation permet cette abstraction.

HUB Institute : Pourquoi est-il grand temps de migrer vos infrastructures data sur le cloud ?

HM: Autres bénéfices de déployer des architectures data cloud : la montée en puissance, la scalabilité et également l’économie de coût potentiel. Dans sa conception, le cloud permet de bénéficier de ressources quasi illimitées. En effet, les fournisseurs cloud proposent des formules “à la demande” qui permettent aux utilisateurs d’avoir recours à des ressources supplémentaires en fonction de leurs besoins de stockage, de calculs, etc… 

Autre point : la facturation se fait à l’usage. On ne subit pas les investissements que le fournisseur cloud fait ou que notre client serait obligé de faire s’il devait mettre en place cette infrastructure. D’ailleurs, du fait de ce modèle de tarification et de mise à disposition des ressources à la demande, nos clients sont surpris de la diminution que cela représente à la vue des budgets d’exploitation de ce type de plateforme. Par rapport aux coûts qu’ils investissent dans des infrastructures locales ou bien hébergées chez un fournisseur, il n’est pas rare que l’on annonce des réductions de budgets de l’ordre de x10. C’est l’effet mécanique de cet usage, de ce paiement à la demande.

L'événement à ne pas manquer : "HUBDAY Data & AI for Business"

Newsletters du HUB Institute