Big Data : Faut-il passer au PaaS ?

Aujourd’hui, on considère que 7 entreprises sur 10, en France, ont déjà lancé un projet Big Data. Pour ce faire, elles ont dû s’appuyer sur une infrastructure adaptée, performante et évolutive. Ces premiers essais ont souvent obligé ces entreprises pionnières à construire de telles infrastructures soit sur des environnements propriétaires, soit sur des plateformes IaaS nues. Avec leur arrivée à maturité, les entreprises peuvent désormais se reposer sur des architectures de cloud en mode PaaS afin de gagner à la fois en efficacité et en rapidité dans leurs projets.

Les organisations sont envahies de données qui nécessitent une approche, des technologies et des compétences spécifiques pour y accéder, les consolider et les analyser. C’est le Big Data. Ainsi, l’adoption par les entreprises des pratiques du Big Data leur permet d’aller au-delà des données référentielles (ERP, CRM, etc.), d’être mieux informées et de prendre plus rapidement des décisions, avec des gains de productivité moyens de 5 à 6 %. A partir de cette base et de la notion de volume, l’entreprise va saisir l’opportunité d’exploiter la donnée via une approche analytique. 70 % des grandes entreprises et des organisations françaises ont déjà implémenté des projets Big Data ou ont lancé le processus pour le faire. Et 36,8% considèrent le déploiement d’outils analytiques et Big Data, qui forment le noyau dur du chantier de la gestion de la donnée. Comme l’a indiqué Olivier Rafal, consultant principal du cabinet PAC (CXP Group), « Les entreprises ont clairement identifié le besoin de changer leurs processus. Et la donnée demeure le vecteur numéro un de cette transformation ».

paas

Le Big Data s’épanouit dans cloud 

Si les projets de Big Data débutent généralement en local, sur l’informatique interne de l’entreprise et avec des PoC (Proof of Concept), des maquettes destinées à déployer et tester des solutions et applications, très rapidement les volumes traités et la performance recherchée placent l’entreprise à la limite des capacités du système d’information. Le cloud computing, avec ses volumes de stockage disponibles à la demande (scalabilité) et ses puissances de calcul extensibles et modulaires, est une solution pour faire face au défi du Big Data. Le cloud répond d’abord aux besoins de flexibilité et de réduction des coûts que recherchent 66 % des entreprises françaises qui passent au cloud. 60 % d’entre elles recherchent également une amélioration du time to market (ou plutôt son accélération), et le développement de produits, solutions ou démarches innovantes. Un appel à l’innovation qui est le bienvenu. C’est pourquoi le cloud est un terreau fertile pour accueillir les infrastructures Big Data, tout comme les solutions analytiques qui les accompagnent. Car si la donnée est la pépite, elle ne peut s’exprimer que dans une infrastructure ouverte aux sources des donnée – ERP, CRM, documents, emails, logs, réseaux sociaux, objets connectés, informations de géolocalisation, etc. – et qui accueille les modules et applications du système. En particulier le cœur Hadoop, indissociable du Big Data, avec son ‘file system’ générique HDFS qui autorise la reconnaissance et le traitement des formats de données, et son OS (système d’exploitation) orienté données Yarn. Tout l’enjeu pour l’entreprise est de construire l’infrastructure adéquate au lancement du projet, mais également capable d‘évoluer dans le temps, à la demande et en fonction des besoins : une mission qui convient parfaitement au cloud.

Voici quelques exemples de plateformes Big Data avec Hortonworks Hadoop, MAPR et Cloudera : on peut voir dans ces schéma le cœur d’une architecture Big Data.

Le Big Data et le cloud en option PaaS

Le PaaS, Platform-as-a-Service, est le dernier né des offres de Cloud Computing, devancé par le SaaS (Software-as-a-Service) où l’utilisateur accède à un service dans le cloud, et l’IaaS (Infrastructure-as-a-Service) où l’administrateur construit son infrastructure virtualisée qui est hébergée dans le cloud. C’est également l’offre cloud la plus disruptive, brique intermédiaire entre SaaS et IaaS, qui permet d’externaliser l’infrastructure matérielle nécessaire à l’entreprise, ainsi que les applications middleware comme le stockage, les bases de données, les couches d’intégration, les environnements de développement des applications… et les solutions Big Data. Les plateformes PaaS sont pré-configurées : l’entreprise n’a qu’à indiquer la composition matérielle dont elle a besoin, puis se concentrer sur le développement et la production d’applications. L’avantage du PaaS est très net : les plateformes ne connaissent pas de limite, qu’il s’agisse du stockage ou des capacités de calcul, et sont d’une grande élasticité, permettant l’agilité et l’adaptation à la demande aux besoins des entreprises. L’ensemble est facturé à l’usage. On peut résumer la différence entre les trois modèles de plateforme très simplement : l’IaaS est destiné aux administrateurs systèmes, le PaaS aux développeurs et le SaaS aux utilisateurs finaux.

Pour le déploiement d’une solution Big Data dans le cloud, le PaaS permet aux entreprises de démarrer en mode allégé, tout en offrant des capacités de stockage et de calcul quasi illimitées. Il est peu probable que votre entreprise atteigne ces extrêmes ! Même élastiques, les ressources ont un coût réduit, facturé à l’usage, qui ne nécessitent pas d’investissement initial. Le fournisseur a en charge l’infrastructure globale, hors du poste de travail qui y accède via Internet. L’administration, la gestion de l’hébergement, des environnements (OS), l’accès aux bases de données, aux outils de virtualisation, la gestion de la montée et de l’équilibrage des charges, les services de messagerie, tout est généralement pris en charge par le fournisseur de PaaS. Dans un monde concurrentiel qui impose de raccourcir les cycles de vie des programmes, l’association du cloud et du PaaS permet d’industrialiser les processus de création, de test, de mise en production et de maintenance des outils logiciels. Le déploiement des ressources ou leur mise à niveau ne nécessitent que quelques heures, quelques jours pour des prototypages complexes.

Les pratiques du Big Data sont également favorables au PaaS. Dans un univers digital où la DSI n’est plus le passage obligé des projets IT, le PaaS soulage les porteurs et acteurs des projets Big Data des contraintes de l’administration. Les infrastructures montées dans le nuage reposent sur des couches matérielles standard, connues et compatibles avec la plupart des applications du marché. Dans le domaine du Big Data et des analytiques, les architectures PaaS sont homologuées. Le déploiement des solutions s’exécute donc sur des plateformes déjà identifiées et qui apportent les garanties de performance et de sécurité que l’entreprise est en droit d’attendre de ses partenaires. Les analytiques reposent également sur des outils complémentaires, comme les logiciels de visualisation de la donnée et de son traitement, qui sont également homologués à la fois pour les infrastructures de cloud public et les solutions de Big Data. Très rapidement, le développement des analytiques devient une affaire de développeurs et de data scientists. Pour lesquels dans le cloud, la plateforme Big Data demeure accessible en permanence et en temps réel via le réseau.

paas2

L’entreprise doit faire face à la complexité du Big Data et des analytiques. L’adoption d’une plateforme en PaaS soulage les équipes des aspects matériels et logiciels des projets, et leur permet de se concentrer sur ce qui est essentiel, le développement des solutions innovantes qui vont accompagner la prise de décision et apporter plus de rentabilité.

Big Data et PaaS, le mariage de raison

Dans les pays du nord de l’Europe, 92 % des responsables IT sont persuadés que la valeur acquise par le Big Data va donner un avantage compétitif à leur entreprise. Les décideurs IT français, fidèles à leur habitude, sont plus en retrait. Mais tout le monde est d’accord pour affirmer que le Big Data est incontournable. Reste à régler la question d’un déploiement mesuré et contrôlé des plateformes qui supportent le Big Data et les analytiques, accessibles aux développeurs. Quand vient le temps de choisir une plateforme pour accueillir le Big Data, la consommation de cette plateforme selon un modèle de service PaaS prend tout son sens.

Partager :
Partager sur Twitter
Partager sur LinkedIn
Partager par email

Les commentaires sont fermés.