12 janvier 2020

Prédictions de Scality pour 2020

Object storage is the new primary data storage

Le stockage d’objets en périphérie se fera sur un support Flash 

Le stockage d’objets va se déplacer vers la périphérie pour les applications qui capturent de vastes flux de données depuis une multitude d’appareils mobiles, IdO et autres dispositifs connectés. Ceci inclura les flux d’évènements et les journaux, les données provenant de capteurs et d’appareils, les données émises par les véhicules, les données médias sous forme d’images et de vidéos et bien plus encore, le tout avec des débits de données élevés et une forte collatéralité de multiples flux simultanés. Ces applications seront développées pour un déploiement Cloud natif, et devront donc naturellement adopter les protocoles de stockage d’objets RESTful, ce qui fait de la technologie flash le choix par excellence pour le stockage d’objets en périphérie et la prise en charge de cette classe émergente d’applications articulées autour des données. 

 

  1. L’unification multicloud

Au fur et à mesure que les entreprises se tournent vers des solutions associant ressources IT en interne et sur le Cloud public, le stockage de données sera décentralisé à grande échelle. Une telle décentralisation créera le besoin pour un espace de noms et un niveau de contrôle unifiés afin de simplifier la visibilité et l’accès aux données. De plus, les entreprises utiliseront une multitude de Clouds publics, chacun sélectionné pour répondre à des besoins d’activité spécifiques, entraînant par la même occasion un problème de gestion des données multicloud. En choisissant de déployer leurs ressources IT « à proximité » des appareils périphériques qu’elles utilisent, les entreprises viendront renforcer cette décentralisation avec l’informatique en périphérie. Toutes ces tendances donneront naissance à un cas de figure inédit et extrême de « silos de données Cloud » qui pourra uniquement être géré par des solutions offrant une visibilité globale des données à tous les niveaux de ces Clouds et centres de données distribués. 

 

  1. La transformation numérique et les protocoles multiples 

Les systèmes multi-protocoles seront adoptés lors de la transformation numérique : les clients faisant la transition depuis des applications patrimoniales vers des applications Cloud natives continueront à utiliser les protocoles RESTful comme mécanisme de base pour accéder à leurs services et systèmes de stockage de données. Les systèmes multi-protocoles (les protocoles patrimoniaux tels que NFS et SMB pour l’accès aux fichiers, ainsi que les nouvelles API RESTful telles que AWS S3 et Azure Blob Storage pour l’accès aux objets) seront adoptés pour aider les entreprises lors de cette phase de transition. En outre, les services et systèmes de stockage d’objets deviendront la norme pour les conteneurs de stockage avec état. 

 

  1. L’infrastructure d’application sera déployée sur Kubernetes, y compris pour le stockage

Kubernetes deviendra la plateforme par défaut pour le déploiement d’infrastructures dans les centres de données : plus les entreprises évolueront et adopteront des applications Cloud natives, plus le besoin pour une architecture standardisée de déploiement et d’orchestration des conteneurs se fera sentir, tout comme cela fut le cas avec les machines virtuelles (VM) ces deux dernières décennies. Kubernetes sera cette plateforme d’orchestration, non seulement pour les applications déployées dans les conteneurs, mais également pour les éléments d’infrastructure développés sous forme de services et de microservices. Ceci s’appliquera aussi aux infrastructures de stockage et de gestion des données déployées sur Kubernetes. 

 

  1. Les monopoles et le Cloud

En 2020, les équipes IT intensifieront la transition depuis des solutions « Cloud intégral » vers des solutions de gestion des données hybrides et multicloud, car elles s’apercevront de plus en plus que dépendre à 100 % d’un unique fournisseur de services Cloud renforce les monopoles. Les fournisseurs de services Cloud ont tiré profit des situations de dépendance, et leurs clients s’en rendent compte.  Il s’agit là de la principale raison qui pousse 53 % des entreprises qui avaient tout déplacé vers le Cloud public à commencer le rapatriement de certaines de leurs données (IDC). Stocker des données sur un Cloud et en interne (via une infrastructure Cloud hybride), ou sur de multiples Clouds (via une infrastructure multicloud), sont deux approches sensées et éprouvées qui permettent aux entreprises de garder le contrôle et d’éviter les monopoles. 

 

  1. Les monopoles et l’IA

L’IA va s’opposer plus vigoureusement à… l’IA, alimentant ainsi les pratiques monopolistiques et réduisant les situations concurrentielles (il suffit pour s’en rendre compte de constater l’homogénéisation des tarifs aériens). Pour faire face à ce que nous réserve la quatrième (et la cinquième) révolution industrielle, la distinction entre ce qui nécessite des « humains » et ce qui ne le nécessite pas va s’accélérer, et nous continuerons à voir l’écart se creuser entre les tâches et fonctions qui requièrent une intervention humaine, et celles dont l’IA peut se charge seule.  Au fil du temps, les humains s’occuperont des tâches qui nécessitent soin, créativité et artisanat, tandis que tout le reste sera automatisé.  2020 verra s’accélérer la catégorisation du « travail ». 

 

  1. Piratage et violations de données

De nouvelles façons d’identifier patients, clients et déposants seront développées en 2020, alors même que le rythme des piratages et des violations de données va crescendo. Les données stockées ont une immense valeur. Tant qu’ils n’auront pas procédé à ces changements, les hôpitaux et les prestataires médicaux, par exemple, resteront des cibles privilégiées en raison de la valeur des données qu’ils stockent, pas en termes des informations médicales, mais des données d’identification des patients qui les accompagnent (numéro de sécurité sociale, date de naissance, adresse, etc.). 

 

  1. Durabilité

En 2020, les entreprises mettront un terme au « remplacement injustifié » afin de réduire le gaspillage et les déchets. Lorsqu’une actualisation technologique est nécessaire, de nombreuses entreprises se voient contraintes par leurs vendeurs à renouveler intégralement aussi bien le matériel que les logiciels. Il en résulte bien évidemment une quantité considérable de déchets technologiques qui doivent être traités et « défabriqués » (ce qui demande des ressources en énergie et en intervention humaine) afin de pouvoir être recyclés et éliminés. Les serveurs, qui contiennent des composants toxiques tels que du béryllium, du cadmium, du chrome hexavalent, du plomb, du mercure, des RFB et bien d’autres, devraient être utilisés jusqu’au terme de leur vie utile, et pas uniquement jusqu’à ce que le vendeur souhaite vendre au client une nouvelle génération de produits. Il est temps de réformer cette culture du remplacement injustifié.  

Le stockage est un autre parfait exemple d’un domaine où cette réforme peut s’appliquer.  Le stockage défini par logiciel, associé à des systèmes ultra-robustes de résilience des données, constitue une solution idéale pour permettre aux serveurs de données d’aller jusqu’au bout de leur vie utile, plutôt que de les remplacer au moment d’une actualisation technologique. Adopter une solution performante de stockage défini par logiciel capable à la fois d’évoluer de façon illimitée à l’aide de serveurs classiques et de rester agnostique en termes de génération pour pouvoir suivre l’évolution du matériel au fil du temps, constitue une excellente façon de limiter le gaspillage. Qu’est-ce que la résilience des données ultra-robuste dans le domaine du stockage ? Lorsque le stockage est réparti à travers de multiples serveurs, ces nœuds peuvent partager une logique de distribution hautement parallèle sans aucun point de défaillance, car elle ne dépend pas d’un unique composant. Ce type de système est résilient, auto-réparateur, adaptatif, sensible à l’emplacement et en constant renouvellement. Dans de telles conditions, vous pouvez attendre que votre matériel défaille avant de le remplacer, car la disponibilité de vos données n’est pas affectée, et les pannes de serveur ne sont plus un problème. Mieux encore, certains modèles de résilience peuvent se permettre de perdre tout un centre de données, voire un centre de données et un serveur. Un jour ou l’autre, les serveurs arrivent en bout de course. À ce stade, leurs composants métalliques, plastiques et en verre peuvent être recyclés, et leurs composants toxiques éliminés en toute sécurité. Pourquoi accélérer et augmenter le traitement, le gaspillage et les ressources lorsqu’il est possible d’utiliser les systèmes jusqu’à ce qu’ils doivent véritablement être remplacés quand d’autres solutions existent ?

Paul Speciale
Chief Product Officer

Paul Speciale