Une pluie de données : Tendances stockage 2019
par Rainer W. Kaese, Senior Manager Business Development Storage Products, Toshiba Electronics Europe
Où allons-nous mettre toutes ces données ? Grâce aux ingénieurs et aux programmeurs, les disques deviennent de plus en plus volumineux et leur intégration dans des systèmes de stockage efficaces devient plus simple. Pris ensemble, nous pouvons voir que les défis auxquels nous sommes confrontés aujourd’hui seront plus simples à résoudre. Mais avec de plus en plus de données qui devraient être générées par des machines, telles que des véhicules autonomes et des usines intelligentes, associées à la quantité gigantesque de matériel déjà stocké et sauvegardé par des humains, serons-nous en mesure de créer suffisamment de stockage pour les besoins de la prochaine décennie ? Ou devrons-nous envisager une approche plus radicale et commencer à réfléchir à ce qui mérite d’être stocké ?
Équilibrer le disque dur par rapport au SSD dans un monde de données en croissance
Non seulement la quantité de données que nous stockons continue de croître sans relâche, mais sa croissance est plus rapide que prévu. On s’attendait à ce que la quantité de données stockées sur les disques durs et les bandes magnétiques diminue tandis que la proportion de données stockées sur flash et SSD augmente. Cependant, il est clair aujourd’hui que les trois technologies continuent à se développer en raison de la grande quantité de données à stocker. En 2019, on peut supposer que 90% de la capacité des applications de cloud computing typiques sera stocké sur des disques durs, et éventuellement sur bande magnétique, et que 10% seulement seront mis sur SSD. Toutefois, étant donné que les disques SSD d’entreprise coûtent jusqu’à dix fois plus cher que les disques durs par unité de capacité, l’investissement financier sera équilibré avec environ 50% des dépenses en disques durs et le même montant investi dans les disques SSD. Ces systèmes de stockage couvrent tout le spectre des applications, des dispositifs « tout flash » aux modèles hybrides avec flash en cache ou des disques durs pour données sensibles ou non, en passant par les serveurs de stockage purs avec disque dur.
Les disques durs à l’hélium fournissent environ 20 To de stockage
Les trois principaux fabricants proposent désormais des modèles de disque dur remplis d’hélium, avec des capacités disponibles actuellement, de 14 To. Au cours des prochaines années, la capacité devrait augmenter d’environ 2 To par an, ce qui signifie que des disques durs de 20 To devraient être disponibles au début de la prochaine décennie. Ces disques durs seront probablement optimisés pour une capacité élevée à un prix bas, mais aucune amélioration notable d’autres paramètres techniques n’est attendue.
Une exception est la consommation d’énergie, qui diminuera du fait de l’introduction de l’hélium dans les disques durs. Alors que les disques durs de 3,5 pouces à 7 200 tr / min et remplis d’air consomment une puissance de charge restante relativement constante de 11W, quelle que soit leur capacité, la consommation électrique des disques durs à hélium est d’environ 6 – 7W. Ceci est dû au frottement réduit du gaz d’hélium, plus léger. Ainsi, l’introduction de disques durs remplis d’hélium aidera à relever le défi de l’augmentation de la consommation d’énergie des centres de données. Chaque watt d’énergie économisé par ces disques entraîne moins d’énergie requise par un centre de traitement de données et moins de chaleur dissipée, ce qui permet un refroidissement plus économique. La réduction de la température a un effet d’entraînement sur les disques remplis d’hélium, qui présentent également une fiabilité accrue par rapport aux disques remplis d’air. Il en résulte beaucoup moins de défaillances et une durée de vie plus longue. D’autres augmentations de la densité de stockage sont également en cours, avec des technologies telles que l’enregistrement magnétique assisté par micro-ondes (MAMR) à intégrer dans les têtes d’écriture de disques durs.
Architectures de stockage
Nous pouvons nous attendre à une croissance continue des solutions de stockage montées sur rack avec une charge maximale en raison de l’augmentation de la demande en matière de capacité. Bien que 60 baies au format 4U soit aujourd’hui la norme, il existe déjà des boîtiers prenant en charge de 78 à 110 baies environ pour les disques durs de 3,5 pouces. Au lieu d’opter pour le matériel RAID, de telles quantités de lecteurs sont configurées à l’aide de solutions logicielles. Les systèmes de stockage modernes définis par logiciel continueront de dominer, de même que les conceptions évolutives telles que les clusters Ceph, plusieurs serveurs de stockage étant combinés dans des unités plus grandes. Ici, la protection des données n’est plus assurée par la redondance des disques durs du serveur. Au lieu de cela, la redondance est implémentée via les noeuds de serveurs de stockage disponibles sur le réseau du serveur.
Explosion de données
Aujourd’hui, une quantité énorme de données est générée par les gens. Lorsque nous considérons également que ces données sont ensuite sauvegardées dans les centres de données et dans le cloud, cela ne sert qu’à multiplier la quantité de stockage nécessaire. À ce jour, la quantité de données générées par appareil a été, par comparaison, plutôt faible. Toutefois, cela changera à partir de 2019, car des solutions et des technologies telles que la conduite autonome, les usines intelligentes, l’Internet des objets (IoT) et la domotique, génèrent de nouveaux flux de données qui doivent être stockés. La quantité de données attendue est si importante que la philosophie actuelle de stockage des données est à l’étude. La dure réalité est que nous devrons analyser les données avant de les stocker pour déterminer celles qui sont vraiment importantes et qui doivent être conservées.
Intelligence artificielle, Deep Learning et Blockchain
De nouvelles applications informatiques, telles que l’intelligence artificielle (IA), le Deep Learning et le Blockchain ont considérablement accru les exigences en matière de performances de traitement. Nous pouvons nous attendre à ce que ces technologies génèrent beaucoup plus de données et exigent un accès aux solutions de stockage. À l’heure actuelle, on ne sait pas exactement quel impact ils auront sur les exigences en matière de stockage, car les connaissances sur les applications et leur mise en œuvre sont insuffisantes. Nous devrions toutefois commencer à acquérir plus de clarté à mesure que nous progressons en 2019 et dans la prochaine décennie. Ce qui est clair aujourd’hui, c’est que ces technologies augmenteront encore la quantité de données à stocker.