Comment les sites populaires gèrent des millions de connexions chaque seconde
Découvrez comment les sites Web gèrent des quantités massives de trafic
Des millions de personnes utilisent Internet chaque jour. Chacune de ces personnes se connectera à une multitude de sites Web et de services tout au long de sa journée ; certains sites Web gèrent eux-mêmes des millions de ces connexions. Les plus grands sites Web sur Internet, des sites comme Facebook et YouTube, s’adressent à des milliards de personnes dans le monde et tout temps d’arrêt représente une grave perte de revenus.
Il existe un certain nombre de techniques que les sites Web peuvent utiliser pour s’assurer que leurs services sont toujours disponibles et que leurs serveurs restent opérationnels. Sans mettre en place des mesures pour gérer un volume de trafic élevé, il existe une limite au nombre d’utilisateurs qu’un site Web peut desservir simultanément. Si un site Web connaît un volume de trafic étonnamment élevé, il peut devenir indisponible pour tout le monde.
La popularité de Facebook
Facebook est l’un des sites Web les plus populaires sur Internet. La plate-forme de médias sociaux compte des milliards d’utilisateurs dans le monde et s’adresse à des millions d’entre eux simultanément. Nous savons tous que Facebook est populaire, mais le niveau de son succès et la profondeur de sa portée surprennent encore certaines personnes. Par exemple, plus de 10 millions de messages sont envoyés entre les utilisateurs de Facebook, alors qu’ils cliquent collectivement sur le bouton “J’aime” plus de 4,5 milliards de fois chaque jour.
Afin de faire face au volume massif de trafic, Facebook a combiné les techniques existantes avec sa propre technologie propriétaire. Cela leur permet de minimiser la charge sur n’importe quel serveur individuel tout en réduisant la quantité de données qui doit être envoyée et reçue entre leurs utilisateurs et leurs serveurs. Ceci est essentiel compte tenu du nombre d’utilisateurs de Facebook qui restent connectés au service via leurs appareils mobiles tout au long de la journée. Non seulement cela améliore l’expérience utilisateur, mais cela permet également à Facebook de maintenir les coûts d’exploitation de ces serveurs aussi bas que possible.
Garder les serveurs en ligne
Les serveurs stockent le contenu dont les sites Web et les services en ligne ont besoin pour fonctionner. Chaque fois que vous chargez un site Web ou un service en ligne, vous téléchargez les données requises à partir du serveur Web qui l’héberge. Les données sont envoyées des serveurs Web aux utilisateurs sous forme de paquets, les fichiers individuels étant décomposés en milliers de petits paquets. Cela permet à différents utilisateurs de télécharger différentes parties du fichier et permet à davantage d’utilisateurs de télécharger un seul fichier sans provoquer de ralentissements.
Mais cela seul ne suffit pas après un certain point. Les serveurs en ligne les plus actifs doivent prendre des mesures supplémentaires pour s’assurer qu’ils restent constamment opérationnels. Pour des entreprises comme Facebook, chaque minute d’indisponibilité représente une perte de revenus et des utilisateurs en colère. Les services en ligne qui acquièrent la réputation d’une disponibilité de serveur peu fiable auront du mal à développer leur base d’utilisateurs.
La première ligne de défense contre les pannes de serveur est la redondance. Cela signifie simplement que si un serveur est indisponible, les utilisateurs seront acheminés vers un serveur de basculement à la place. Les serveurs sont conçus pour gérer plusieurs connexions simultanées, mais les sites Web les plus fréquentés nécessitent des serveurs plus puissants. Comme pour tout appareil électronique, il existe un risque de panne matérielle. Si le disque dur d’un serveur tombe en panne sans sauvegarde, les données peuvent être irrémédiablement perdues.
Équilibrer la charge
L’équilibrage de charge est exactement ce à quoi il ressemble – garantissant que la charge de calcul requise pour servir tous les utilisateurs connectés est répartie sur plusieurs serveurs. Les services en ligne comme Facebook gèrent beaucoup trop de connexions pour qu’un seul serveur puisse les gérer. Chaque fois qu’un serveur reçoit une nouvelle demande, le serveur de noms de domaine effectue une rotation circulaire des adresses IP associées au domaine. C’est une bonne solution pour de nombreux sites Web, mais les plus grands services en ligne utiliseront leurs propres protocoles personnalisés pour équilibrer la charge.
Lorsque vous vous connectez à Facebook, votre connexion est automatiquement acheminée vers un serveur capable de gérer la charge. Si un serveur devient surchargé, Facebook cessera d’y envoyer de nouvelles connexions. L’équilibrage de charge nécessitait autrefois du matériel physique, qui est encore parfois utilisé, mais cela peut désormais également être effectué dans le cloud.
L’équilibrage de charge ne consiste pas seulement à minimiser les temps d’arrêt ; il remplit également une fonction économique pratique. Considérez une entreprise telle que Facebook qui a de nombreux serveurs en cours d’exécution dans le monde entier. Lorsqu’un serveur est inactif et ne traite pas les demandes des utilisateurs, il nécessite très peu d’énergie. Cependant, à mesure que de plus en plus d’utilisateurs se connectent, le serveur doit travailler plus dur et consommer plus de puissance. Vous pouvez voir la tendance et faire les calculs nécessaires.
Facebook a découvert que pendant les périodes calmes, les serveurs consommaient plus d’énergie que lorsqu’ils étaient inactifs, comme prévu. Mais ce qui n’était pas prévu, c’est que les serveurs à charge moyenne consommaient autant d’énergie que les serveurs à faible charge. Il est donc plus économique pour Facebook d’avoir ses serveurs à capacité moyenne ou inactifs plutôt que sous une faible charge.
Assurer la sécurité des serveurs
Un serveur est un objet physique, une machine qui peut être endommagée ou cassée. Si le serveur est physiquement endommagé ou détruit, il ne pourra pas accepter les connexions entrantes. Cela signifie qu’un problème dans un centre de données – une panne de courant, une catastrophe naturelle ou même un problème de plomberie peut signifier que des serveurs vitaux deviennent inaccessibles.
Comme tout ordinateur, un serveur peut devenir très chaud lorsque son processeur est soumis à une forte charge. En plus des systèmes de refroidissement intégrés aux serveurs eux-mêmes, les centres de données où les serveurs sont hébergés sont climatisés et frais. En fait, les systèmes de climatisation contrôlent également l’humidité, empêchant l’environnement de devenir trop humide.
Selon l’emplacement du centre de données, il peut également être nécessaire de le concevoir pour prendre en compte le potentiel de catastrophes naturelles. Les centres de données en Californie, par exemple, sont hébergés dans des structures conçues pour résister aux tremblements de terre, tandis que les racks de serveurs eux-mêmes sont renforcés et conçus pour ne pas s’effondrer. Les plus grandes entreprises technologiques auront des serveurs situés dans le monde entier, de sorte qu’un problème dans un centre de données n’affecte pas l’ensemble du réseau.
Protection et surveillance
Une attaque par déni de service distribué (DDoS) est un type de cyberattaque qui utilise plusieurs connexions simultanées pour submerger un serveur Internet et le rendre inaccessible. Les centres de données emploient des ingénieurs pour surveiller leurs réseaux afin de détecter tout trafic inhabituel et répondre à toute menace. Cela s’ajoute à un certain nombre de méthodes automatisées couramment utilisées pour empêcher les attaques DDoS.
Cependant, même avec ces défenses en place, des attaques DDoS réussies se produisent toujours et peuvent causer de graves problèmes aux centres de données et à leurs clients. Les centres de données auront donc des procédures en place pour répondre aux attaques DDoS lorsqu’elles sont détectées.
Les serveurs des sites Web et des services en ligne les plus populaires gèrent aujourd’hui des milliers de connexions. Avec des millions d’utilisateurs accédant simultanément aux services, pour s’assurer que les serveurs ne soient pas submergés, les entreprises doivent disposer d’une infrastructure adéquate. L’équilibrage intelligent des charges sur plusieurs serveurs permet aux sites Web d’utiliser leurs ressources disponibles aussi efficacement que possible, tandis que les redondances garantissent que des sauvegardes sont disponibles en cas de problème.
Chaque fois que vous vous connectez à un site Web ou faites défiler votre flux Facebook, vous chargez du contenu à partir de différents serveurs. Pour l’utilisateur final, tout se passe rapidement et presque instantanément, mais dans les coulisses, il se passe beaucoup plus de choses qu’il n’y paraît. Sans mesures en place pour répartir correctement la charge, les serveurs des plus grands sites Web seraient rapidement débordés.
Auteur:
Adam Dubois. Je suis un geek français qui a longtemps été dans la technologie de toutes sortes. Je me suis lancé dans le développement web dès mon adolescence, après avoir créé mon premier blog personnel. Maintenant, mon objectif principal est Proxyway. Je partage une fascination pour la technologie permettant la confidentialité et cherche à créer la ressource la plus complète sur tout ce qui concerne les proxy.