Les bases de données des entreprises du Web
Quasiment aucune n'utilise Oracle, alors, quelle est leur solution?
Selon Amazon, les clients d'AWS font été d'une réduction de coûts de 90% en migrant d'Oracle vers AWS. (Source).
Leur solution |
|
---|---|
Percolator pour le moteur de recherche. Successeur de BigTable, autre solution créée par Google. Spanner. BD NewSQL distribuée et répliquée en temps réel, pour GMail et autres. |
|
HBase. Dérivé de BigTable et fait partie de Hadoop, un ensemble d'outils. MySQL. Pour les fonctions courantes. Surcouche TAO pour le graphe social. Haystack. Pour les photos. Hive. Ajoute l'analyse de données à Hadoop. Schéma: Infrastructure de Facebook quand aux bases de données. (Source Malte Schwarzkopf). |
|
Cassandra pour les statistiques et la géolocalisation. MySQL. Un fork du gestionnaire, pour les utilisateurs et les tweets. Le code source est disponible sur GitHub. FlockDB. Une base de données en graphe pour les connexions sociales. Le code source est aussi sur GitHub. HBase et Hadoop. Sans doute pour remplacer MySQL. |
|
Wikipedia | MariaDB. Des clusters de wikis avec un accès commun. Programmé en PHP et JavaScript (30%). |
Yahoo | MySQL modifié. La compagnie a un temps eu le record de taille de tables SQL. PostgreSQL dont la partie requête a été personnalisée. |
eBay | Hadoop avec Kylin, un système de recherche sur des masses de données. eBay a utilisé Oracle. |
Digg | DynamoDB qui est une solution NoSQL fournie par Amazon AWS, son hébergeur. |
Netflix | Cassandra. |
Skype | PostgreSQL. Utilisé avec PHP et autres langages de script. |
Youtube | MySQL + Vitesse pour l'adapter au cloud. |
Uber | A migré de PostgreSQL à MySQL (Percona) + Schemaless qui le rend NoSQL. Utilise aussi Cassandra, Hadoop, MongoDB et Redis sous Node.js (Source) |
Ceci n'est qu'un échantillon des entreprises les plus connues. Une multitude d'autres font appel à PostgreSQL, MariaDB (remplaçant de MySQL), HBase et les outils d'Hadoop.
Même si Cassandra a été délaissé par Facebook qui l'a créé, ce logiciel est cependant utilisée par une multitude d'autres entreprises dont les besoins sont différents.
Seule Amazon utilisait Oracle, qu'elle a remplacé progressivement par d'autres bases de données, en partie par Aurora, sa propre solution. En en avait déjà pris la décision dès 2014 et a annoncé le 15 octobre 2019 que la dernière base de donnée Oracle était supprimée définitivement.
Le CEO d'Oracle, Larry Ellison, le 26 octobre 2018, disait:
Amazon fonctionne entierement sur la base de données d'Oracle. Ils ont été incapables de migrer sur AWS car il n'est pas assez performant.
Il faut effectivement beaucoup, beaucoup de temps pour migrer une base de données, mais ce n'est pas parce que la nouvelle n'est pas assez puissante.
On voit que pour les données structurées, les entreprises utilisent MariaDB (éventuellement en clusters) et PostgreSQL. Mais elles les utilisent aussi en combinaison avec d'autres outils pour les données en réseau.
L'expérience d'Uber à montré que PostgreSQL ne convient pas pour la mise à jour en masse de lignes et que MySQL ou dérivés sont plus rapides tant qu'on ne modifie pas la clé primaire. Postgre offre plus de possibilités cependant dans d'autres types d'usages.
Par ailleurs, d'autres types de bases de données conviennent mieux pour les applications très diverses du Web: tables NoSQL, documents, graphes de relations, clé-valeurs, etc...
Voir aussi...
- ArangoDB. Pour les applications n'utilisant pas de tables.
- Cassandra. A l'inverse, le NoSQL en tables.
- VoltDB. Une des bases de données du futur.