Lemonde Informatique – Le big data, moteur des recommandations de RichRelevance
Afin de fournir son service de génération de recommandations à destination des e-commerçants, RichRelevance s’appuie depuis 2008 sur un ensemble de briques technologiques big data Hadoop dont HDFS, Hive et MapReduce. Il s’est également tourné vers la solution Data Integration de Pentaho pour ses scripts de transformation.
Créée en 2007 et commercialisant depuis 2008 ses solutions de recommandations ciblant les e-commerçants – dont en France 3Suisses, Darty ou encore Priceminister -, RichRelevance a depuis le début misé sur des technologies big data, en particulier Hadoop. Il faut dire que la masse des données conservées, à savoir l’ensemble des événements concernant tous les produits vus, sur lesquels les internautes ont cliqué ou qu’ils ont achetés et que la société utilise pour générer des recommandations, atteint 2 pétaoctets. Et encore, en mode compressé, ce qui donne en décompressé un volume vertigineux de 13 pétaoctets de données.