Google Play Store permet aux utilisateurs d’applications mobiles de partager leurs feedbacks en notant et en commentant leur expérience. Ces informations peuvent être récupérées de manière automatisée grâce à des techniques de scraping en vue d’un audit ou d’une analyse de la perception des utilisateurs du service. Le prototype Google Play Analysis (code source) est […]
Twitch est une plateforme de streaming plébiscitée par les gamers et rachetée par Amazon en 2014, pour 1 milliard de dollars. Elle rapporterait aujourd’hui plus de 15 milliards de dollars par an grâce à son modèle économique premium & freemium (systèmes d’abonnements, de dons…) et l’activité de ses 26 millions de spectateurs quotidiens en très […]
Les marques de produits laitiers s’expriment tout au long de l’année sur les réseaux sociaux, cherchant à préempter des territoires d’expression différenciant. Au sein de l’agence The Metrics Factory, nous avons analysé un dataset exhaustif des prises de paroles d’une vingtaine de marques sur Facebook, et l’ensemble des commentaires associés (plus de 300.000 !). Nous […]
Il existe mille et une manière de produire un tutoriel. Des marques de tous secteurs et domaines d’activités confondus en diffusent pour accompagner des objectifs de communication variés. The Metrics Factory a analysé un corpus de 3260 tutoriels beauté et de plus de 2,1 millions de commentaires associés. Cela a permis de mettre en évidence […]
Dans le cadre de mes missions au sein de The Metrics Factory, j’ai pu analyser une corpus exceptionnel composé de plus d’1.5 millions de commentaires Facebook, de supporters de clubs de football de Ligue 1. Ce corpus nous a permis de révéler différentes typologies de supporters consommant, et interagissant avec les contenus de leur club […]
Pour compléter le tutoriel sur la détection de la langue d’un message, nous allons maintenant voir comment appliquer des traitements text mining avancés à un corpus, à l’aide de la librairie Stanford CoreNLP. Le groupe de recherche de l’université de Stanford partage depuis plusieurs années une série d’outils, parmi les meilleurs du marché, en Java, […]
N’avez-vous jamais été surpris par la qualité des recommandations de Spotify, une fois l’écoute d’un album terminée ? Le service de streaming dispose de données plutôt riches concernant les titres de son catalogue et peut ainsi créer des enchaînements pertinents. Par exemple, Spotify prend en compte des critères d’énergie, de positivité, de tempo, etc. Je vous propose […]
Ce tutoriel s’adresse à des dataminers ou data scientists qui sont confrontés à une problématique de text mining usuelle : comment identifier la langue d’un message. Ce tutoriel présente une implémentation simple de la librairie Java ‘language-detection‘ au sein de Talend. Le tutoriel se veut le plus pédagogue possible pour les profanes de Talend, et […]
Cet article s’intéresse aux prises de paroles des principaux partis politiques français, sur Twitter. Comment s’articulent leurs lignes éditoriales ? Que révèlent leurs messages sur leurs prises de position ? Dans quelle mesure sont-ils repris par leurs lecteurs ? Pour répondre à ces questions, nous avons collecté les 4000 derniers messages postés par 25 partis […]