Catégories
Général

Prototype – Auditer une application sur Google Play Store

Google Play Store permet aux utilisateurs d’applications mobiles de partager leurs feedbacks en notant et en commentant leur expérience. Ces informations peuvent être récupérées de manière automatisée grâce à des techniques de scraping en vue d’un audit ou d’une analyse de la perception des utilisateurs du service. Le prototype Google Play Analysis (code source) est […]

Catégories
Général

Prototype – Extraire les métadonnées de vidéos Twitch

Twitch est une plateforme de streaming plébiscitée par les gamers et rachetée par Amazon en 2014, pour 1 milliard de dollars. Elle rapporterait aujourd’hui plus de 15 milliards de dollars par an grâce à son modèle économique premium & freemium (systèmes d’abonnements, de dons…) et l’activité de ses 26 millions de spectateurs quotidiens en très […]

Catégories
Etudes Général

Analyse des marques de produits laitiers sur Facebook

Les marques de produits laitiers s’expriment tout au long de l’année sur les réseaux sociaux, cherchant à préempter des territoires d’expression différenciant. Au sein de l’agence The Metrics Factory, nous avons analysé un dataset exhaustif des prises de paroles d’une vingtaine de marques sur Facebook, et l’ensemble des commentaires associés (plus de 300.000 !). Nous […]

Catégories
Etudes Général

Dessine moi un tuto !

Il existe mille et une manière de produire un tutoriel. Des marques de tous secteurs et domaines d’activités confondus en diffusent pour accompagner des objectifs de communication variés. The Metrics Factory a analysé un corpus de 3260 tutoriels beauté et de plus de 2,1 millions de commentaires associés. Cela a permis de mettre en évidence […]

Catégories
Etudes Général

Portrait des supporters de football sur Facebook

Dans le cadre de mes missions au sein de The Metrics Factory, j’ai pu analyser une corpus exceptionnel composé de plus d’1.5 millions de commentaires Facebook, de supporters de clubs de football de Ligue 1. Ce corpus nous a permis de révéler différentes typologies de supporters consommant, et interagissant avec les contenus de leur club […]

Catégories
Général Tutoriels

Tutoriel – implémenter Stanford CoreNLP avec Talend

Pour compléter le tutoriel sur la détection de la langue d’un message, nous allons maintenant voir comment appliquer des traitements text mining avancés à un corpus, à l’aide de la librairie Stanford CoreNLP. Le groupe de recherche de l’université de Stanford partage depuis plusieurs années une série d’outils, parmi les meilleurs du marché, en Java, […]

Catégories
Général Musique Tutoriels

Tutoriel Spotipy – Créer une playlist de recommandations Spotify

N’avez-vous jamais été surpris par la qualité des recommandations de Spotify, une fois l’écoute d’un album terminée ? Le service de streaming dispose de données plutôt riches concernant les titres de son catalogue et peut ainsi créer des enchaînements pertinents. Par exemple, Spotify prend en compte des critères d’énergie, de positivité, de tempo, etc. Je vous propose […]

Catégories
Tutoriels

Tutoriel text mining avec Talend : détecter la langue d’un message

Ce tutoriel s’adresse à des dataminers ou data scientists qui sont confrontés à une problématique de text mining usuelle : comment identifier la langue d’un message. Ce tutoriel présente une implémentation simple de la librairie Java ‘language-detection‘ au sein de Talend. Le tutoriel se veut le plus pédagogue possible pour les profanes de Talend, et […]

Catégories
Etudes

#ComPol – Quels sont les partis politiques les plus influents sur Twitter ?

Cet article s’intéresse aux prises de paroles des principaux partis politiques français, sur Twitter. Comment s’articulent leurs lignes éditoriales ? Que révèlent leurs messages sur leurs prises de position ? Dans quelle mesure sont-ils repris par leurs lecteurs ? Pour répondre à ces questions, nous avons collecté les 4000 derniers messages postés par 25 partis […]