Text mining : optimisation de Spacy avec Spark

Le text mining nécessite de penser à une approche d’optimisation de temps de traitements surtout lorsque le dataset à étudier se compte en millions voire en milliards de phrases. Spacy, l’une des librairies les plus populaires du NLP, suffit-elle à traiter ce type de données ? De tels volumes de données ne nécessitent-ils pas également de travailler sur l’aspect technique de l’environnement ?

Publié le 27 avril 2020

L’apprentissage par renforcement

Dans le mode de l’intelligence artificielle, les réseaux de neurones sont à la base des plus grandes avancées des dix dernières années pour des usages aussi variés que la vision par ordinateur, la traduction automatique de texte et la prédiction de séries temporelles, mais aussi pour les algorithmes d’apprentissage par renforcement.

Publié le 4 novembre 2019

Une journée dans la peau d’un Data Scientist

Saviez-vous qu’en 2012, selon la Harward Business Review, le titre de « Job le plus sexy du XXIème siècle » a été décerné au rôle du Data Scientist ? Pourquoi ? Pour le découvrir, suivons Martin, Data Scientist dans une enseigne de grande distribution.

Publié le 09 septembre 2019