Data Mining : traitement de données, traitement sémantique

Attention, cette réponse est ancienne. Son contenu peut être en tout ou partie obsolète.

Question

Je souhaiterais, donc pour être plus à l'aise avec mes missions de stage pouvoir consulter des ouvrages et articles pour connaitre la théorie du datamining (traitement de données et sémantique). Également je souhaiterais pouvoir avoir des exemples concrets de mise en pratique dans le même domaine que mes recherches: extraire des connaissances pour la prédiction d'évènement à partir de données littéraire (presse, ouvrages, manuscrits, entre 1000 et 2000) Je suis tombée sur beaucoup de traitement de données à propos de Business, de données clients mais j'ai du mal à me projeter là dedans.

Réponse

Date de la réponse :  24/05/2019

Vous cherchez des documents sur le data mining, et en particulier sur le traitement de données sémantiques (fouille de textes ?).

Nous ne sommes pas spécialistes du sujet, mais voilà toutefois quelques références bibliographiques.
 

Manuels sur l'exploration de données :

  • Data mining: découverte de connaissances dans les données. Vuibert, 2018
  • R pour la statistique et la science des données. Sous la direction de François Husson.  Presses universitaires de Rennes, 2018
  • Le machine learning avec Python : la bible des data scientists. Andreas C. Müller et Sarah Guido. First interactive, 2018
  • Data scientist et langage R : guide d'autoformation à l'exploitation intelligente des big data. Henri Laude, Eva Laude. Éditions ENI, 2018


Il existe également de nombreux cours en ligne sur le data mining ; le laboratoire ERIC de Lyon 2 propose par exemple ses Supports de cours data mining et data science.


Vous pouvez aussi choisir de concentrer vos recherches sur la fouille de textes (en anglais Text mining).

Pour une introduction, vous pouvez lire :


Voilà quelques manuels sur le sujet :

  • Explorer un corpus textuel : méthodes, pratiques, outils. Céline Poudat, Frédéric Landragin. De Boeck Supérieur, 2017
  • Méthodes et outils informatiques pour l'analyse des discours. Sous la direction d’Émilie Née. Presses universitaires de Rennes, 2017
  • Introduction aux humanités numériques : méthodes et pratiques : sciences humaines et sociales. Seth van Hooland, Florence Gillet, Simon Hengchen... [et al.] ; préface de Michael Sinatra. De Boeck supérieur, 2016
  • Analyse de données textuelles sous R. Nicolas Turenne. ISTE éditions, 2016
  • Expérimentations et évaluations en fouille de textes : un panorama des campagnes DEFT. Sous la direction de Cyril Grouin et Dominic Forest. Hermès science : Lavoisier, 2012
  • Traitement automatique du contenu textuel. Thierry Poibeau. Hermès - Lavoisier, 2011
     

Il existe également de nombreux cours en ligne sur la fouille de textes ou le text mining.