Résumé :
|
Le travail présenté dans cette thèse s'inscrit dans une double problématique: la modélisation de bases de données et l'extraction de connaissances à partir des données collectées. Nous nous intéressons, en effet, à un nouveau type d'applications décisionnelles, dites d'auto-surveillance, pour lesquelles les approches de conception existantes s'avèrent mal adaptées et qui nécessitent des capacités de fouille de données (ou data mining). Sur le plan modélisation, il s'agit de permettre la représentation de scénarios de comportement, décrivant des évolutions que l'on souhaite détecter au plus tôt, pour les objets de la base. Nous proposons une démarche générique permettant la modélisation des applications visées. Concernant l'extraction de connaissances, l'objectif est, à partir des données descriptives du comportement des objets dans le temps, de découvrir des traits de comportement pertinents pour l'utilisateur. Le problème posé est similaire à celui, en data mining, de l'extraction de motifs séquentiels mais introduit la multi-occurrence d'événements. Après avoir étudié les besoins d'extensions des algorithmes existants, nous proposons l'approche PSP+. Les expérimentations menées sur différents jeux de données montrent son efficacité.
The presented research work fits in a twofold issue: a database modelling and knowledge discovery from collected data. We are, in facts, interested in a new type of decision support applications, called auto-supervisions, for which existing modelling approaches are not really adapted. Furthermore, data mining capabilities are required. For the modelling aspects, the problem is to represent behaviour scenarios, describing evolutions, which must be detected as early as possible, for the objects in the database. We propose a generic approach for modelling this kind of application. For knowledge discovery, the objective is, from data describing the behaviour of objects over time, to extract behavioural features, relevant for users. The problem is close to the extraction of sequential patterns in data mining, but it introduces the multi-occurrence of events. We study the need of extending existing algorithms and propose the approach PSP+. Experimentations performed on various databases show its efficacity.
|