pen icon Colloque
quote

Rétro-ingénierie des bases de données relationnelles pour la découverte d'informations décisionnelles

GB

Membre a labase

Gilbert Babin

Résumé du colloque

Afin d'accélérer les temps de réponse et désengorger les bases de données opérationnelles, certains systèmes d'information pour dirigeants utilisent une structure matricielle pour emmagasiner leurs données. Les dimensions de cette structure matricielle représentent les différentes façons de regrouper les données afin de leur donner un sens. Par exemple, pour des données sur les ventes, les dimensions peuvent être la ville où s'effectue la vente, la division qui l'a effectuée, etc. Cependant, la souplesse d'utilisation d'une structure matricielle ne peut être atteinte sans rencontrer certains inconvénients. En effet, de grands efforts doivent être déployés lors de la configuration et du chargement d'une telle structure matricielle pour pouvoir utiliser les données opérationnelles. L'objectif poursuivi par le présent travail est de réduire ces efforts en automatisant le processus de configuration et de chargement dans le cas particulier des bases de données relationnelles. L'approche préconisée est basée sur la rétro-ingénierie des bases de données à intégrer dans la structure matricielle. Le résultat de la rétro-ingénierie est un modèle décrivant les relations de dépendance fonctionnelle entre les différentes relations de la base de donnée. Ce modèle est utilisé pour identifier les dimensions potentielles dans la structure matricielle. La rétro-ingénierie s'effectue de façon homogène en utilisant des librairies standardisées pour l'accès aux bases de données (e.g., ODBC). Spécifiquement, les fichiers systèmes de la base de données sont consultés pour établir la liste des relations et les liens entre les relations, établissant ainsi le modèle de la base de données. Par la suite, les dimensions potentielles sont identifiées et les requêtes SQL nécessaires pour le chargement de la structure matricielle sont générés par navigation dans le modèle, automatisant la configuration et le chargement de la structure matricielle. Cette approche a été utilisée sur trois bases de données de petite et moyenne envergure. On remarque que le temps pour créer la structure matricielle est uniforme. La structure matricielle résultante est simple et reflète plus ou moins les besoins des utilisateurs. L'information utilisée dans l'approche utilisée est insuffisante pour obtenir des résultats plus près des besoins des utilisateurs. Nous considérons utiliser deux approches afin d'améliorer les résultats déjà obtenus, soit l'apprentissage automatique et l'analyse statistique des transactions passées sur la base de données. Ces techniques permettront d'identifier les dimensions les plus intéressantes à conserver.

Contexte

Section :
Informatique
news icon Thème du colloque :
Informatique
host icon Hôte : Université McGill

Découvrez d'autres communications scientifiques

news icon

Titre du colloque :

Informatique

Autres communications du même congressiste :

news icon

Thème du colloque :

Informatique