INF7115 - BASES DE DONNÉES                                                        Hiver 2005

 

Professeur :              Robert Godin

Bureau :                   PK-4520, téléphone: 987-3000 poste 3088, télécopieur: 987-8477

Courriel :                 godin.robert@uqam.ca

URL :                       http://www.info.uqam.ca/~godin

Horaire :                  Lundi de 17h30 à 20h30

Lieu :                       SH-2420

 

DESCRIPTION (du cours selon l'annuaire)

Concepts avancés des bases de données. Gestion de transactions. Contrôle et optimisation des performances. Bases de données parallèles et réparties. Développement d’applications de bases de données Web et multitiers. Bases de données objet et objet-relationnel. Gestion de données semi-structurées et multimédia. Entrepôts de données et analyse de données (OLAP). Fouille de données (data mining). Bases de données déductives. Repérage de l’information.

 

Contenu du cours

Ce cours est destiné aux étudiants ayant suivi au préalable un ou des cours de bases de données au niveau baccalauréat et/ou qui ont une expérience pertinente en conception et utilisation de bases de données. Les sujets suivants seront abordés :

·       Quelques rappels sur

-        les fonctionnalités des systèmes de gestion de BD (SGBD)

-        la conception des bases de données

-        le modèle relationnel

-        l’intégrité dans les BD

·       Optimisation de requêtes

·       Bases de données parallèles et réparties

·       Bases de données orientées objet (BDOO)

·       Relationnel-objet

·       Bases de données déductives et bases de connaissances

·       Découverte de connaissances à partir des bases de données

·       Bases de données multimédia

·       Entrepôts de données et techniques OLAP

·       Bases de données et Web.

 

Objectifs généraux

Ce cours vise à approfondir les connaissances de l’étudiant sur les bases de données et à se familiariser avec les travaux de recherche menés actuellement dans ce domaine.

 

Objectifs spécifiques

Ce cours a comme objectifs plus particuliers de:

  • rappeler les fonctionnalités des SGBD et les différentes étapes de développement des bases de données;
  • faire connaître les plus récents développements dans le domaine des BD;
  • permettre à l’étudiant d’approfondir un des thèmes de recherche actuellement en cours dans ce domaine;
  • initier l’étudiant à un travail de recherche à travers la rédaction d’un rapport sur un sujet d’actualité.

 

 

Évaluation

 

§       Synthèse d’articles (travail individuel) :

 

   Article 1                                                                                10%

   Article 2                                                                                10%

 

Article1:

   Gray, J. (2004). The Next Database Revolution. SIGMOD 2004, Paris, France.

Article 2:

Oracle 10g

 

   La synthèse (pas une critique) ne doit pas dépasser 3 pages (un maximum de 1600 mots). Les normes de présentation de travaux (ex. largeur des marges (2,5 cm), double interligne (double), taille des caractères (Times 12)) doivent être respectées.

NB Une synthèse n’est pas une traduction …

 

§       Travail pratique (en équipe) :

   Implémentation d'une application BD avec J2EE                     10%

 

Alternative au travail pratique :

Synthèse du chapitre 8 de : Marinescu, F. (2002). EJB Design Patterns. Wiley. (télécharger gratuitement de http://www.theserverside.com/books/EJBDesignPatterns/ )

 

 

§       Projet de session (en équipe)

 

   Ébauche : résumé, bibliographie et plan de travail                    10%

   Présentation orale                                                                        20%

   Rapport final                                                                               40%

 

NB La présentation orale et le rapport doivent faire ressortir clairement les liens avec la matière vue au cours mais sans la répéter.

Les dates de remise sont précisées dans le calendrier proposé.

 

Tout retard dans la remise d’un travail entraînera une pénalité de 5% par jour sur la note attribuée à ce travail.

La qualité du français sera considérée dans la correction des travaux (pour un maximum de 10%)

Les règlements de l’UQAM concernant le plagiat seront strictement appliqués.

 


Sujets de projets de session

 

·   Comparaison de SGBD (e.g. SQL Server, Oracle, DB2) par rapport à une facette particulière de leur fonctionnalité:

-        entreposage de données (services ETL) et services OLAP

-        data mining

-        gestion de transactions (contrôle de concurrence, mécanismes de reprise, outils de gestion de flux de traitement (workflow))

-        optimisation des requêtes

-        traitement de données multimédia (texte, image, son, vidéo, données spatiales, multi-dimentionnelles)

-        conformité aux normes SQL (SQL2, SQL:1999, SQL:2003)

-        extensions objet SQL:1999

-        intégration de XML

-        support pour le développement multi-couche Web (support J2EE, .NET, services Web,…)

-        sécurité

-        outils GUI de conception/rétro-conception

-        outils de mise au point du schéma interne/requêtes

-        support d'architectures parallèles/repartees

-        outils d’administration

 

·   Survol de la littérature récente d'un thème (synthèse d'une dizaine d'articles). Exemples de thèmes :

-        OLAP

§        organisation physique, optimisation

§        visualisation

§        langages

-        data mining

§        découverte de règles d'association

§        regroupement (clustering)

§        classification (supervisée)

§        analyse de séquences

§        langages

-        algorithmes d’ordonnancement du Web (HITS,PageRank, …)

-        image mining

-        repérage multimédia

-        XML et BD

§        indexation, optimisation

§        langages

-        optimisation des requêtes objet

-        optimisation de requêtes parallèles/réparties

-        BD temporelles

-        BD spatiales

-        BD déductives

-        systèmes de gestion de flux de données (Data Stream Management Systems)

-        tables de hachage distribuées dans les systèmes P2P

 

·   Présentation et analyse d'une norme en émergence pour BD

-        JDO, SQLJ, EJB 3, XQuery, OCL/UML/profil conception BD, MOF/XMI, DMQL, etc.

 

·   Expérimenter une nouvelle technologie BD

-        Implémenter une application en utilisant une nouvelle technologie BD (JDO, outils objet/relationnel, SQLJ, EJB, BDO, relationnel-objet, BD multimédia, ETL, OLAP, data mining, XML/BD, grid…)

 

 

Références

 

·   Notes de cours

Page Web : INF7115-H2005.html

 

·   Monographies

Atzeni, P., Ceri, S., Paraboschi, S., Torlone, R. (2000). Database Systems - Concepts, Languages and Architectures. McGraw-Hill.

Abiteboul, S., Hull, R., Vianu, V. (1995). Foundations of Databases, Addison Wesley.

Abiteboul S., Buneman P., Suciu D (1999). Data on the Web : from relations to semistructured data and XML, Morgan Kaufman, 1999.

Atzeni, P., De Antonellis, V. (1993). Relational Database Theory, Benjamin/Cummings.

Barquin, R. & Edelstein, H. Editors (1997). Planning and Designing The Data Warehouse, Prentice Hall, The Data Warehousing Institute Series.

Batini, C.S., Ceri, S., Navathe, S.B. (1991). Conceptual Database Design: An Entity-relationship Approach, Benjamin/Cummings.

Bernstein, P. A., Hadzilacos V., et al. (1987). Concurrency Control and Recovery in Database Systems, Addison-Wesley.

Bertino, E., & Martino, L. (1993). 0bject-Oriented Database Systems: Concepts and Architecture, Addisson-Wesley.

Bidoit, N.(1992). Bases de Données Déductives - Présentation de Datalog, Armand Colin.

Bischoff, J. & Alexander, T. (1997). Data Warehouse, Practical Advice from the Experts, Prentice Hall.

Blaha, M. & Premerlani, W. (1998). Object-Oriented Modeling and Design for Database Applications, Prentice Hall.

Bouzeghoub, Gardarin, G., & Valduriez, P. (1994). Objets: Du C++ à MERISE Objet, Eyrolles.

Cattell R. et al (1998). The Object Database Standard: ODMG 3.0. Morgan Kaufmann.

Connolly, T., Begg, C. & Strachan, A. (1999), Database Systems: A Practical Approach to Design, Implementation and Management, 2nd Edition, Addison-Wesley.

Date, C. J. (2000). An Introduction to Database Systems (7th ed.). Reading, MA: Addison-Wesley.

Elmasri, R. & S.B. Navathe (2000). Fundamentals of Database Systems, Third Edition, Benjamin/Cummings Pub.

Garcia-Molina, H., Ullman, J. & Widom, J. (2002). Database Systems : The Complete Book. Prentice-Hall.

Gardarin, G. (1999). Bases de données objet & relationnel. Eyrolles. 1999.

Gardarin, G. (1999). Internet/intranet et bases de données : data Web, data media, data warehouse, data mining. Eyrolles 1999.

Godin, R. (2003). Systèmes de gestion de bases de données par l’exemple. Montréal, Canada: Loze-Dion.

Godin, R. (2000). Systèmes de gestion de bases de données. Vol 1: Fichiers et bases de données relationnelles. Loze-Dion. Montréal. 2000.

Godin, R. (2000). Systèmes de gestion de bases de données. Volume II : Conception et exploitation. Loze-Dion. Montréal. 2000.

Gray, J. and Reuter, A. (1993). Transaction Processing: Concepts and Techniques, The Morgan Kaufmann Series in Data Management Systems, Jim Gray Series Editor.

Grosky, W.I., Jain, R. & Mehrotra, R. (1997). The Handbook of Multimedia Information Management, Prentice Hall.

Groth, R. (1998). Data Mining – A Hands-On Approach For Business Professionals, Prentice Hall, The Data Warehousing Institute Series.

Hackathorn, R.D. (1998). Web Farming for the Data Warehouse, Morgan Kaufmann, 1998.

Han, J. & Kamber, M. (2001). Data Mining : Concepts and Techniques. Morgan Kaufmann.

Witten, I.H & Frank, E. (1999). Data Mining: Practical Machine Learning Tools and Techniques with Java Implementations, Morgan Kaufmann, 1999.

Kemper, A. & Moerkotte G. (1995). Object-Oriented Database Management, Prentice Hall, 1994.

Kim, W. (1995). Modern Database Systems, The Object Model, Interoperability, and  Beyond, Addison-Wesley.

Lausen, G. & Vossen, G. (1997). Models and Languages of Object-Oriented Databases, Addison-Wesley, 1997.

Lewis, P.M., Bernstein, A. & Kifer, M. (2002). Databases and Transaction Processing, Addison-Wesley, 2002.

Maruyama, H., Tamura, K. & Uramoto, N. (1999). XML and Java: Developing Web Applications, Addison Wesley, 1999.

Orfali, R., Harkey, D. & Edwards, J. (1996). The Essential Client/Server Survival Guide, 2ème édition, John Wiley & Sons.

Özsu, T., Valduriez, P. (1999). Principles of Distributed Database Systems, 2ème édition, Prentice Hall.

Ramakrishnan, R. (1997). Database Management Systems, Mc Graw Hill.

Riccardi, G. (2001). Principles of Database Systems with Internet and Java Applications, Addison Wesley, 2001.

Silberschatz, A., Korth, H. and S. Sudarshan (2002), Database System Concepts, 4ème édition, McGraw Hill Book Co.

Zaniolo, C., Ceri, S., Faloustos, C., Snodgrass, R.T., Subrahmanian, V.S. & Zicari, R. (1997). Advanced Database Systems, Morgan Kaufmann.

 

·   Revues

Communications of ACM, Journal of ACM

Computing surveys ACM

Transactions On Database Systems (TODS), ACM

Transactions on Information Systems (TIS), ACM

ACM SIGMOD Record

IEEE database Engineering Bulletin, IEEE Computer

IEEE Transactions on Knowledge and Data Engineering

Technique et Science Informatiques, AFCET.

 

·   Actes de conférences

Proceedings of ACM International Conference On Management of Data (SIGMOD)

Proceedings of ACM Symposium on Principles of Database Systems (PODS)

Proceedings of Very Large Data Base (VLDB) Conference.

Proceedings of the IEEE International Conference on Data Engineering.

Proceedings of the International Conf. on Extending Database Technology (EDBT).

 

·   Quelques sites web utiles

http://www.acm.org/Sigmod/ (Groupe d’intérêt SIGMOD de l’ACM)

http://www.acm.org/sigmod/dblp/db/welcome.html (Bibliographie de l'informatique - auparavant centré sur BD) maintenu par Michael Ley)

http://db.uwaterloo.ca/~tozsu/ (site de Prof. Tamer Özsu)

http://www-sal.cs.uiuc.edu/~hanj/ (site de Prof. Jiawei Han)

http://www.cs.toronto.edu/~mendel/dwbib.html (Bibliographie sur les entrepôts de données maintenue par Prof. Alberto Mendelzon)

http://www.informatik.tu-darmstadt.de/DVS1/staff/wu/dw.html#metadata (entrepôts de données)

http://www.cs.city.ac.uk/homes/akmal/html.dir/resources.html (BDOO)

http://citeseer.nj.nec.com/cs (Research Index)

http://www.acm.org/dl/ (ACM Digital Library)

http://ieeexplore.ieee.org/Xplore/DynWel.jsp (IEEE Xplore)

http://www-rocq.inria.fr/qui/Philippe.Deschamp/divers/metalexis.html (quelques lexiques et dictionnaires).

 


Calendrier prévu (susceptible d’être modifié)

NB. La semaine de relâche de la session hiver (28 février) n’est pas incluse dans le calendrier.

Sem.

 

Contenu et références dans Godin(2003)

Transparents disponibles à http://www.info.uqam.ca/~godin/livreEd2.html

 

Travaux

Poids

1

10/01

Introduction, présentation du cours, entente d’évaluation, rappels (optimisation requête)

Transparents (Chap. 10)

Gestion de transactions

Transparents (Chap. 14)

 

 

2

17/01

JDBC2, SQLJ

Transparents (Chap. 5)

 

 

3

24/01

Bases de données réparties

Transparents (Chap.18)

 

 

4

31/01

Développement d'applications de BD Web multi-couches

Transparents (Chap.15)

Article 1

10%

5

7/02

Bases de données orientées objet (OO)

Transparents (Chap.16)

 

 

6

14/02

Relationnel-objet

Transparents (Chap.17)

Article 2

10%

7

21/02

Entrepôts de données et techniques OLAP

Transparents (Chap.19)

 

 

8

7/03

Découverte de connaissances et fouille de données

Transparents (Chap. 19) NB 28/02 Relâche

Travail

pratique

 

10%

9

14/03

Organisations multidimentionnelles

Transparents (Chap. 9)

 

 

10

21/03

Gestion de données semi-structurées

Transparents (Chap. 20)

Ébauche

 

10%

11

4/04

Repérage de l’information

Transparents (Chap. 21) NB 28/03 Congé

 

 

12

11/04

Bases de données déductives

Document de travail, transparents (Chap. 22)

 

 

 

13

18/04

Présentations orales

Présentation

orale

 20%

14

25/04

Présentations orales

Rapport final

40%