ΠΕΡΙΓΡΑΦΗ ΕΡΕΥΝΑΣ


ΔΗΜΟΣΙΕΥΣΕΙΣ
 
 ΠΡΟΣΚΕΚΛΗΜΕΣ ΟΜΙΛΙΕΣ & ΕΚΠΑΙΔΕΥΤΙΚΑ ΣΕΜΙΝΑΡΙΑ (TUTORIALS)

ΔΙΕΘΝEIΣ ΣΥΝΕΡΓΑΣΙΕΣ

ΔΙΑΚΡΙΣΕΙΣ















Ερευνητική ομάδα: DB-NET (http://www.db-net.aueb.gr)
Τίτλος έργου: ΚΑΙΝΟΤΟΜΙΚΕΣ ΑΠΟΨΕΙΣ ΣΤΗΝ ΚΑΤΑΤΑΞΗ ΙΣΤΟΠΕΡΙΕΧΟΜΕΝΟΥ:
ΧΡΟΝΟΣ/ΤΑΣΕΙΣ, ΘΕΜΑΤΙΚΗ ΚΑΤΗΓΟΡΙΟΠΟΙΗΣΗ –
INNOVATIVE ASPECTS IN WEB CONTENT RANKING: TIME/TRENDS AND TOPIC CLASSIFICATION
Επιστημονικός υπεύθυνος: Μιχάλης Βαζιργιάννης
Ημερομηνία έναρξης έργου: 

Ημερομηνία περάτωσης έργου:
01/01/2005

31/12/2006
Φορέας Χρηματοδότησης: Συγχρηματοδότηση από το Υπουργείο Παιδείας και Θρησκευμάτων, σε ποσοστό 25%, και από την Ευρωπαϊκή Ένωση σε ποσοστό 75%
Προϋπολογισμός: 70.000, 00 €

ΣΥΝΤΟΜΗ ΠΕΡΙΓΡΑΦΗ ΑΝΤΙΚΕΙΜΕΝΟΥ ΤΗΣ ΕΡΕΥΝΑΣ

Η σημασία και ο όγκος του Παγκόσμιου Ιστού (ΠΙ) σαν πηγή δημοσίευσης αλλά και αναζήτησης πληροφορίας είναι ανυπολόγιστη καθώς έχει αναδειχθεί στην κύρια πηγή πληροφόρησης. Η αναζήτηση πληροφορίας γίνεται με βάση λέξεις κλειδιά και οι απαντήσεις έχουν μορφή λίστας ιστοσελίδων που ικανοποιούν τα κριτήρια αυτά με φθίνουσα σειρά σημαντικότητας. Η σημαντικότερη παράμετρος για την παραγωγή της απάντησης είναι αλγόριθμος κατάταξης (ranking) ιστοπεριεχομένου με βάση τα χαρακτηριστικά του γράφου του ΠΙ (π.χ. Pagerank στο Google). Παρόλη την επιτυχία των αλγορίθμων αυτών υπάρχουν κάποιες απόψεις/χαρακτηριστικά που κάνουν προβληματική την έγκαιρη και έγκυρη αξιολόγηση του περιεχομένου του ΠΙ. Οι απόψεις αυτές σχετίζονται με:
α)
τον χειρισμό χρονικών χαρακτηριστικών σελίδων (φρεσκάδα περιεχομένου/υπερσυνδέσμων, τάσεις αύξησης/μείωσης συνδέσμων από/προς σελίδες κλπ.), β) τον τεράστιο όγκο και δυναμισμό του γράφου ΠΙ ,
γ) την σημασιολογία/κατηγοριοποίηση των σελίδων.

Στόχος του έργου είναι η βελτίωση αλγορίθμων κατάταξης ιστοπεριεχομένου λαμβάνοντας υπόψη τα παραπάνω χαρακτηριστικά και υιοθετώντας τεχνικές στατιστικής μάθησης.
Το αναμενόμενο αποτέλεσμα είναι ένα πλαίσιο αλγορίθμων του τύπου που προαναφέρθηκε που θα κατατάσσουν ιστοπεριεχόμενο με έγκαιρο και έγκυρο τρόπο. Η ποιότητα των αποτελεσμάτων θα εξεταστεί με εκτεταμένα πειράματα σε μεγάλα σύνολα σελίδων και σε σύγκριση με άλλους αλγόριθμους. Επίσης θα αξιολογηθεί θεωρητικά και πειραματικά το υπολογιστικό κόστος των προσεγγίσεων.
Ειδικότερα οι στόχοι για κάθε ένα από τα προαναφερθέντα θέματα:
  • Χρονικές παράμετροι στην κατάταξη ιστοπεριεχομένου: θα αναπτυχθεί ένα πλαίσιο ανάλυσης συνδέσμων στον ΠΙ που θα λαμβάνει υπόψη του χρονικές απόψεις, όπως φρεσκάδα (στηριγμένη στις χρονοσφραγίδες των πιο πρόσφατων ενημερώσεων μιας σελίδας), δραστηριότητα (πχ. ρυθμός ενημέρωσης μιας σελίδας) και τάσεων (ρυθμός αύξησης / μείωσης εισερχόμενων συνδέσμων) ιστο-σελίδων και συνδέσμων.
  • Κατάταξη με βάση την θεματική κατηγοριοποίηση –Topic Biased Authority Rankings: Θεωρώντας τον αλγόριθμο Pagerank σαν ένα εργαλείο κατάταξης, ισχυριζόμαστε ότι εφόσον τα μονοπάτια τυχαίου περιπάτου περιοριστούν σε ένα θέμα, τότε η προκύπτουσα κατάταξη θα πρέπει να είναι πιο έγκυρη ως προς το συγκεκριμένο θέμα. Αυτό θα επιτευχθεί με την κατάλληλη προσαρμογή της πιθανότητας μετάβασης ανάλογα με την ομοιότητα ανάμεσα στις σελίδες πηγή και στόχο όσο αφορά στην θεματική τους κατάταξη.
Η μεθοδολογία έχει σαν στόχο την προσαρμοζόμενη τροποποίηση των πιθανοτήτων  μετάβασης (transition probability) και τυχαίας μετάβασης (random jump probability) στους αλγορίθμους τυχαίου περίπατου στον γράφο του ΠΙ σε μια προσέγγιση μαρκοβιανής διαδικασίας με βάση:
  • ιδιότητες που εξαρτώνται από το χρόνο: την φρεσκάδα μιας σελίδας και τον ρυθμό αύξησης / μείωσης των εισερχόμενων συνδέσμων,
  • την θεματική κατηγοριοποίηση μιας σελίδας ώστε ο τυχαίος περίπατος να συγκεντρώνεται σε θεματικά όμοιες σελίδες. Λόγω του τεράστιου όγκου και δυναμισμού του γράφου του ΠΙ θα αξιοποιηθούν τεχνικές στατιστικής μάθησης.
ΔΗΜΟΣΙΕΥΣΕΙΣ - http://www.db-net.aueb.gr/index.php/publications

Journals
  • M. Eirinaki, M. Vazirgiannis. "Web Site Personalization based on Link Analysis and Navigational Patterns", to appear in ACM Transactions on Internet Technology (TOIT) Vol.7, No.3.
  • K. Berberich, M. Vazirgiannis, and G. Weikum, "Time-aware Authority Ranking", in Internet Mathematics Journal 2(3) pp309-340, A K Peters.
  • M. Halkidi, D. Papadopoulos, V. Kalogeraki, D. Gunopulos, "Resilient and Energy Efficient Tracking in Sensor Networks", to appear in International Journal of Wireless and Mobile Computing.
 
Participation in Books 
  • M. Eirinaki, D. Mavroeidis, G. Tsatsaronis, M. Vazirgiannis, "Introducing Semantics in Web Personalization: The role of Ontologies", Book Chapter, to appear in LNCS/LNAI series, "Semantics, Web, and Mining", edited by: Ackerman, Berendt, Grobelnik, Hotho, Mladenic, Semeraro, Spiliopoulou, Stumme, Svatek, van Someren.
  • M. Halkidi, M. Vazirgiannis, "Quality Assessment Approaches In Data Mining", to appear in the Data Mining and Knowledge Discovery Handbook: A Complete Guide for Practitioners and Researchers", by Kluwer Academic Publishers.
 Conferences
  • A. Vlachou, M. Vazirgiannis, K. Berberich. "Representing and quantifying rank - change for the Web Graph". In Proceedings of the Fourth Workshop on Algorithms and Models for the Web-Graph (WAW2006), Banff, Canada, November 2006.
  • M. Vazirgiannis, K. Noervaag, C. Doulkeridis. "Peer-to-Peer Clustering for Semantic Overlay Networks (invited paper)".In Proceedings of the Sixth International Workshop on Pattern Recognition in Information Systems (PRIS), co-located with ICEIS 2006. Cyprus, May 2006.
  • C. Doulkeridis, K. Noervaag, M. Vazirgiannis."The SOWES Approach to P2P Web Search using Semantic Overlays".In Poster Proceedings of the 15th World Wide Web Conference (WWW'06), May 2006.
  • M. Halkidi, V. Kalogeraki, D. Gunopulos, D. Papadopoulos, D. Zeinalipour-Yazti, M. Vlachos. "Efficient Online State Tracking Using Sensor Networks". In the proceedings of the 7th International Conference on Mobile Data Management (MDM'06), Nara, Japan, May 2006.
  • K. Berberich, S. Bedathur, M. Vazirgiannis, G. Weikum, "BuzzRank ... and the Trend is your friend". In Poster Proceedings of the 15th World Wide Web Conference (WWW'06).
  • K. Berberich, M. Vazirgiannis and G. Weikum, "T-Rank: Time-aware Authority Ranking". In Proceedings of the 3rd Workshop on Algorithms and Models for the Web-Graph (WAW), in conjunction with FOCS, Rome, Italy.
  • M. Eirinaki, M. Vazirgiannis, D. Kapogiannis, "Web Path Recommendations based on Page Ranking and Markov Models". In Proceedings of the ACM Web Information and Data Management (WIDM) Ψonference,  Bremen, Germany, 2005
  • C. Doulkeridis, V. Zafiris, M. Vazirgiannis, "The Role of Caching and Context-Awareness in P2P Service Discovery,". In Proceedings of the 6th International Conference on Mobile Data Management (MDM'05), Cyprus, May 2005.
  • G. Tsatsaronis, R. Pitkanen, M. Vazirgiannis. "Clustering for Ontology Evolution". In proceedings of the 29th Annual Conference of the German Classification Society (GfKl ), 2005.
  • C. Doulkeridis, N. Loutas, M. Vazirgiannis. "A System Architecture for Context-Aware Service Discovery".  In Proceedings of the International Workshop on Context for Web Services (CWS'05) (Held in conjunction with the 5th International and Interdisciplinary Conference on Modeling and Using Context), Paris, France.
  • M. Halkidi, D. Gunopulos, N. Kumar, M. Vazirgiannis, and C. Domeniconi. "A Framework for Semi-Supervised Learning based on Subjective and Objective Clustering Criteria". In Proceedings of the IEEE International Conference on Data Mining (ICDM), 2005.
  • M. Halkidi, M. Vazirgiannis. "NPClu: An Approach for Clustering Non-point Objects". In Proceedings of the ECML/PKDD Workshop on Mining Spatio-Temporal Data (MSTD), Portugal, October, 2005.
  • M. Eirinaki, M. Vazirgiannis. "Usage-based PageRank for Web Personalization". In Proceedings of the IEEE International Conference on Data Mining (ICDM), November 2005, Houston, Texas.
  • D. Mavroeidis, G. Tsatsaronis, M. Vazirgiannis, M. Theobald, G. Weikum. "Word Sense Disambiguation for Exploiting Hierarchical Thesauri in Text Classification". In Proceedings of the European Conferences on Machine Learning(ECML) /Principles and Practice of Knowledge Discovery(PKDD), Portugal, 2005.
Technical Reports
  • Magdalini Eirinaki, Michalis Vazirgiannis, "UPR: Usage-based Page Ranking for Web Personalization", in Proc. of the 5th Hellenic Data Management Symposium (HDMS), Thessaloniki, Greece, 2006.
  • M. Eirinaki. Web Mining: Aroadmap".

  ΠΡΟΣΚΕΚΛΗΜΕΝΕΣ ΟΜΙΛΙΕΣ  & ΕΚΠΑΙΔΕΥΤΙΚΑ ΣΕΜΙΝΑΡΙΑ (TUTORIALS)

ΔΙΕΘΝΕΙΣ ΣΥΝΕΡΓΑΣΙΕΣ
ΔΙΑΚΡΙΣΕΙΣ
  • MARIE CURIE Intra-European Fellowship - "NGWeMiS - Next Generation Web Mining & Searching". Fellow: Dr Michalis Vazirgiannis
  • MARIE CURIE Outgoing Intrenational Fellowship.- "New Techniques for Handling Quality and Uncertainty in Spatial Mining". Fellow: Dr Maria Halkidi