algoritmo di clustering per trovare le pagine sintatticamente simili dal punto di vista navigazionale.
Ah, un po' mi manca il linguaggio accademico.. anzi no

Comunque si, Joomla memorizza tutta la struttura del sito nel database:
gli articoli nella tabella jos_content
le voci di menu in jos_menu
le categorie in jos_categories
le sezioni in jos_sections
e così via