Per comprendere meglio i dati, cosa viene utilizzato nella ricerca per identificare che un sito è basato su Joomla!?
non credo ti possa aiutare a comprendere meglio i dati sapere come ho scovato i vari siti made in Joomla
Viene fatta una scansione del robots.txt per verificare la presenza di alcune stringhe riconoscibili sono nei siti Joomla, viene ricercata una determinata stringa nel sorgente della pagina, viene ricercato l'xml del file di lingua, viene richiamata una determinata icona ecc... ognuna di queste verifiche assume un punteggio così al termine della scansione di un elenco di siti riesco a ordinare la lista per quelli che hanno il punteggio più alto.
Ovviamente i siti che hanno punteggio pieno sono certamente Joomla, poi quelli che mano a mano hanno il punteggio più basso possono essere dubbi e vanno verificati manualmente.
Non è un metodo precisissimo, non mi becca se l'installazione di Joomla è in una sottocartella o sottodominio, se poi nel momento del test quel sito è momentaneamente down non viene rilevato ecc... quindi direi che le nostre stime sono sottodimensionate, mosti siti Joomla possono certamente essermi sfuggiti