next up previous contents
Next: L'approccio World Wide Web Up: Università degli Studi di Previous: Scopo del progetto   Contents


La struttura di archiviazione

La progettazione di una struttura di classificazione è uno dei primi passi per fornire una organizzazione efficiente e facilmente gestibile. In passato [Bec95] sono state studiate varie forme di indicizzazione, ma uno standard che tuttora è in uso e che si è rivelato adatto agli scopi è da considerasi l'LSM-Templates [KW94] (Linux Software Map). Questa calssificazione è stata originariamente sviluppata per indicizzare archivi sul sito Internet SunSITE2, un archivio di programmi per il sistema operativo Linux. È simile al formato Internet Mail Headers [Cro92], in cui abbiamo una coppia chiave-valore dove il valore può svilupparsi su più righe. Tale schema si presenta con dei modelli strutturati (templates) che contengono 12 attributi:

Purtroppo di rado si può trovare un utente disposto a classificare in maniera meticolosa gli archivi che inserisce nel sito ftp. Come conseguenza sono stati resi obbligatori alcuni campi, quali Title, Version, Entered-date, Description, che non possono mancare pena la rimozione del software caricato.

Questo insieme di attributi non è però sufficiente a fornire una traduzione uno a uno in un sistema relazione (DBMS). Non è infatti pensabile implementare tale schema in una sola grande tabella. Per questa ragione ho deciso di introdurre degli attributi addizionali che consentono di creare delle strutture tabellari più maneggevoli. Inoltre possono essere effettuate delle query più mirate che forniscono dei risultati di qualità migliore.

Seguendo l'esempio della RFC-822, i campi che non appartengono allo standard de facto LSM, iniziano con il prefisso X-:

Avendo a disposizione questi attributi (e pochi altri, vedi 6.1) si può facilmente costruire uno schema E-R che permette di relazionare gli archivi aventi un certo nome e destinati ad un particolare sistema operativo con un percorso all'interno del sito. Risulta così univoca la ricerca di risorse e si ha la possibilità di visualizzare tutti i dettagli inseriti.

Formalmente si tratta di definire i seguenti schemi fondamentali:

In questo modo, definendo come chiave esterna (foreign key) dell'entità primary-site la coppia (X-Filename, X-Os), abbiamo che l'archivio risulta determinato con tutti suoi dati caratteristici. Considerando gli attributi delle due tabelle come gli unici dati obbligatori per la classificazione dell'archivio e osservando che gli attributi Entered-date, X-Size, X-Unit possono essere determinati direttamente dal file caricato, si può sperare che l'utente compili abbastanza volentieri un piccolo questionario.


next up previous contents
Next: L'approccio World Wide Web Up: Università degli Studi di Previous: Scopo del progetto   Contents
Mirko Manea
2000-05-07