Prima o poi doveva succedere che “semantics” diventasse una buzzword di tutto rispetto e che tutti cominciassero a lavorarci. Ecco che finalmente è giunto il momento, ed ecco che imperversa la discussione sui diversi approcci per esplicitare la semantica delle informazioni contenute nelle pagine html. Due sono gli ordini di problemi, il primo consiste nel trovare un modo di inserire (embed) informazione semanticamente strutturata nelle pagine HTML e il secondo consiste nell’estrarre questa informazione e trasformarla in un formato più facilmente manipolabile dagli strumenti Semantic Web (reasoners e triple stores). L’approccio naif della blogosfera al primo problema si è ormai da qualche tempo concentrato sui microformats che sono una soluzione decisamente povera e inefficiente dal punto di vista strettamente tecnico ma d’altra parte hanno il vantaggio dell’estrema semplicità. Il grosso punto a favore dei microformats è che (forse anche grazie alla loro semplicità, ma di certo c’entra anche la moda) vengono adottati da grandi players come Flickr, LinkedIn, Eventful e altri.
Dall’altra parte della barricata il w3c e la community dei ricercatori del Semantic Web propongono approcci più potenti come erdf e sopratutto rdfa.
Per quanto riguarda il secondo problema, quello dell’estrazione dei dati machine readable “nascosti” all’interno dell’html, si possono usare uno dei tanti parser di microformats disponibili, che sono però specifici per un dato tipo di microformats, oppure il recente GRDDL, una candidate recommendation del W3C che permette di ottenere un grafo RDF associando ad un documento XML un algoritmo di trasformazione (gli algoritmi di trasformazione possono essere espressi teoricamente in qualunque linguaggio, in pratica vengono espressi in XSLT. Probabilmente, come sostiene questo post, non sarebbe una cattiva idea che la specifica fosse limitata al solo utilizzo di xslt).
Volevo scrivere un breve post e invece sto rischiando di scrivere un articolo. Mi fermo quindi e approfondirò alcuni argomenti in un prossimo post. Fatemi solo dire che Firefox 3 supporterà nativamente i microformats…
13
04
2007

Entries (RSS)