A web semántica ten como obxectivo crear un medio universal para o intercambio de información baseado en representacións do significado dos recursos da Web, dun xeito intelixible para as máquinas. Con iso preténdese ampliar a interoperabilidade entre os sistemas informáticos e reducir a mediación de operadores humanos nos procesos intelixentes de fluxo de información. O precursor da idea, Tim Berners-Le, membro fundador do W3C, esfórzase en que a súa proposta da Web semántica sirva para ampliar a capacidade da World Wide Web mediante estándares, linguaxes de marcado e outras ferramentas aplicables ao seu tratamento.

Relación coa World Wide Web

editar

Na actualidade, a World Wide Web está baseada principalmente en documentos escritos en HTML, unha linguaxe de marcas que serve para crear hipertexto en Internet. HTML é válido para adecuar o aspecto visual do documento e incluír obxectos multimedia no texto (imaxes, esquemas de diálogo etc.). Pero dá poucas posibilidades para categorizar os elementos que configuran o texto máis aló das típicas funcións estruturais, como sucede con outras linguaxes de maquetación (tipo LaTeX).

HTML permite mediante unha ferramenta de visualización (como un navegador web ou un axente de usuario) mostrar por exemplo un catálogo de obxectos en venda. O código HTML deste catálogo pode explicitar aspectos como "o título do documento" é Ferretería Acme; pero non hai forma de precisar dentro do código HTML se o produto M270660 é unha "batería Acme", cun "prezo de venda ao público" de 200 €, ou se é outro tipo de produto de consumo (é dicir, é unha batería eléctrica e non un instrumento musical, ou un pucheiro). O único que HTML permite é aliñar o prezo na mesma fila que o nome do produto. Non hai forma de indicar "isto é un catálogo", "batería Acme" é unha batería eléctrica, ou "200 EUR" é o prezo. Tampouco hai forma de relacionar ambos datos para describir un elemento específico en oposición a outros similares no mesmo catálogo.

A Web semántica ocuparase de resolver estas deficiencias. Para iso dispón de tecnoloxías de descrición dos contidos, como RDF e OWL, ademais de XML, a linguaxe de marcas deseñado para describir os datos. Estas tecnoloxías combínanse para achegar descricións explícitas dos recursos da Web (xa sexan estes catálogos, formularios, mapas ou outro tipo de obxecto documental). Desta forma o contido queda desvelado, como os datos dunha base de datos accesibles por Web, ou as etiquetas inmersas no documento (normalmente en XHTML, ou directamente en XML, e as instrucións de visualización definidas nunha folla de estilos á parte). Estas etiquetas fan posible aos xestores de contidos interpretar os documentos e realizar procesos intelixentes de captura e tratamento de información.

Compoñentes da Web semántica

editar

Os principais compoñentes da Web semántica son as metalinguaxes e estándares de representación XML, XML Schema, RDF, RDF Schema e OWL. O OWL Web Ontology Language Overview describe a función e relación de cada un destes compoñentes da Web semántica:

  • XML achega a sintaxe superficial para os documentos estruturados, pero sen dotalos de ningunha restrición sobre o significado.
  • XML Schema é unha linguaxe para definir a estrutura dos documentos XML.
  • RDF é un modelo de datos para os recursos e as relacións que se poidan establecer entre eles. Achega unha semántica básica para este modelo de datos que pode representarse mediante XML.
  • RDF Schema é un vocabulario para describir as propiedades e as clases dos recursos RDF, cunha semántica para establecer xerarquías de xeneralización entre as devanditas propiedades e clases
  • OWL engade máis vocabulario para describir propiedades e clases: tales como relacións entre clases (p.ex. disxunción), cardinalidade (por exemplo "unicamente un"), igualdade, tipoloxías de propiedades máis complexas, caracterización de propiedades (por exemplo, simetría) ou clases enumeradas.

A usabilidade e aproveitamento da Web e os seus recursos interconectados aumentará grazas a:

  • Os documentos etiquetados con información semántica (compárese esta coa etiqueta de HTML, usada para facilitar o traballo dos robots). Preténdese que esta información sexa interpretada polo ordenador cunha capacidade comparable á do lector humano. O etiquetado pode incluír metadatos descritivos doutros aspectos documentais ou protocolarios.
  • Vocabularios comúns de metadatos (ontoloxías) e mapas entre vocabularios que permitan a quen elaboran os documentos dispoñer de nocións claras de como deben etiquetalos para que os axentes automáticos poidan usar a información contida nos metadatos (p.ex. o metadato "autor" teña o significado de "autor da páxina" e non o do "autor do obxecto descrito na páxina").
  • Axentes automáticos que realicen tarefas para os usuarios destes metadatos da Web semántica
  • Servizos Web (a miúdo con axentes propios) que provean de información aos axentes (por exemplo un servizo de garantías a quen un axente puidese consultar sobre se un comercio electrónico ten un historial de mal servizo ou de xerar correo lixo).

Os provedores primarios desta tecnoloxía son as URIs que identifican os recursos xunto con XML e os Espazos de nomes (namespaces). Se a isto engádese un pouco de lóxica, mediante unha RDF, ou outras tecnoloxías como os mapas temáticos e algo de razoamento baseado en técnicas de intelixencia artificial, a Web estará lista para alcanzar as aspiracións do seu inventor Tim Berners-Lee.

Véxase tamén

editar

Bibliografía

editar

Outros artigos

editar

Ligazóns externas

editar