Arquitectura de la Información y Desarrollo Web Avanzado: octubre 2011

jueves, 27 de octubre de 2011

10.- Estructura de carpetas y archivos

La correcta estructuración de las carpetas y archivos del sitio web es un factor clave para su buena comprensión y gestión por parte de su administrador, desarrollador y arquitecto de la información. Existe una serie de carpetas y archivos cuyas denominaciones no deberían variar, ya que tener unas convenciones básicas es el principio de toda normalización. La estructura de un sitio web estático podría ser similar a la que se presenta en la tabla1.

Estructura típica de una web estática
	css	Almacena todos los archivos de estilo CSS.
	documents	Se ubican todos los tipos de documentos, archivos y páginas HTML.
	images	Se guardan todas las imágenes de tipo ilustrativo que acompañan al contenido.
	interface	Se guardan todos los gráficos utilizados en el interfaz visual del sitio web.
	java	Carpeta en la que se guardan los archivos applet de java.
	index.html	Página principal e inicial del sitio web a partir de la cual se accede a todos los contenidos.

Tabla1. Muestra de estructura básica de un sitio web estático

En cambio cuando se desarrolla un sitio web dinámico, especialmente si se codifica con lenguaje PHP o similar, la organización de los contenidos puede variar notablemente. Por ejemplo se crean carpetas específicas para las funciones básicas del sitio web, para los módulos y extensiones que se añadan así como para los archivos de instalación. El concepto es completamente diferente incluso en el caso de los archivos, por ejemplo los archivos contenidos en la carpeta functions, deberían tener un prefijo "func.nombre.php" para especificar que pertenecen a dicha carpeta. Lo mismo ocurre con los módulos con el prefijo "mod.nombre.php", véase tabla2.

Estructura típica de una web dinámica
	css	Almacena todos los archivos de estilo CSS.
	documents	Se ubican todos los tipos de documentos, archivos y páginas HTML.
	images	Se guardan todas las imágenes de tipo ilustrativo que acompañan al contenido.
	interface	Se guardan todos los gráficos utilizados en el interfaz visual del sitio web.
	java	Carpeta en la que se guardan los archivos applet de java.
	functions	Carpeta que almacena las distintas funciones básicas del sitio web, como por ejemplo páginas de resultados, páginas con interfaz de consulta, funciones de login para los usuarios, funciones de edición de artículos y publicaciones, gestión de contenidos del sitio web, etc. Los archivos contenidos deberían tener la forma "func.nombre.php", es decir, prefijo identificativo del tipo de archivo o programa, más el nombre del archivo, más la extensión en este caso propia del lenguaje de programación dinámico PHP.
	modules	Formada por los distintos módulos y extensiones, ó añadidos de las funciones básicas del sitio web. Por ejemplo un módulo para la traducción del sitio web, módulo gestión de archivos vía webftp, módulo de gestión de plantillas CSS para el sitio web, etc. Los archivos contenidos deberían tener la forma "mod.nombre.php", es decir, prefijo identificativo del tipo de archivo o programa, más el nombre del archivo, más la extensión en este caso propia del lenguaje de programación dinámico PHP.
	install	En los sitios web más avanzados como los CMS suele ser necesario efectuar un proceso de instalación y configuración previa, antes de su uso. Los archivos que hacen posible el funcionamiento del proceso de instalación suelen guardarse en la carpeta install.
	index.php	Página principal e inicial del sitio web a partir de la cual se accede a todos los contenidos. El único cambio que se produce con respecto a la estructura de la web estática es el tipo de archivo, la extensión y el lenguaje de programación utilizado.
	inc.head.php	Es muy frecuente que la página principal o inicial del sitio web esté compuesta por distintos fragmentos. La capacidad modular de PHP unido al potencial de las capas CSS para estructurar la información, hacen que el encabezamiento de la página se particione generando el archivo "inc.head.php". El prefijo inc, indica que se trata de un "include" o añadido que se ensambla con la página principal. Seguido de un punto se indica el componente head y finalmente la extensión del archivo.
	inc.menu.php	Al igual que en el caso de la cabecera el menú también se modula para formar parte de un archivo más del ensamblaje final de la página principal.
	inc.foot.php	El pie de página también mantiene el mismo modelo de parcelación visto en el encabezado y el menú. Con todos estos componentes se configura no sólamente la página inicial, sino cualquier otra página del sitio web manteniendo en todo momento la estética, organización, contextualidad y base estructural.

Tabla2. Muestra de estructura básica de un sitio web dinámico

09.- Estilo de enlaces, menús y vinculación de archivos CSS

Enlaces

Los enlaces constituyen la base de la hipertextualidad en el sitio web. Desde el punto de vista de la arquitectura de la información deben proporcionar toda la información que sea posible en relación a su título o descripción, idioma de la página de destino y marco o página en la que será cargado el enlace. Ello se consigue con la sintaxis que se muestra en la tabla1.

<a href='dirección URL del enlace' target='página de destino' hreflang='código de idioma ISO 639-1' title='título o descripción del enlace' rel='relación entre el documento y el recurso enlazado'>nombre de enlace</a>

Tabla1. Enlace en HTML con todos sus atributos

Para asignar estilos a los enlaces se necesita utilizar CSS y señalar las propiedades para los 4 posibles estados en los que se puede encontrar un enlace. 1) estado (a:link) el enlace en estado normal; 2) estado (a:visited) el enlace fue visitado por el usuario; 3) estado (a:hover) cuando el cursor se mueve por encima del enlace; 4) estado (a:active) cuando el usuario presiona sobre el enlace sin soltar el botón del ratón. Todos estos estados se pueden definir, tal y como se muestra en la tabla2.

a:link       { color: #224a6a; font-size: 12px; font-family: arial; } 

a:visited { color: #236b6a; font-size: 12px; font-family: arial; } 

a:hover    { color: #4497da; font-size: 12px; font-family: arial; } 

a:active  { color: #44c5da; font-size: 12px; font-family: arial; }

Tabla2. Enlaces con estilos CSS

El resultado de aplicar los estilos de la tabla2 a una lista de enlaces es el ejemplo presentado en el modelo1 de enlaces, que guarda todas las reglas y recomendaciones propuestas para la arquitectura de la información y su mayor accesibilidad.

Modelo1 de enlaces. Descargar página

Pero puede suceder el caso de que se necesiten distintos estilos de enlaces en la misma página. El problema de diferenciar distintos estilos en CSS y aplicarlos en los enlaces se resuelve, añadiendo un identificador para cada tipo de enlace, véase tabla3.

a:link.enlace1    { color: #224a6a; font-size: 12px; font-family: arial; } 

a:visited.enlace1 { color: #236b6a; font-size: 12px; font-family: arial; } 

a:hover.enlace1    { color: #4497da; font-size: 12px; font-family: arial; } 

a:active.enlace1  { color: #44c5da; font-size: 12px; font-family: arial; }

Tabla3. Diferenciando dos estilos de enlaces

De esta forma, véase modelo2 de enlaces, se consigue crear tantos estilos de enlaces como fueren necesarios para una o muchas páginas distintas. Este método resulta de gran importancia cuando se diseñan menús con CSS, ya que a menudo en una misma página conviven múltiples estilos que atañen a muy diversas formas gráficas que adpotan los enlace.

Modelo2 de enlaces. Descargar página

Menús

Desde los comienzos de los primeros sitios web hasta la fecha una de las constantes que más preocupaciones causaron fue el asunto de los menús. Se han diseñado complejos menús en Java, Applets, sofisticados menús en Flash, Shockwave, pero en ninguno de los casos, resultaban accesibles, sencillos y suficientemente bien estructurados como para ser indexados con facilidad por cualquier webcrawler. Por ello en arquitectura de la información se aboga por un diseño lo más sencillo posible que favorezca una fácil lectura, con contraste adecuado, una correcta visibilidad, gran limpieza, simplicidad, funcionalidad y una coloración agradable en tonos fríos-mates-nobrillantes-opacos-escalares-gradientes-suaves-pasteles-grisaceos-blanquecinos-claros.

Modelo de menú horizontal. Descargar página

Modelo de menú desplegable vertical. Descargar página

Modelo de menú lateral. Descargar página

Vinculación de archivos CSS

En todos los ejemplos vistos hasta el momento, los códigos de estilo CSS están integrados en las páginas HTML. A modo de ejemplo es muy útil dicha disposición, pero en la vida real, lo normal es referenciar en el documento HTML el archivo CSS que contiene todos los estilos que se utilizarán a lo largo del sitio web. El código para su referenciación es el que se muestra en la tabla4. Como se puede observar no sólamente es posible enlazar un único archivo, pueden agregarse tantos como fueren necesarios. Ello dependerá del tipo de estilos o el uso de los estilos en cada archivo CSS. Por ejemplo un estilo1.css puede encargarse de la maquetación general del sitio. El estilo2.css se dedica a la presentación de textos y contenidos publicados y finalmente un estilo3.css para las distintas propiedades de los menús del sitio web.

<html> 

<head>

<title></title> 

<link rel='stylesheet' type='text/css'
href='css/estilo1.css'/>

<link rel='stylesheet' type='text/css'
href='css/estilo2.css'/>

<link rel='stylesheet' type='text/css'
href='css/estilo3.css'/>

</head>

<body> 

</body>

</html>

Tabla4. Vinculación de archivos CSS

viernes, 21 de octubre de 2011

08.- Representación de resultados e interfaz de búsqueda

El proceso de representación y visualización de resultados le sigue al proceso de recuperación de información en el que el buscador resuelve los documentos más pertinentes a la consulta del usuario. Las implicaciones que se derivan de la presentación de los resultados de la consulta son claves en arquitectura de la información. ¿Cómo representar la información?

Qué campos y tipos de datos deben ser visualizados

Para los usuarios que conocen el resultado exacto, se muestran los datos esenciales, representativos de cada respuesta, como por ejemplo el autor y el título en cada registro.
Para usuarios con mayor desconocimiento se recomiendan campos descriptivos como por ejemplo el resumen, las palabras clave, señalización de los términos en los párrafos.
Cuando los campos con datos esenciales no ayudan a discernir correctamente se recomienda la introducción de otros, como por ejemplo la fecha o año de publicación, registro o fecha de actualización, localización, etc.

Cuántos documentos se deben mostrar

Si la descripción de los documentos recuperados es amplia se recomienda mostrar menos resultados. En caso de ser más escueta se recomienda mostrar más resultados. También ello puede depender de terceros factores como por ejemplo la resolución para la que está optimizada la página de resultados o el navegador web que se esté empleando.
Siempre que sea posible se deberán mostrar el número total de resultados obtenidos en cada consulta de forma tal que el usuario pueda valorar si realmente desea efectuar una navegación a través de todos ellos.
Lo común es mostrar tandas de 10, 25, 50 o 100 resultados por página. También se deberá permitir su ajuste personalizado.

Listado de resultados

Ordenación alfabética de los resultados. Los títulos de los resultados no alfabetizarán por artículos determinados, indeterminados o preposiciones.

Ordenación cronológica de los resultados. Utilizado para aquellos resultados relacionados con la publicación de noticias o información periódica y contínua.

Ordenación de los resultados por relevancia. La relevancia de los resultados depende de la frecuencia de aparición u ocurrencias de los términos de consulta, presentes en el documento, de la proximidad de los términos o su adyacencia en la misma frase o párrafo, del campo en el que fue encontrado el término de la consulta (título, resumen, subtítulo o cuerpo del documento), de la popularidad del documento después de ser valorado por el usuario. Finalmente en este proceso también intervienen factores como la heterogeneidad de la colección (Cuanto más dispar, más dificultad para recuperar con relevancia) y el método de indexación de los textos y términos que componen el corpus documental.

Ordenación de los resultados por popularidad. Implica un proceso de ponderación de los resultados en función de los enlaces externos que recibe cada recurso. Cuantos más enlaces referencian el recurso, más conocido y mejor valorado por los usuarios. Este tipo de algoritmos conocidos como rango de páginas tiene su mejor en el PageRank.

Ordenación de los resultados según experiencia del usuario. El usuario se encarga de calificar los recursos en función de la experiencia y utilidad de los mismos para el desempeño de sus actividades, tales puntuaciones se suman y concretan en un valor numérico como por ejemplo número total de valoraciones y máxima calificación. Tales datos suelen estar acompañados por mecanismos de comentarios y etiquetado social.

Ordenación por pago de emplazamiento. Cuando la aparición en las primeras posiciones de los rankings no se deben a ninguno de los motivos anteriormente expuestos, cabe la posibilidad de que el resultado fuera emplazado en esa posición mediante pago, se trata del factor económico. Aparecer entre los primeros resultados supone una mayor visibilidad y esto es aprovechado por muchos usuarios y empresas para promocionar sus servicios y productos. A este modelo se le conoce por sus siglas PFP (pay for placement)

Agrupación de resultados

La clasificación de los contenidos del corpus documental permite su agrupación, así como la contextualización de las consultas que efectúa el usuario en el sistema. Ofrecer al usuario grupos de resultados por temas releventes a su consulta le ayuda a discernir o desambigüar el sentido de su consulta y por lo tanto a encontrar antes la información que demanda. Esto se consigue mostrando un listado de categorías temáticas, con la indicación de la cantidad de resultados obtenidos en cada una de ellas. Pero también pueden agruparse contenidos en torno al tipo de documento (o tipo MIME), rangos en las fechas de publicación o a través de sus metadatos.

Exportación de resultados

Una vez se encuentra la información, se requieren opciones generales de exportación, impresión, envío por correo de los contenidos, opciones para seleccionar y guardar resultados así como alertas RSS.

Interfaz de búsqueda
El interfaz de búsqueda hace posible un lenguaje visual fácilmente comprensible para el usuario con el que poder emitir las órdenes y requerimientos de su consulta y necesidades informativas. Desde el punto de vista de la arquitectura de la información, el reto es presentar las opciones de búsqueda con un interfaz adaptado a cada situación, por ejemplo:

El nivel de experiencia del usuario y la motivación de la búsqueda. Están familiarizados los usuarios con los lenguajes de interrogación y consulta como por ejemplo los operadores booleanos o prefieren emplear el lenguaje natural, necesitan ayudas contextuales para refinar las consultas, qué nivel de precisión necesitan para satisfacer sus necesidades, que nivel de exhaustividad requieren en los resultados, cuántas veces están dispuestos a reformular la consulta o hasta qué punto están dispuestos a navegar entre las páginas de resultados.

Tipo de necesidad de información. Necesitan información para la toma de decisiones, qué tipo de detalles se necesitan proporcionar de cada documento o resultado para satisfacer esa demanda.

Tipo de información que se busca. Se requiere una información estructurada por campos, tabulada o a texto completo, en qué formatos, con qué grado de actualización.

Cantidad de información que se busca. Mostrar demasiada información puede abrumar al usuario, pero informarle en todo caso puede proporcionarle un alivio y una garantía de control en la representación y visualización de la información, por lo que dotar al interfaz de consulta de dicho control puede suponer

En función de tales factores y casos, se diseña el interfaz de consulta o de control del motor de búsqueda, desde la estrategia de búsqueda por defecto, pasando por la que defina el usuario, hasta los campos, botones y selectores que posibilitan efectuar búsquedas booleanas, definir los formatos que se desean recuperar o el calendario que permite identificar las fechas extremas de la consulta. Todos estos elementos son los componentes de la interfaz de búsqueda.

Componentes de la interfaz de búsqueda

Caja de consulta. Es el espacio desde el que se transmite la petición del usuario en forma de cadena de texto. Siempre está acompañada de un botón que emite la orden de consulta, desencadenando todo el proceso de búsqueda. El usuario suele dar por hecho que con utilizar los términos que describan su necesidad informativa, el motor de búsqueda hará el resto del trabajo, ó que no es necesario introducir operadores booleanos, ó que no hay que preocuparse por introducir términos ambigüos o sinónios, ó que no va a perder tiempo buscando más que por el campo principal de búsqueda (es decir la caja de texto), ó bien que la consulta buscará en todos los documentos en su texto completo. Esta serie de actitudes, no educan ni enseñan nada al usuario y es por ello que después de la primera búsqueda es aconsejable recordar que tienen a su disposición métodos de refinamiento, sugerencias con otras cadenas de consulta correctamente escritas, siendo ese momento en el que aprenden y reformulan la consulta (Que es uno de los objetivos cuando no se encuentra la información directamente). Con cada movimiento y reformulación el sistema es capaz de conocer mejor el objeto de la consulta y probablemente pueda ser mejor refinado. En cuanto al posicionamiento de la caja de consulta, puede variar dependiendo del tipo de sitio web de que se trate. Por ejemplo un buscador lo situará en lugar preferentemente central, pero un sitio web con otro tipo de contenidos tenderá a situarlo en la misma barra de navegación global o dentro del menú contextual.
Búsqueda avanzada. Consiste en una página con funcionalidades de control del motor de búsqueda, en las que un usuario especializado o no satisfecho con el módo de consulta básico puede refinar una consulta para encontrar información más precisa. Aunque el porcentaje de usuarios potenciales de este componente es altísimo, el porcentaje que realmente utiliza la búsqueda avanzada es bajo. La tendencia es proporcionar junto con los resultados de la primera búsqueda las opciones de refinamiento propias de la búsqueda avanzada. En todo caso la forma de la búsqueda avanzada es un conjunto de campos o cajas de consulta para especificar términos obligatorios, no presentes, de relevancia, especificación geográfica, idiomática, búsqueda por frase exacta, especificación del rango de fechas, etc.
Repetición de consulta original. Se trata de mostrar al usuario dentro de una capa o área concreta de la página de resultados, su propia consulta. El objeto de ello es evitar que olvide los términos de su consulta y permitir la reformulación de su consulta.
Cuando todo falla. Qué ocurre si el sistema no proporciona ningún resultado al usuario. Sería recomendable mostrarle sugerencias de consulta que lo redireccionen a terceros resultados con el fin de que encuentre de nuevo el camino, vestigio o pista de su necesidad informativa. Pero también puede ocurrir que todo falle cuando se recuperan miles o millones de resultados y el usuario necesite reducir notablemente su número, es decir, encontrar dentro del pajar la aguja. La forma de ayudar a su resolución es revisar la búsqueda, asesorar al usuario sobre cómo refinar, enfocar su reformulación con la navegación de la página, o contactar con un asistente para su consulta.

jueves, 20 de octubre de 2011

07.- Diseño de estructuras web con capas y CSS: layouts

Para diseñar la estructura de una página web, existen diversos métodos:

Uso de marcos o frames para separar los distintos espacios del sitio web. Implica el uso de las etiquetas <frameset>, véase tabla1. Este modelo muy popular en los primeros desarrollos de la web, posteriormente ha sido desechado debido a las dificultades de accesibilidad que presentaba y a los problemas de redimensionamiento y correcta visualización en los navegadores. No es aconsejable utilizar este modelo.

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Frameset//EN" "http://www.w3.org/TR/html4/frameset.dtd">

<html>

<head>

<title>Estructura con frames</title>

</head>

<frameset cols="30%, 70%">

  <frameset rows="100, 200">

      <frame src="contenido1.html">

      <frame src="contenido2.html">

  </frameset>

  <noframe>

  <ul>

  <li><a href="content1.html">contenido primero</a></li>

  <li><a href="content2.html">contenido segundo</a></li>

  </ul>

  </noframe>

</frameset>

</html>

Tabla1. Estructura web basada en marcos o frames.

Uso de capas <div> con estilos CSS para definir distintas áreas, se puede considerar el método de mayor éxito y que mejor resuelve los problemas de accesibilidad y estructuración de un sitio web, véase tabla2. La estructura puede ser perfectamente redimensionable y totalmente adaptable a cualquier caso. El estilo definido siempre es interpretado por todos los navegadores web.

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">

<html>

<head>

<title>Estructura con capas y CSS</title>

<style>

.capa1 {width: 30%;

    height: 500px;

    float: left;

    background-color: #800000;}

.capa2 {width: 70%; 

    height: 500px;

    float: left;

    background-color: #273a53;}

</style>

</head>

<body>

<div class='capa1'></div>

<div class='capa2'></div>

</body>

</html>

Tabla2. Estructura web basada en capas.

Uso de <iframe> y capas <div>. Puede ocurrir que se utilice un método mixto para estructurar los contenidos. Los iframes son marcos parecidos a los frames, con la diferencia de que no dividen la pantalla vertical u horizontalmente. Lo que se obtiene es una ventana dentro de la capa <div> que la soporta, permitiendo en todo caso un mayor control de accesibilidad y redimensionamiento que el primer caso expuesto. Otras ventajas derivadas es la posibilidad de cargar contenidos direccionados desde los enlaces de los distintos menús de forma sencilla, véase tabla3.

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">

<html>

<head>

<title></title>

<style>

.capa1 {width: 100%;

    height: 150px; 

    clear: both; 

    background-color: #364d35;}

.capa2 {width: 30%;

    height: 500px; 

    float: left; 

    background-color: #800000;}

.capa3 {width: 70%; 

    height: 500px; 

    float: left; 

    background-color: #273a53;}

</style>

</head>

<body>

<div class='capa1'>Encabezamiento</div>

<div class='capa2'>

<ul>

  <li><a href='contenido1.html' target='hud'>enlace1</a></li>

  <li><a href='contenido2.html' target='hud'>enlace2</a></li>

  <li><a href='contenido3.html' target='hud'>enlace3</a></li>

</ul>

</div>

<div class='capa3'>

<iframe src='contenido0.html' name='hud' id='hud'></iframe>

</div>

</body>

</html>

Tabla3. Estructura web basada en capas e iframe.

Estructuras o disposiciones de sitios web

Modelo1. Descargar página

Modelo2. Descargar página

Modelo3. Descargar página

Modelo4. Descargar página

Modelo5. Descargar página

Modelo6. Descargar página

Modelo7. Descargar página

Práctica2. Planificación y desarrollo del sitio web: primeros pasos

Se tratará de concretar la temática del sitio web, área de trabajo, fuentes de información, contenidos a utilizar, estructura de secciones, categorías, subcategorías, vocabularios controlados y bosquejo del proyecto de sitio web. De esta forma el marco de trabajo quedará definido desde el comienzo para sucesivas prácticas de edición web.

Descargar Práctica2. Planificación y desarrollo del sitio web

Herramientas para la edición web y próximas prácticas

Para el correcto desarrollo de las prácticas, se utilizarán principalmente dos editores web. Por un lado Dreamweaver y por otro Eclipse. El primero está pensado para la edición de sitios web a partir de un interfaz gráfico de opciones y herramientas que permiten escribir el código sin un conocimiento profundo en HTML, CSS, Javascript, etc. El segundo implica un conocimiento más exhaustivo de la programación web, ya que no dispone de asistencia a base de plantillas con código preprogramado, tal como sucedería con Dreamweaver. El mejor editor para trabajar edición web es Eclipse dada su capacidad para adaptarse a la programación en cualquier lenguaje y a la simplicidad de su método de trabajo y soporte. En cambio Dreamweaver se recomienda al comienzo del proceso de aprendizaje de la edición web.

Macromedia Dreamweaver
http://www.adobe.com/es/products/dreamweaver.html

Eclipse PDT
http://www.eclipse.org/

Para resolver las primeras prácticas se propondrá el uso de la herramienta Dreamweaver, de tal forma que se adquiera el método de edición y la experiencia necesaria antes de probar el editor Eclipse. En ambos casos constituyen herramientas de edición y construcción completa de un sitio web.

Otras herramientas importantes

A parte de los editores web con los que se articula toda la construcción web, su programación y código, se recomienda el empleo conjunto de otras herramientas de diseño como por ejemplo Corel Paint Shop Pro, Fireworks o Photoshop, que permiten la edición y diseño de gráficos para el sitio web. Por otro lado herramientas para elaborar paletas de colores normalizadas para todo el sitio web, como por ejemplo Color Code Tool.

Corel Paint Shop Pro
http://www.corel.com/servlet/Satellite/ca/en/Product/1150981051301

Macromedia Fireworks
http://www.adobe.com/es/products/fireworks.html

Adobe Photoshop
http://www.adobe.com/es/products/photoshop.html

Colour Lovers Palette Editor
http://www.colourlovers.com/palettes/add

HTML Color Code Tool
http://www.computerhope.com/cgi-bin/htmlcolor.pl

viernes, 14 de octubre de 2011

06.- Sistemas de búsqueda

Antes de instalar un buscador en el sitio web...

¿Tiene el sitio web suficiente contenido como para requerir un buscador?

Determinar un número suficiente de páginas y contenidos para integrar un buscador. Por ejemplo entre 500 y 1000 páginas.
Información muy especializada puede ser suficiente motivo para requerir un buscador, ya que esta puede ser demandada con frecuencia y en poco tiempo por el usuario.
Si el sitio web tiende a parecerse a una biblioteca más que a un sitio web liviano, será muy necesario introducir el buscador que facilite la recuperación de la información.

¿Interesa más invertir recursos en un mejor buscador o en un mejor sistema de navegación?

Un buscador no es la solución para los problemas de navegación de un sitio web. Antes de incorporar ningún buscador es necesario arreglar tales problemas.
Cuando el sitio web consta de un lenguaje controlado para clasificar la información y documentación, la implantación del buscador es más sencilla y su funcionamiento más eficiente.

¿Tiene tiempo y conocimientos para optimizar el sitio de búsqueda?

Un motor de búsqueda resulta sencillo de poner en marcha, pero su implementación y configuración no lo son tanto. En este sentido una buena aplicación e interfaz ayudan al usuario a controlarlo adecuadamente. Un aspecto y otro implican un trabajo de programación y edición integral del buscador para afinarlo a las necesidades del usuario.

¿Hay mejores alternativas?

Cuando no se tienen los conocimientos técnicos necesarios para editar un buscador o configurarlo adecuadamente, o bien no se dispone de fondos para contratar a un especialista que lo haga, sólo quedan dos alternativas; 1) encontrar un buscador más sencillo de instalar y configurar, 2) editar un índice de todos los contenidos del sitio web.
Elegir bien el buscador es importante, no siempre el más potente es el que mejor se adapta a las necesidades del sitio web y de los usuarios o el que mejor relación sencillez/efectividad tiene. Por lo tanto el motor de búsqueda que se instale debería ser fácilmente instalable y configurable, tener una eficacia en la recuperación razonable y ser amigable en su interfaz y representación de resultados para el usuario.

¿Los usuarios prefieren navegar a buscar?

Puede ocurrir que el tipo de usuario concurrente del sitio web prefiera navegar a utilizar el buscador, o bien el buscador es el último recurso. Esto ocurre cuando los sitios web no tienen un gran crecimiento. Pero cuando el sitio web crece desorbitadamente, puede llegar un momento en el que la navegación habitual pueda llegar a desaparecer hasta quedar sustituida por un prominente sistema de busqueda, destacado de todo el sitio.

¿Se pretende crear un buscador para unir y enlazar sitios fragmentados?

Cuando un sitio web está partido en diversos micrositios un buscador puede ser una buena solución para integrarlos y recuperar en cada uno de ellos indistintamente. Esto permite que el usuario conecte con temas o áreas que le son desconocidas, aportando un poco de coherencia a su periplo.
No obstante aunque ello pudiera ser la solución, sólo lo es en parte para el usuario pero no para el administrador de todos los contenidos publicados en dichos sitios fragmentados.

Considerar el buscador como una herramienta de aprendizaje para el usuario

Mediante sistemas de evaluación y recogida de datos, se puede estudiar el comportamiento del usuario durante su sesión de consultas con el motor de búsqueda. Recuérdese el método de querylogs.

Si los usuarios esperan un buscador se deberá incorporar

Aunque la tesis del administrador diga lo contrario, el usuario es quien manda a la hora de introducir los sistemas de búsqueda y recuperación de información. Si se espera dicho servicio, será necesario incluirlo.

Controlar la información y contenidos dinámicos

Si los contenidos son muy dinámicos, puede ser imprescindible el uso de un buscador que permita al usuario encontrar el último minuto o la última hora de lo que se está publicando. Esto significa indexar los contenidos para una recuperación rápida y efectiva.

Elegir dónde buscará el motor

Determinar dónde debe buscar el motor de búsqueda puede implicar la indexación de todos los textos del sitio web o un determinado área, para ganar eficacia y especialización en la recuperación. Dependiendo de la heterogeneidad de los sitios web y de las bases de datos con las que están compuestos así dependerá la estrategia de selección de objetivos para el buscador. También existen otros aspectos que elegir, por ejemplo los formatos de datos que el sistema indexará (HTML, XML, PDF, DOC, PPT, etc.) o qué campos de la base de datos tomará en cuenta para almacenar y recuperar la información a texto completo.

Las zonas de búsqueda

Son subconjuntos que han sido indexados de manera particular y por separado del resto del sitio web de tal forma que cuando el usuario navega y entra en el área o categoría específica, el buscador varía de contenidos generales a otros mucho más específicos, permitiéndole encontrar información de forma más precisa.
Los factores que determinan las zonas de búsqueda son: el tipo de contenido, el público objetivo, las funciones del sitio, las categorías y subcategorías temáticas, el origen geográfico, la datación cronológica, el autor y el departamento, negociado, grupo de trabajo o unidad administrativa.
No obstante el establecimiento de zonas de búsqueda puede tener contraindicaciones, por ejemplo puede entrañar dificultades de interactuación para el usuario ya que el contenido al estar parcelado requiere de un proceso de navegación y de consulta continuado.

Navegación y páginas de destino

Los sitios web contienen dos grandes tipos de páginas. Por un lado aquellas destinadas a la navegación y redirección del usuario y aquellas páginas que portan el contenido que finalmente desea encontrar el usuario, también denominadas páginas de destino. Si la indexación del buscador se hace sobre todo el contenido del sitio web incluyendo las páginas de navegación, se puede producir un problema importante. La página de resultados se llenará de páginas de navegación, obstruyendo todo el proceso de búsqueda y será como una aguja en un pajar averiguar dónde se encuentra la página de destino con el contenido. Por lo tanto es muy recomendable regular el número de páginas de navegación que deberán ser indexadas a fin de que abunden más las páginas de destino.

La indexación de contenidos según el público objetivo

Sin bien indexar contenidos en función de la tipología de públicos y usuarios del sitio web podría ser una ventaja, resulta de importancia también calibrar el impacto. Es posible que exista un índice de solapamiento entre los contenidos de los distintos usuarios lo que empeoraría la recuperación de información. Es aconsejable fijar en tal caso las páginas de destino unívocas para cada público para reducir dicho efecto.

Indexación por tema

Resulta muy conveniente establecer la temática de los contenidos indexados, esto permite enfocar previamente la consulta del usuario y redirigirla a un área muy específica del corpus tratado por el sistema.

Indexación de los últimos contenidos

Aquellos contenidos organizados cronológicamente se prestan a una indexación según fecha de publicación. Es frecuente combinar este factor con el de temática y el de selección de zonas del sitio web.

Selección desde los componentes de contenido hasta el índice

Permitir al usuario la búsqueda según la tipología y caracteristicas del contenidos suele facilitar la recuperación y exploración del sitio web. Esto es según el formato y según los elementos de descripción que posean. Por ejemplo el cuerpo del texto, el título, la URL, el nombre del sitio, enlaces, enlaces a imágenes y a documentos, textos alternativos, descripciones, palabras clave, metadatos, meta-etiquetas, textos de anclaje, etc.
En este sentido y combinado con las estrategias de búsqueda, se suelen crear salones de búsqueda o también más comúnmente denominadas páginas de búsqueda avanzada.

Los algoritmos de búsqueda que actúan dentro del buscador

¿Qué es un algoritmo de recuperación? Es un método diseñado para resolver un problema específico, en este caso, recuperar información a través de las consultas del usuario. Los algoritmos a parte de ser métodos de procedimiento y tratamiento de la información, así como de cálculo son instrumentos o herramientas que actúan conjuntamente con muchos otros mecanismos del motor de búsqueda. Por ejemplo, los indexadores, los webcrawlers, los visualizadores de contenidos, los algoritmos de inteligencia artificial para la interpretación de las consultas, los sistemas de gestión y ejecución temporal de los distintos algoritmos, etc. Todos ellos se articulan para formar lo que comúnmente se denomina buscador, y en general se puede denominar "en genérico" como algoritmo de recuperación. Los algoritmos más frecuentes para la búsqueda y localización de información se pueden clasificar en dos grandes categorías:

Algoritmos de reconocimiento de patrones

Su objetivo es determinar la coincidencia de patrones entre la consulta del usuario y el corpus textual que ha sido indexado por el motor de búsqueda. Cuando se encuentran coincidencias, se recuperan los registros y se representan mostrando el patrón de consulta y las distintas coincidencias. A parte existe todo un aparataje de refinamiento para mejorar los resultados. Un ejemplo de este concepto son las expresiones regulares REGEXP o el reconocimiento de patrones LIKE en MySQL.

Algoritmos de reformulación y precisión

Se basan en la relevancia de los resultados, su precisión y exhaustividad, devolviendo sólamente los resultados de mayor calidad. Esto se consigue mediante la aplicación de métodos booleanos, vectoriales, de similaridad y probabilísticos.

Otros enfoques

Cálculo del interés entre citas de un documento.
Método de bibliografía activa, por relevancia y similaridad de los documentos referenciados.
Documentación similar basada en el análisis de los términos del texto.

El futuro desarrollo de algoritmos

Métodos de evaluación de consultas y documentos basados en la experiencia del usuario.

Generadores de consultas

Como ya se ha explicado el algoritmo de búsqueda propiamente dicho no es el único componente del buscador, de hecho tienen gran importancia las herramientas para ayudar a generar las consultas y asistir al usuario. A continuación se explicitan algunos de los métodos más comunes:

Auto-sugerencias

Cuando se escribe de forma incorrecta un término el sistema sugiere el término correcto para que se repare la consulta y se proporcionen resultados pertinentes, garantizando una recuperación que por otro lado no devolvería probablemente ningún resultado.

Herramientas fonéticas

Permiten determinar las equivalencias fonéticas de los términos de consulta para expandir la búsqueda y obtener resultados que a priori serían difíciles de recuperar.

Constructores de términos derivados

A partir de la raíz de los términos que el usuario utiliza en la búsqueda es capaz de proponer al usuario otra consulta con nuevos términos basados en dicha raíz.

Herramientas de procesamiento del lenguaje natural

Efectúan un análisis sintáctico de las oraciones, frases y sintágmas de las consultas del usuario para determinar la estrategia de búsqueda y localizar patrones más similares.

Vocabularios controlados

Cuando el usuario introduce la cadena de consulta, se le sugieren términos controlados relacionados o parecidos a partir del tesauro o taxonomía que disponga integrada el sistema.

viernes, 7 de octubre de 2011

05.- Sistemas de navegación

Sistemas de navegación principales. Su objetivo es la navegación a través de todos los contenidos del sitio web, permiten establecer el contexto y la flexibilidad de navegación.

Global. Debe indicar dónde se encuentra el usuario y a dónde puede ir.
Local. Su objetivo es mostrar qué opciones o temas colindantes se encuentran dentro de la sección que está siendo consultada.
Contextual. Trata de explicar qué contenidos hay relacionados con la página que se esta consultando.

Sistemas de navegación complementarios. Sirven a un propósito concreto y están integrados dentro de los sistemas de navegación principal.

Mapas de sitio. Corresponden a la organización de secciones o categorías del sitio bajo las que se adscriben los distintos enlaces a los contenidos o subcategorías.
Índices. Consiste en una organización alfabética de todos los enlaces a las secciones, categorías y subcategorías del sitio web.
Guías. Método de navegación que establece pasos o puntos de verificación entre los distintos contenidos del sitio web.

Errores muy graves en el diseño de los sistemas de navegación

Pistas para que el usuario averigüe los enlaces visitados y no visitados. Implica controlar los colores de los enlaces en todos sus estados.
Suprimir el botón de marcha atrás y opciones que no permitan al usuario volver sobre sus pasos.
Paralizar la función de favoritos del navegador.

Construyendo el contexto del sitio web

Indicar al usuario en dónde se encuentra en todo momento. Si es preciso indicar... usted está aquí. Tener o no ese indicador marca la diferencia entre una buena y una mala arquitectura de información.
Marcar la posición o situación de cualquier contenido dentro del sitio web.
Mantener los mismos esquemas de diseño en todo el sitio web. Logo, título o denominación del sitio o proyecto, etc.
Si se utiliza un sistema de organización jerárquica éste deberá indicar la posición en la que se encuentra el usuario.
Los niveles jerárquicos en los que se encuentran las categorías y subcategorías deben permitir una navegación entre iguales y niveles inferiores y superiores.
Someter el sistema de navegación a una prueba de esfuerzo.

Sistemas de navegación embebidos

Sistema global de navegación.

Siempre presente en todas las páginas y contenidos del sitio web.
Forma de barra de navegación. Por lo tanto menú horizontal en el margen superior de la página web.
Permite el acceso a las funciones y secciones clave del sitio web.
Siempre proporcionan acceso a la página principal, buscador, título o nombre de la página en la que se encuentra el usuario,
Máximo 1 sistema de navegación global.

Sistema local de navegación.

El sistema global de navegación es complementado por el local.
Puede haber más de 1 sistema local de navegación.
Ofrece información y subcategorías adscritas a la categoría o sección dependiente o principal que el usuario selecciona en cada caso.
Dependiendo del área que abarquen y su nivel de descentralización del sitio web, pueden llegar a ser considerados subsitios.

Sistema de navegación contextual.

Potencia el aprendizaje asociativo de los términos enlazados a recursos, páginas relacionadas y sus contenidos. Los usuarios aprenden mientras navegan.
Permite generar un tejido colectivo de contenidos.
Constituyen el último sistema de navegación que se edita, ya que dependiendo de cómo se integran los contenidos en el sitio, se diseña un hipertexto, un índice o una guía adaptada a cada caso, espacio, área e interfaz.

Los tres sistemas de navegación principales deben ser integrados y coexistir sólo cuando sea necesario para una correcta organización y navegación. La prioridad es facilitar el acceso a los contenidos y no abrumar al usuario. Esto implica mantener un equilibrio entre el número de opciones disponibles y el área o espacio que ocupan en la pantalla. Se recomienda el uso de menús textuales y no gráficos en la medida de lo posible, uso de atributos alt y title, evitar imágenes e iconos en los sistemas de navegación, ya que el texto es siempre mucho más claro. Evitar mecanismos complejos de presentación de las opciones del menú en la medida de lo posible, por ejemplo Flash, Java, Javascript. Finalmente evitar el uso de marcos (excepto iframe) para cargar los contenidos enlazados desde el menú en beneficio del sistema de capas de tipo div y el empleo de codificación en lenguaje php, para estructurar las partes del sitio web.

jueves, 6 de octubre de 2011

04.- Sistemas de organización de contenidos

Organización de contenidos

Sistemas de organización exacta y objetiva. Permiten la recuperación exacta cuando el objeto o documento que se busca es conocido. Son de fácil elaboración, y consulta, pero no responden a una búsqueda exhaustiva o imprecisa. Son los sistemas de clasificación alfabética, cronológica y geográfica.

Alfabética. Es el método de organización primario que proporciona un índice alfabético de un dominio o área de conocimiento. En este caso de un sitio web completo o de alguna de sus secciones.
Cronológica. Cuando la información se sucede en el tiempo tiene su razón de ser una recuperación por cotas temporales. Suele ser de habitual aplicación en noticias de prensa, titulares y canales de sindicación o cuyo flujo de información se sucede de manera continua.
Geográfica. La organización geográfica permite limitar la información según su origen o ámbito de aplicación, lo que permite una discriminación de los contenidos que ayuda a la recuperación y búsqueda del usuario. Por ejemplo, distinguir la geolocalización de fotografías, los medios de comunicación de cada país o los servicios prestados por una empresa para cada región.

Sistemas de organización subjetiva. Implica una subjetivadad y ambigüedad o inexactitud, puesto que el profesional de la información debe clasificar contenidos en función de categorías temáticas que no siempre responden a la definición de los contenidos, o al menos no completamente. Su aplicación es de gran importancia para responder a la mayoría de búsquedas del usuario, en las que desconoce el objeto exacto de su consulta, obteniendo una aproximación a partir de estos sistemas de organización.

Temática. Uno de los métodos más extendidos es la clasificación temática basada en tesauro o taxonomía, lenguajes en todo caso controlados y normalizados. Si bien todo sitio web debería contar con este método, debería ser combinado con una presentación continua de novedades en cada uno de sus apartados, para convertirse en un esquema de contenidos actuales. Este mecanismo ayuda a educar al usuario y formar una idea real de la información que enmarca cada área temática o sección.
Tareas. Definir los servicios o actividades que puede desempeñar el usuario constituye otro tipo de clasificación subjetiva que suele estar combinada con la organización temática o de audiencia.
Audiencia. Si existen varios tipos de usuario, puede tener sentido crear varios esquemas de información que respondan a cada caso, por ejemplo usuarios domésticos, profesionales, investigadores, educadores, cuyas demandas informativas variarán ostensiblemente. Por otro lado la posibilidad de interactuar entre los distintos entornos de usuario permite definir un sistema de organización más abierto o cerrado.
Metafórica. El empleo de metáforas visuales para distinguir los elementos y contenidos de un sitio web, puede resultar de gran ayuda para comprender el contexto y educar al usuario en cuanto a su objeto de consulta. Es el caso de los mapas de imágenes, minisites con contenidos multimedia de tipo flash, o las infografías utilizadas para explicar distintos hechos, objetos y circunstancias.

Organización jerárquica. Las jerarquías, ya fueren tesauros o taxonomías proporcionan un método simple de clasificación y organización de la información, permitiendo enfocar la consulta del usuario desde el plano general hasta el más específico. En el caso de las taxonomías, se recomienda que las categorías jerárquicas sean en mayor medida excluyentes del resto de conceptos para evitar en la medida de lo posible la ambigüedad. Ello conlleva ajustar la precisión del lenguaje, para lograr un balance clasificatorio inclusivo equilibrado de los documentos. Dicho de otro modo, es recomendable mantener una especificidad y una capacidad de discriminación alta para que una clasificación de tipo polijerárquica. Por otro lado el control entre la amplitud (el número de elementos que conforman un nivel jerárquico de la taxonomía) y la profundidad (el número de niveles jerárquicos de la taxonomía) puede incidir en una clasificación demasiado horizontal o vertical, lo que dificulta la navegación entre sus contenidos. En este sentido también se requiere un equilibrio y una proporcionalidad.

Hipertexto. Consiste en un método de enlazamiento no lineal y altamente estructurado de la información. Ello implica que el trozo de texto que se enlanza (mediante URL) a un tercer contenido, encaja con su significación, sentido semántico, definición o explicación y ejemplificación. También puede existir una organización jerárquica entre los distintos trozos de texto y más concretamente, entre las páginas que conectan entre si. No obstante, no se produce con un orden previo o precoordinado como ocurre con los lenguajes controlados, lo que proporciona gran libertad y flexibilidad de interrelación. Sus desventajas derivan de la falta de normalización y la subjetividad a la que están sujetas las relaciones (quedando a la elección y entendimiento del profesional de la información), lo que facilita que un usuario que navegue a través de este sistema se pierda fácilmente. Dicho de otra forma, las relaciones que se establecen entre documentos, puede que no sean comprendidas por todos los usuarios de la misma forma con que son entendidas por su creador.

Sistemas de clasificación social. También conocido como etiquetado social, etiquetado libre, etnoclasificación o colaborativo, consiste en un mecanismo que permite la interacción de los usuarios para clasificar los contenidos según su experiencia y conocimientos con la documentación y medios que utilizan en el sistema. Este mecanismo proporciona una gran libertad y extensibilidad para organizar la información, justamente todo lo contrario a una taxonomía o un tesauro, lo que implica que la inteligencia clasificatoria no emerge del arquitecto de información sino de los propios usuarios o personas reales. A pesar de ser un método enormemente popular, también causa problemas a la hora de recuperar la información clasificada, dada la ambigüedad de los términos empleados en las etiquetas y al carecer de un mínimo control para la organización de su contenido. Dicho de otro modo, se hace difícil establecer la clave correcta de acceso a la información y con ello se corre el riesgo de emplear términos inexactos e incluso equivocados.

Sistemas de etiquetado

Los sistemas de etiquetado, tan frecuentemente utilizados en los sitios web, pueden plantear problemas de significación, navegación y referencia, si no se atiende al lenguaje que emplean los usuarios para comunicarse y navegar habitualmente en la red. Lo que haría preguntarse si las etiquetas utilizadas para las distintas secciones del sitio web, responden realmente a los contenidos que espera encontrar el usuario, si estas ofrecen algún tipo de explicación o si es posible acceder a esa información explicativa extra de algún modo sencillo. Algunos errores más comunes son los siguientes:

Etiquetas ambiguas, sin significación o demasiado comunes. Por ejemplo el término principal o home. Se entiende que alude a una página principal, pero no queda claro, puede ser la portada del sitio web, la página de entrada o de inicio.
Uso de dos o más etiquetas simultáneamente. En el caso de querer unificar contenidos bajo un mismo epígrafe, se puede producir una confusión al respecto de la información contenida. Por ejemplo, productos y servicios, recursos y bibliografía, etc.
Adecuación de la etiqueta a la realidad contenida. Utilizar términos que ofrezcan una visión real de los contenidos. Por ejemplo no utilizar superofertas, pero sí ofertas. Esto es adecuar el lenguaje a la realidad y al vocabulario controlado.
El uso del lenguaje corporativo. En muchos casos el empleo de un lenguaje empresarial puede desconcertar al usuario, por ejemplo sinergias, estrategías, etc. Pero también dentro de dicho vocabulario existen etiquetas aceptadas y convenidas comunmente, por ejemplo sobre nosotros, about us, derechos, etc.

Las etiquetas no sean representativas y no permiten distinguir o diferenciar.
Las etiquetas se convierten en jerga no centrada en el usuario
Las etiquetas no ofrecen una visión correcta de lo que contienen

Tipología de etiquetas

Enlaces contextuales. Son trozos de texto enlazados a terceros recursos y contenidos en la misma página o terceras páginas. Tales enlaces y sistema de etiquetado es denominado Hipertexto.
Titulares - headings. Se limitan a describir el contenido que encabezan. Permiten establecer una jerarquía dentro del texto permitiendo distinguir los distintos epígrafes que atañen a un artículo, libro, o página web. Los métodos de numeración, viñetas, negrita y tamaño de la fuente ayudan en este sentido a crear un orden de presentación de la información. Dichos titulares actúan como trozos de texto representativos y pertinentes de los contenidos, distinguiéndose dicha diferenciación de manera visual. El objetivo de estos es establecer un orden de lectura, que permita saber el comienzo del contenido, su resumen, sus resultados, sus objetivos, su motivación, su desarrollo, etc.
Opciones de navegación del sistema. Las etiquetas que representan las opciones de navegación del sistema o que están integradas dentro de él, constituyen una constante, en todas las páginas del sitio web, lo que requiere una racionalidad en la organización de los contenidos y de los conceptos que representan. No existe una convención o normalización en este aspecto pero sí se reconocen una serie de términos de uso común y altamente difundido en cualquier sitio web. En estos casos, siempre se recomienda emplear la metadescripción de la etiqueta y de los enlaces que portan de tal forma que sean suficientemente significativos de las opciones que ofrece el sitio web.

página principal, inicio = main page, home
buscar, explorar, navegar = search, find, browse
contactar = contact us
ayuda, FAQ = help, FAQ
noticias, eventos = news, announcements
acerca de, sobre nosotros, quienes somos = about, about us, who we are

Términos de índice. Son palabras clave, encabezamientos de materia, descriptores que representan el contenido y que conforman puntos de acceso a la información propiamente dicha. Son utilizados para describir trozos de texto, encabezamientos, títulos, enlaces, opciones del menú de navegación, los contenidos propiamente dichos. Tales usos están destinados casi por completo a la recuperación de los contenidos publicados, siendo en muchos casos invisibles cuando aparecen en forma de código de metadato o metaetiqueta.

Coherencia y consistencia del sistema de etiquetado. El etiquetado de contenidos es sencillo siempre y cuando el ámbito de aplicación, la temática, el contexto y los usuarios sean un conjunto concentrado bien delimitado desde un principio. Esto significa efectuar un etiquetado modular dependiendo de las secciones especificadas en el sitio web. Cada sección requiere de un vocabulario y un etiquetado especializado que permita navegar en cada caso con el lenguaje correcto. En todos ellos el factor clave para su funcionamiento es la coherencia que significa el uso de términos previsibles para el usuario y fáciles de recordar en un primer golpe de vista general del sitio web. Ello depende de diversos factores:

Estilo. La signos de puntuación o caracteres que dificultan la lectura han de ser suprimidos o sustituidos por otros que presenten una puntuación sencilla y simple. También el empleo de guías de estilo facilita la definición del etiquetado.
Presentación. El tamaño de la fuente, el tipo de letra, el color, su espaciado, su resaltado puede ayudar o no en aportar coherencia al conjunto. Por ello es recomendable utilizar estilos sencillos sin decoraciones, coherentes a lo largo de todos los contenidos y páginas del sitio web.
Sintaxis. Utilizar un único método de construcción sintáctica para las frases, en todos los casos, ayuda a crear la coherencia necesaria en el sistema. Por ejemplo mantener una estructura sujeto-verbo-predicado, o verbo-predicado en el caso en el que se citen acciones o tareas concretas en el sitio web.
Granularidad. Dentro del sistema de etiquetado es posible encontrarse términos que responden a distintos niveles jerárquicos dentro de una misma faceta, por ejemplo aviación civil, aeropuerto, aerotransporte. Distintos niveles dentro de una faceta en vez de ayudar dificulta la comprensión de la clasificación del contenido, requiriendo términos o etiquetas más específicas de un nivel en cuestión, reduciendo dicha granularidad.
Comprensión y coherencia: amplitud. Si se describen distintos elementos que conforman una realidad dentro de una misma categoria y nivel granular, se ayuda a comprender el objeto y naturaleza del contenido. Por ejemplo calzado, bolsos, cinturones, bisutería es indicador suficiente de que se está en la categoría complementos.
Adecuación del lenguaje al tipo de usuario. Se trata de adaptar el lenguaje al tipo de usuario. Por ejemplo, un usuario especializado puede considerar pertinente el concepto apnea, cuya traducción o nombre común sería trastorno del sueño.

Arquitectura de la Información y Desarrollo Web Avanzado