Demanda Documental

miércoles, 19 de mayo de 2010

Posicionamiento Web

Existen multiples herramientas que nos permiten la una mejor indexación de nuestras paginas Web. Existen unos comandos especiales que nos permiten tener información de como se está indexando la información que se pueden digitar antes de la direccion de URL: site: Páginas indexadas de su sitio link: Páginas que enlazan a la página de presentación de su sitio web cache: Caché actual de su sitio info: Información de que disponemos sobre su sitio related: Páginas similares a su sitio tambien se pueden usar sitemas. Un sitema es un mapa de nuestro sitio con un formato determinado (xml) que permite a google indexar mejor la información.

indexación incremental VS indización por lotes

Indexación incremental vs indexación por lotes. "El término de indexación por lotes se utiliza para referirse a aquellos procesos de indexación, en los cuales, una vez que ha sido creado el índice para un conjunto de documentos, el intentar añadir algunos documentos nuevos es una tarea difícil por lo que se opta por reindexar todos los documentos de nuevo. Sin embargo en la indexación incremental se pueden añadir documentos a un índice ya creado con anterioridad de forma fácil. Lucene soporta ambos tipos de indexación." articulo tomado del link: http://trevinca.ei.uvigo.es/~pcuesta/sm/practicas/Lucene.pdf

PROCESO DE INDEXACION

El término proceso de indexación hace referencia al proceso de análisis de documentos para la obtención de una representación concreta de los mismos.

Normas de Indización

Normas de Indización: ISO 5963 / 1985 (establece los métodos para el examen de documentos. Se explica como determinar el contenido y los términos de indización). ANSI (American Nacional Standar Institu) UNESCO (Principios de indización). AFNOR (Principios de indización) ERIC (Instituto General de Educación. Este también ha echo unas normas para normalizar los lenguajes documentales).

Definicion de Indizacion

Según norma ISO 5963 de 1985 la indización es el proceso de describir o representar el contenido temático de un recurso de información. Este proceso da como resultado un índice de términos de indización que será utilizado como herramienta de búsqueda y acceso al contenido de recursos en sistemas de recuperación de información.

Google Desktop

Google Desktop es una herramienta gratuita incluida en el Google Pack que sirve para hacer búsquedas en tu ordenador. Puedes buscar archivos, música, fotos, texto en correos electrónicos, páginas web visitadas, etc, lo que te permite acceder fácilmente a toda la información de tu ordenador. Esto te ahorra el trabajo de tener que organizar manualmente tus archivos, mensajes, etc. Google Desktop también te permite buscar documentos que hayas borrado accidentalmente. Cuando haces una búsqueda, Google Desktop muestra los resultados de búsqueda más relevantes en una página, cada uno de ellos con el nombre del archivo y una breve muestra del contenido con los términos de búsqueda resaltados. Google Desktop busca en el texto completo de los siguientes tipos de archivo Gmail Outlook Express Word Excel Power Point Internet Explorer AOL Instant Messenger MSN Messenger Google Talk Netscape Mail / Thunderbird Netscape / Firefox / Mozilla PDF Música Vídeo Imágenes Archivos Zip

Tipos de indexación

Tipos de indexación Por palabras: se indexa cada palabra del documento con excepción de palabras vacías como los artículos “la, el, los etc” o si, no, e, a, etc. De string: cuando se indexan palabras o frases completas.

indixación automatizada

La indización automatizada, identifica en los documentos las palabras claves que abrevien todo o la mayor parte del contenido de un texto, lo que hace es extraer los términos de indización de forma automática con la ayuda de las máquinas con las que se pueden realizar búsquedas por medio de listas, términos de conjunto abierto o a través de una indización controlada, como tesauros u ontologías. Para lograr la indización automática lo se debe indizar las partes principales del documento como el título, los subtítulos, el resumen, autor etc. o indizan el texto completo, pero el mayor porcentaje de la recuperación de información la arrojan los términos indexados en el título, y muy poco en el texto completo.

INDEXACIÓN

Indexación: Indexar refiere a registrar ordenadamente información para elaborar un índice. En terminología de internet, indexar hace referencia a agregar una o más paginas Web, bases de datos de los buscadores de internet, con el fin de recuperar la información con los términos de búsqueda que aparezcan en los resultados de búsquedas de los mismos. En Informática, Indexar tiene como propósito ejecutar términos de un índice que contenga de forma ordenada la información, esto con la finalidad de obtener resultados de forma sustancialmente será más rápido y selecto al momento de realizar una búsqueda.