Demanda Documental

jueves, 20 de mayo de 2010

INDEXACION

El proceso de recuperación de información consiste esencialmente en extraer de una colección de documentos aquellos que se ajustan a las especificaciones de un petición determinada. Se trata pues de una comparación sistemática entre los documentos o sus representaciones y la petición o demanda de información. Podemos descomponer el proceso en tres fases: * Traducción del documento en un lenguaje de indexación. La expresión que resulta de este proceso se llama modelo de búsqueda del documento. Se trata de representar el documento por una serie de descriptores que lo determinen lo más directamente posible para su posterior indexacion búsqueda. * Expresión de la petición de información en el mismo lenguaje del modelo de búsqueda. Se obtiene el denominado perfil de búsqueda. * Comparación sistemática de los modelos de búsqueda de los documentos con el perfil de búsqueda, a fin de seleccionar los que se ajusten a este. La operación resultaría relativamente sencilla si los lenguajes de indexación y de búsqueda coincidieran exactamente. Ello, sin embargo, no es así en la mayoría de los casos, ya que los productores de bases de datos y repertorios bibliográficos suelen indexar en lenguaje libre o semilibre, lo que resulta mucho más fácil y económico para sus fines. Por tanto, al seleccionar los descriptores para la búsqueda, habrá que tener en cuenta todas las posibles formas de expresión de un concepto en la indexación de los documentos (sinónimos, conceptos más generales y más específicos, etc.) ya que de otro modo podrían perderse cantidades importantes de información. Por otra parte, si la selección es demasiado amplia, se obtendrán documentos carentes de interés. De ahí la importancia de preparar adecuadamente el perfil de búsqueda, operación que resulta así la mas importante en el proceso de indexacion recuperación de información.

miércoles, 19 de mayo de 2010

Posicionamiento Web

Existen multiples herramientas que nos permiten la una mejor indexación de nuestras paginas Web. Existen unos comandos especiales que nos permiten tener información de como se está indexando la información que se pueden digitar antes de la direccion de URL: site: Páginas indexadas de su sitio link: Páginas que enlazan a la página de presentación de su sitio web cache: Caché actual de su sitio info: Información de que disponemos sobre su sitio related: Páginas similares a su sitio tambien se pueden usar sitemas. Un sitema es un mapa de nuestro sitio con un formato determinado (xml) que permite a google indexar mejor la información.

indexación incremental VS indización por lotes

Indexación incremental vs indexación por lotes. "El término de indexación por lotes se utiliza para referirse a aquellos procesos de indexación, en los cuales, una vez que ha sido creado el índice para un conjunto de documentos, el intentar añadir algunos documentos nuevos es una tarea difícil por lo que se opta por reindexar todos los documentos de nuevo. Sin embargo en la indexación incremental se pueden añadir documentos a un índice ya creado con anterioridad de forma fácil. Lucene soporta ambos tipos de indexación." articulo tomado del link: http://trevinca.ei.uvigo.es/~pcuesta/sm/practicas/Lucene.pdf

PROCESO DE INDEXACION

El término proceso de indexación hace referencia al proceso de análisis de documentos para la obtención de una representación concreta de los mismos.

Normas de Indización

Normas de Indización: ISO 5963 / 1985 (establece los métodos para el examen de documentos. Se explica como determinar el contenido y los términos de indización). ANSI (American Nacional Standar Institu) UNESCO (Principios de indización). AFNOR (Principios de indización) ERIC (Instituto General de Educación. Este también ha echo unas normas para normalizar los lenguajes documentales).

Definicion de Indizacion

Según norma ISO 5963 de 1985 la indización es el proceso de describir o representar el contenido temático de un recurso de información. Este proceso da como resultado un índice de términos de indización que será utilizado como herramienta de búsqueda y acceso al contenido de recursos en sistemas de recuperación de información.

Google Desktop

Google Desktop es una herramienta gratuita incluida en el Google Pack que sirve para hacer búsquedas en tu ordenador. Puedes buscar archivos, música, fotos, texto en correos electrónicos, páginas web visitadas, etc, lo que te permite acceder fácilmente a toda la información de tu ordenador. Esto te ahorra el trabajo de tener que organizar manualmente tus archivos, mensajes, etc. Google Desktop también te permite buscar documentos que hayas borrado accidentalmente. Cuando haces una búsqueda, Google Desktop muestra los resultados de búsqueda más relevantes en una página, cada uno de ellos con el nombre del archivo y una breve muestra del contenido con los términos de búsqueda resaltados. Google Desktop busca en el texto completo de los siguientes tipos de archivo Gmail Outlook Express Word Excel Power Point Internet Explorer AOL Instant Messenger MSN Messenger Google Talk Netscape Mail / Thunderbird Netscape / Firefox / Mozilla PDF Música Vídeo Imágenes Archivos Zip

Tipos de indexación

Tipos de indexación Por palabras: se indexa cada palabra del documento con excepción de palabras vacías como los artículos “la, el, los etc” o si, no, e, a, etc. De string: cuando se indexan palabras o frases completas.

indixación automatizada

La indización automatizada, identifica en los documentos las palabras claves que abrevien todo o la mayor parte del contenido de un texto, lo que hace es extraer los términos de indización de forma automática con la ayuda de las máquinas con las que se pueden realizar búsquedas por medio de listas, términos de conjunto abierto o a través de una indización controlada, como tesauros u ontologías. Para lograr la indización automática lo se debe indizar las partes principales del documento como el título, los subtítulos, el resumen, autor etc. o indizan el texto completo, pero el mayor porcentaje de la recuperación de información la arrojan los términos indexados en el título, y muy poco en el texto completo.

INDEXACIÓN

Indexación: Indexar refiere a registrar ordenadamente información para elaborar un índice. En terminología de internet, indexar hace referencia a agregar una o más paginas Web, bases de datos de los buscadores de internet, con el fin de recuperar la información con los términos de búsqueda que aparezcan en los resultados de búsquedas de los mismos. En Informática, Indexar tiene como propósito ejecutar términos de un índice que contenga de forma ordenada la información, esto con la finalidad de obtener resultados de forma sustancialmente será más rápido y selecto al momento de realizar una búsqueda.

martes, 18 de mayo de 2010

DEFINICION DE INFORMACION

INFORMACION: Conjunto de datos numericos, alfabeticos y alfanumericos ordenados, al estar organizados y que tienen un significado especifioc y disminuyen la incertidumbre sobre un tema e incrementan el conocimiento de del tema trato.

HIPERTEXTO

EL ENLACE QUE MOSTRAREMOS A CONTINUACION NOS PARECIO DE ALTA RELEVANCIA, NO SOLO PARA EL TEMA DE RECUPERACION DE INFORMACION SINO POR LA INFORMACION QUE ENCONTRAREMOS RELACIONADA PARA LOS QUE ESTUDIAMOS SISTEMAS DE INFORMACION Y DOCUMENTACION, ENCONTRAREMOS INDIZACION Y CLASIFICACION DE HIPERTEXTOS, NORMALIZACION, GLOSARIOS, WEB 2.0, LENGUAJES, TAXONOMIAS, TESAUROS, MARC, ENTRE OTROS TEMAS ESTE ES EL LINK: http://www.hipertexto.info/documentos/indice_tematic.htm

noticias recuperacion de informacion Recuperación de Información: recuperación de información

recuperacion-de-informacion.html#links">noticias recuperacion de informacion Recuperación de Información: recuperación de información

recuperación de información, sistemas de recuperación de información, busqueda y recuperación de información, lenguajes de recuperación de información, metadatos, posicionamiento web, indexaxción y búsqueda
http://recuperainformacion.blogspot.com/2009/05/demanda-documental_26.html