lunes, 4 de noviembre de 2013

SISTEMAS DE RECUPERACION DE INFORMACION

SISTEMAS DE RECUPERACIÓN DE INFORMACION


Se pueden distinguir tres sistemas básicos de recuperación de la información:

  • Catálogos de biblioteca: Es el inventario o relación de los fondos de la biblioteca, y contiene la descripción de cada uno de los documentos, convirtiéndose en un instrumento para la identificación y localización de los mismos. Llamamos OPAC (On-line Public Access Catalog) al catálogo automatizado de la biblioteca.

      • Bases de datos bibliográficas: Son conjuntos de información estructurada en registros (que describen documentos), y almacenada en un soporte electrónico legible desde un ordenador. Su finalidad es organizar dichos registros para, posteriormente, poder realizar búsquedas y recuperar la información. Hay dos tipos de bases de datos: referenciales (ofrecen los datos identificativos de los documentos y, a veces, un resúmen o abstract), y a texto completo (incluyen el texto completo de los documentos)
            DIALNETPROQUESTISIE-LIBROECONLITEBSCOHOST 

        • Buscadores de Internet: Son aplicaciones que rastrean la red recopilando datos e información sobre las páginas web, e incorporando esta información en su propia base de datos

        bUSCADORES


        OPERADORES LOGICOS

        OPERADORES LOGICOS

        La sintáxis especifica una serie de reglas de construcción que deberán cumplir las fórmulas para ser sintácticamente correctas. Los elementos que estudiaremos en una fórmula, en lógica proposicional son:
        • Símbolos: p, q, r...
        • Operadores: negación, conjunción, disyunción, condicinal, disyunción exclusiva
        • Paréntesis: ( )
        Las reglas de construcción sintácticas son:
        • Un símbolo sólo no es una fórmula
        • Los operadores unarios se anteponen al símbolo. Los operadores binarios se sitúan entre los símbolos.
        • Los paréntesis han de estar bien formados, y ha de haber tantos paréntesis de abertura como de cierre:
          • Son correctos: (p), p and (q), p or ((not q) and r)...
          • No son correctos: (), (p (or) q), p and (q or (not r)...
        • Son fórmulas:
          • p, not p, p and q, p xor (not q), not (p -> q)...
        Hemos hablado de operadores unarios y binarios. Los primeros afectan sólo a un símbolo o fórmula, en cambio los segundos afectan a los 2 símbolos o fórmulas que haya a su izquierda y derecha.
        Una fórmula es cualquier combinación de elementos que cumplan las reglas sintácticas. Por ejemplo, si tengo un símbolo p: "hace frío". La fórmula not p equivale a "no hace frío".
        De los símbolos no hay nada más que decir, son letras minúsculas del alfabeto. En cuanto a los operadores lógicos, no vamos a verlos todos, sólo los necesarios para comprender la lógica que después aplicaremos a la programación. Cada operador está representado por un símbolo:
        OperadorSímboloTipo
        negaciónnotunario
        conjunciónandbinario
        disyunciónorbinario
        condicional->binario
        disyunción exclusivaxorbinario
        Veamos la tabla de prioridad (precedencia) y asociatividad de los operadores de mayor a menor prioridad:
        OperadorAsociatividad
        ( )
        notderecha
        andizquierda
        xorizquierda
        orizquierda
        ->izquierda

        Tema Importante
        Nota: Aunque los paréntesis no son un operador, se han considerado ya que son los primeros que se interpretan.
        La asociatividad de los operadores indica cómo se evalúan las expresiones. Por ejemplo, el operador not se evalúa de derecha a izquierda, en la expresión not p se evalúa p , y después se aplica la negación de p . Sin embargo, el operador and se evalúa de izquierda a derecha, en la expresión p and q se evalúa p , y después se evalúa p and q . Esto puede parecer inútil, pero sabiendo que 0 and cualquier valor siempre es 0, si evalúamos p and q , y p es 0, no hace falta evaluar q .
        Los operadores se interpretan según su prioridad para la correcta agrupación de las expresiones. Primero los de mayor prioridad y después los de menor prioridad. Es decir, ante la fórmula not p or q podríamos dudar si interpretarla (not p) or q o not (p or q). La fórmula correcta es la primera, ya que el operador not tiene más prioridad que el operador or. De todas formas, ante la duda, es mejor utilizar paréntesis.
        Lo primero es asignar símbolos. Se pone un símbolo por cada acción simple que no se puede descomponer en otras:
        • p: Llueve
        • q: Me mojo
        • r: Tengo un paraguas
        Ahora pasamos a formalizar las sentencias:
        1. not p
        2. p -> q
        3. r -> p
        4. ((not p) and (r)) -> not q



        Intersección: Y, AND



        Selecciona sólo los documentos que contienen ambos

         términos a la vez. 

        Queremos localizar aquellos trabajos en los que conste publicidad y mujeres.

        La ecuación de búsqueda que realizaríamos 

        sería: publicidad AND mujeres

        DDDD


        Negación: NO, NOT

        Selecciona los documentos que contengan el primer 

        término pero no el segundo.

        Queremos localizar aquellos documentos que contengan el término publicidad y no contengan el término mujeres. La ecuación de búsqueda que realizaríamos sería: publicidad NOT mujeres


        AAAAA



        Reunión o suma lógica: O, OR


        Selecciona aquellos documentos que o bien 

        contienen alguno de los dos términos 
        separadamente, o bien los dos a la vez. Cuando no 

        indicamos ningún operador entre palabras, los 
        sistemas lo interpretan como si hubiéramos colocado OR.
        Queremos localizar aquellos artículos que contengan el término publicidad o el término mujeres o el término marketing. La ecuación de búsqueda que realizaríamos sería: publicicad OR mujeres OR marketing
        aaaaaaaaaaaaaaa