Mostrando entradas con la etiqueta Arquitectura de información. Mostrar todas las entradas
Mostrando entradas con la etiqueta Arquitectura de información. Mostrar todas las entradas

sábado, noviembre 06, 2010

Herramientas de software libre para la gestión de contenidos

"recuperación de información" "programa de sistemas de información" "Universidad de La Salle"

GESTIÓN DE INFORMACIÓN Y GESTIÓN DE CONTENIDOS

Los servicios de información y documentación accesibles a través de internet, más concretamente mediante servidores web, están aumentando de una forma exponencial. La lógica evolución del web desde hace más de 10 años ha ido produciendo la sustitución de páginas y documentos estáticos por documentos generados dinámicamente, merced a la interacción del usuario con la lógica de procesos y flujos de trabajo definida por los creadores del servicio y a la disponibilidad de cada vez mayores repositorios de información. Evidentemente, se ha ido pasado progresivamente de un concepto de publicación de páginas web, bastante simple en su origen, a esquemas más complejos y diferenciados, fundamentados en procedimientos y técnicas basados en la gestión de información. La cada vez mayor complejidad de los servicios y de los sistemas que los soportan, ha hecho necesaria la formulación de un corpus teórico y práctico en el que se combinen las técnicas clásicas de gestión de información en las organizaciones con las características propias del medioambiente digital.

Esta evolución, que se ha acelerado durante la primera mitad de la década de 2000, ha tenido un impacto no sólo en los métodos y técnicas de gestión de información, sino también en la propia tecnología para gestión de información y, en consecuencia, en el mercado de productos y servicios (GILBANE, 2000). Si bien en la segunda mitad de la década de los 90 se podía diferenciar entre productos para gestión documental, para recuperación de información, etc., desde el año 2000 se ha producido una convergencia entre todas las plataformas, de forma que en la actualidad se pueden encontrar soluciones que pretenden ser globales y ofrecer soporte a todo el proceso de gestión de información en una organización. Las herramientas para este trabajo han recibido la denominación de sistemas de gestión de contenidos (o Content Management Systems, CMS), y se han integrado con los sistemas de gestión documental y con los de recuperación de información. A ello hay que unir que, en la concepción actual de la gestión de información, el control de los procesos es un elemento nuclear, por lo que se acompañan de sistemas de workflow , o de flujos de trabajo. Con todo ello se puede delinear un paisaje en el cual las herramientas de gestión documental han ido incorporando a sus prestaciones las capacidades necesarias para gestionar los procesos que crean, almacenan, tratan y presentan información, en entorno digital.

viernes, noviembre 05, 2010

Diseño Web Centrado en el Usuario: Usabilidad y Arquitectura de la Información

"recuperación de información" "programa de sistemas de información" "Universidad de La Salle"

La consecución de los objetivos perseguidos a través de la puesta a disposición del público de cualquier aplicación web está condicionada por la satisfacción del usuario final. Los factores o atributos de calidad de una aplicación o sitio web que influirán en dicha satisfacción se pueden clasificar en aquellos relacionados con: la calidad y utilidad de los contenidos; la calidad del servicio y asistencia del proveedor; y la calidad del diseño de la aplicación.

La importancia del diseño de la aplicación se basa en que éste será el que modele la interacción entre usuario y aplicación, y por tanto posibilitará o no la consecución de los objetivos perseguidos por el usuario (encontrar información, comprar, comunicarse, aprender...).

Si se toma como ejemplo el usuario que intenta completar una tarea de compra en un sitio web de comercio electrónico. Del correcto diseño del sitio dependerá que el usuario consiga finalmente su objetivo (y consecuentemente el proveedor también), o que por el contrario, frustrado por la dificultad de uso del sitio web, decida abandonarlo en busca de otro donde llevar a cabo la compra sea más fácil.

Es fácil inferir que un buen diseño deberá ser comprensible, fácil de usar, amigable, claro, intuitivo y de fácil aprendizaje para el usuario. Para poder asegurar que un diseño cumple con estos requisitos no basta simplemente con una actitud empática del diseñador durante el desarrollo de la aplicación; es imprescindible la adopción por parte de éste de técnicas, procedimientos y métodos que aseguren empíricamente la adecuación del diseño a las necesidades, habilidades y objetivos del usuario.

martes, noviembre 02, 2010

Web Semántica y Agentes Metarrepresentacionales basados en Marcadores Discursivos

"recuperación de información" "programa de sistemas de información" "Universidad de La Salle"
Web Semántica, Ontologías, Metadatos y Agentes Inteligentes
Como cualquier usuario de Internet habrá advertido por su propia experiencia personal diaria, la web actual está construida con una cantidad ingente de recursos poco estructurados y pobremente definidos. El precio que se paga por ello es la emergencia de una cantidad desproporcionada de información irrelevante.
Una de las causas formales infraestructurales que explican esta situación es que la web actual se basa en el lenguaje HTML. La insatisfacción creciente con respecto a este lenguaje de programación de usuario, que permite codificar hipertextualmente textos, imágenes, sonidos y multimedia, podría sintetizarse en la opinión generalizada entre los especialistas de que el HTML es, simplemente, un lenguaje estructural de maquetación.

En 1999, Tim Berners-Lee, el creador de la World Wide Web, escribió por primera vez acerca de los requisitos hipotéticos que debería de cumplir una futura Web Semántica que facilitase "la implementación del significado, de la inteligencia en la red" (W3C, 1999). En el discurso académico generado recientemente en torno a Internet, se retoma este planteamiento y empieza a detectarse un cierto consenso en torno a la idea de que el futuro de la web se está gestando en la investigación en formas de intelección artificiales cualitativas similares a la humana (Berners-Lee, 2001).

sábado, octubre 23, 2010

SISTEMAS DE INFORMACIÓN EN LAS EMPRESAS

"recuperación de información" "programa de sistemas de información" "Universidad de La Salle"

Durante los últimos años se han multiplicado los estudios tendentes a analizar la información como factor clave para la toma de decisiones en la empresa, clave de la gestión empresarial, y eje conceptual sobre el que gravitan los sistemas de información empresariales.

Se considera que la información es un recurso que se encuentra al mismo nivel que los recursos financieros, materiales y humanos, que hasta el momento habían constituido los ejes sobre los que había girado la gestión empresarial. Si la Teoría económica tradicional mantenía el capital, la tierra y el trabajo como elementos primarios de estudio, la información se ha convertido, ahora, en el cuarto recurso a gestionar.

Diversos autores han estudiado con profundidad los cambios socioeconómicos ocurridos en la segunda mitad del siglo XX:
Alvin Toffler en El shock del futuro (1970) y la La Tercera Ola (1981); Daniel Bell en El advenimiento de la sociedad post-industrial(1973) ; Naisbitt en Megatrends: ten new directions transforming our lives (1982); Tom Stonier en The wealth of information(1983); Masuda en Computonia 1985); Robert Reich en El Trabajo de las naciones: hacia el capitalismo del siglo XXI (1991), Peter Drucker en La sociedad postcapitalista (1993); y más recientemente por Manuel Castells con su magna obra La era de la información. Economía, sociedad y cultura (1996).

sábado, octubre 16, 2010

SEGURIDAD DE LA INFORMACIÓN

Los DRM y las bibliotecas, la confidencialidad y el respeto a la vida privada

los sistemas de protección y gestión de derechos (DRM) imponen en su operatividad el control de quiénes pueden utilizar las obras que administran, así como los usos que cada individuo efectúa de dichas obras. Resultará difícil que las bibliotecas puedan eludir el control individual de las obras accesibles desde la institución o dicho de una forma más directa: es muy difícil que las bibliotecas puedan garantizar a los usuarios el anonimato en el uso de los fondos, principio de confidencialidad proclamado en diversas declaraciones y manifiestos de UNESCO, ALA, IFLA o del Consejo de Europa. Es decir, el derecho a leer anónimamente está amenazado y con ello el derecho fundamental a la libertad de pensamiento, pues es muy fácil identificar lo que la gente lee con lo que la gente piensa.

En efecto los DRM, imponen en primer lugar restricciones a la utilización de las obras, pero en un segundo nivel de control informan al titular de los derechos de las actividades individuales de cada usuario (por ejemplo. los titulares de los derechos de una revista que se citó y a la que se ha tenido acceso a través de la Biblioteca Complutense saben los usos realizados: guardar el archivo pdf e imprimirlo; saben cuál es el terminal desde el que se concetó el usuario, saben los artículos que utilizo en la misma sesión y seguramente saben también la tendencia que reflejan esos artículos y el conjunto de esas publicaciones, al menos el perfil de usuario estará guardado en algún sitio, junto a otros usuarios de ese mismo servicio y, al menos, servirá para negociar la licencia de acceso del próximo año ¿sólo servirá para eso? Si han utilizado algún sistema inteligente, saben también qué guardó en el ordenador utilizado... y que escucha música en MP3, mientras hace las búsquedas?).

martes, octubre 05, 2010

TECNOLOGÍAS DE INFORMACIÓN Y LAS COMUNICACIÓNES (TIC)

Las Tecnologías de la Información y las Comunicaciones (en adelante TIC), son el conjunto de recursos, herramientas, equipos, programas informáticos, aplicaciones, redes y medios, que permiten la compilación, procesamiento, almacenamiento, transmisión de información como: voz, datos, texto, vídeo e imágenes.

LEY 1341 (30 de julio de 2009)

El Presidente Álvaro Uribe sancionó la Ley 1341 del 30 de julio de 2009 con la que se busca darle a Colombia un marco normativo para el desarrollo del sector de Tecnologías de Información y Comunicaciones (TIC), promueve el acceso y uso de las TIC a través de la masificación, garantiza la libre competencia, el uso eficiente de la infraestructura y el espectro, y en especial, fortalece la protección de los derechos de los usuarios.
Según el Ministerio de Comunicaciones, la nueva Ley permite a los operadores prestar cualquier servicio que técnicamente sea viable, pone en igualdad de condiciones a los operadores en el momento de prestar dichos servicios y hace especial énfasis en la protección de los usuarios de telecomunicaciones. En adelante los ciudadanos que tengan quejas en la prestación de servicios de telefonía móvil, internet o telefonía fija, podrán acudir a la Superintendencia de Industria y Comercio, única entidad encargada de resolver sus reclamaciones.

El Derecho a la comunicación, la información y la educación y los servicios básicos de las TIC

El Estado propiciará a todo colombiano el derecho al acceso a las tecnologías de la información y las comunicaciones básicas, que permitan el ejercicio pleno de los siguientes derechos: La libertad de expresión y de difundir su pensamiento y opiniones, la de informar y recibir información veraz e imparcial, la educación y el acceso al conocimiento, a la ciencia, a la técnica, y a los demás bienes y valores de la cultura. Adicionalmente el Estado establecerá programas para que la población de los estratos desarrollará programas para que la población de los estratos menos favorecidos y la población rural tengan acceso y uso a las plataformas de comunicación, en especial de Internet y contenidos informáticos y de educación integral.

EXTRACCIÓN DE INFORMACIÓN (IE)

EXTRACCIÓN DE INFORMACIÓN (IE)

Es la búsqueda realizada manual o automatizadamente de términos, párrafos o partes de un documento, que contengan la información requerida por un usuario a partir de una pregunta o interrogante, y cuyos resultados serán presentados de forma estructurada. La información plasmada en lenguaje natural en un documento se presenta casi siempre de manera no estructurada (texto libre). Esto ha supuesto un obstáculo para la recuperación, por parte de las máquinas, de la información contenida en un documento.

La extracción de información tiene por objetivo que la información desestructurada de un documento sea más accesible y recuperable por parte de la máquina. En otras palabras, se trata de estructurar la información de un documento, de modo que la máquina pueda recuperar la información contenida en el documento. La extracción de información se basa en el uso de técnicas de procesamiento del lenguaje natural sobre dominios muy acotados.

Es preciso diferenciar entre el concepto de extracción de información y el de recuperación de la información. Mientras la recuperación de información se refiere a la recuperación de documentos relevantes existentes en una colección, la extracción de información trata de extraer la información relevante en los documentos.


PROBLEMA DE LOS LENGUAJES DE CONSULTA Y RECUPERACIÓN DE INFORMACIÓN 

TRANSFORMACIÓN DE LENGUAJES
Es el proceso de estandarización de una consulta, para que de esta forma sea "entendida" por una máquina, si los resultados obtenidos después de este proceso no llenan por completo el vacio cognitivo, se debe realizar un cambio en la necesidad inicialmente planteada, esto quiere decir que hay que reformular la pregunta o interrogante hasta obtener información de gran relavancia sobre el tema consultado. LA CLAVE ESTA EN SABER PREGUNTAR.

TIPOS DE REPRESENTACIÓN DE LA INFORMACIÓN
  • Lenguaje natural humano: Lenguaje utilizado de forma cotidiana para la comunicación, es comprensible para un gran número de ususarios, permite expresar cualquier significado o concepto y es tolerante a fallos; pero presenta inconvenientes o desventajas como la ambigüedad, poco conciso y es de dificil interpretación por parte de un computador.

  • Lenguaje natural restringido: Es un subconjunto del lenguaje natural ya que al poseer terminos controlados, hace uso de leguajes también controlados por ejemplo: Las taxonomías y los tesauros. Este lenguaje restringido limita el vocabulario que puede ser utilizado y las reglas sintacticas que pueden aplicarse al mismo, pero presenta inconvenientes tales como la forma de definición de las restricciones, la no aceptación por parte de los usuarios al no poder expresar la información como ellos desearían y adicional a esto se corre el riesgo de que las reglas sintacticas sean pocas y no representen en su totalidad la información deseada.

  • Lenguaje artificial: Es el lenguaje informático, compuesto por un vocabulario muy limitado y por unas reglas sintacticas claras y específicas que no dan lugar a ambigüedades, se gana en la capacidad de almacenamiento y en la simplicidad de los procesos, es fácil controlar los errores cometidos a través de su uso pero la gran desventaja es que los usuarios deben apreneder un lenguaje muy diferente al lenguaje natural.

lunes, septiembre 27, 2010

Análisis COSMOS - Carl Sagan


COSMOS (Carl Sagan)
Análisis realizado a documental visto en clase de Recuperación de información

Introducción

Carl Sagan nació en Nueva York en 1934 y se graduó en Física en la universidad de Chicago en 1955 y obtuvo el doctorado en astrofísica en 1960. Colaboró con la NASA durante 30 años en programas de investigación planetaria como Mariner y Voyager y publicó numerosos trabajos relacionados con el mundo de la astronomía. Pero no será hasta 1980 cuando presentará la serie televisiva Cosmos, compuesta por trece capítulos que darían lugar al libro del mismo nombre que fue líder de ventas en 60 países convirtiéndose en el libro de ciencia más vendido del siglo pasado. Sagan murió en 1996 debido a una extraña enfermedad que le fue diagnosticada dos años atrás.

En la orilla del océano cósmico

El primero de los 13 capítulos que componen la serie Cosmos,  introduce de lleno en la vida real, en la que Carl Sagan nos propondrá un viaje en la nave “Imaginación” que nos llevará a descubrir los misterios del Universo, dándonos así a conocer fenómenos cósmicos tales como las supernovas, las estrellas o los quásares. Se emprende el viaje por el cosmos que, guiado por las mismas leyes físicas en toda su extensión, muestra el conjunto de estrellas que forman un quásar, que engulle galaxias más pequeñas a su vez. de igual forma introduce el concepto de año luz, término que empleará para sus explicaciones.

Se puede apreciar el ciclo de vida de una galaxia, que nace y se desarrolla como un ser vivo, y que al morir estallan liberando una gran cantidad de energía que produce un enorme eco a lo largo de la inmensidad cósmica que incinerará estrellas y planetas cercanos a su paso.También se puede dar la explosión de una de las estrellas que componga dicha galaxia, haciendo que su brillo se distinga por encima de la propia galaxia.

En este peculiar viaje se observa un “grupo local”, conjunto de 20 galaxias que ocupan una superficie de 3.000.000 de años luz. Nos acerca a nuestra galaxia, la Vía Láctea, una galaxia espiral de 100.000 años luz de diámetro. En ésta, como en cualquier otra, se pueden apreciar las supernovas, restos de estrellas que se han destruido a sí mismas, al acabar su ciclo estelar. En el centro de la estrella destruida se encuentran sus restos, los denominados púlsares, soles que giran sobre si mismo emitiendo un haz de luz dos veces por segundo con gran exactitud, actuando como faros naturales. Esto hacía pensar en formas de vida extraterrestres. Los púlsares son la prueba de que las estrellas también mueren. En las galaxias, las estrellas más calientes suelen morir antes, mientras que las gigantes rojas tienen una larga vida y no poseen planetas que circulen alrededor de ellas. Las estrellas más comunes son las enanas amarillas, como el Sol. Al comprobar la inmensidad de sistemas planetarios, nos preguntamos acerca de la existencia de inteligencia extraterrestre y su forma de vida.

Eratóstenes y la medida de la circunferencia terrestre

En el antiguo Egipto, Eratóstenes (siglo III a.C.) fue astrónomo, matemático e historiador. También fue director de la gran biblioteca de Alejandría, centro cultural del mundo antiguo. Eratóstenes quiso calcular la circunferencia terrestre fijándose en las sombras que proyectaban dos obeliscos en sus respectivas ciudades separados por 800 Km. Contrató un hombre que midiera la distancia entre las dos ciudades, analizó la sombra que proyectaban los obeliscos y llegó a la conclusión de que las sombras tenían diferente longitud debido a la curvatura de la Tierra, y que cuanto mayor fuera la curvatura mayor sería la diferencia de longitud.
Calculando la amplitud del arco formado por los obeliscos (7º, la cincuentava parte de una circunferencia) y la distancia entre las dos ciudades (800 Km), dedujo que la circunferencia terrestre debía medir unos 40.000 Km, una medida muy exacta teniendo en cuenta los rudimentarios métodos de la época que Eratóstenes utilizó.

La biblioteca de Alejandría

La ciudad de Alejandría poseía una gran biblioteca, en la que se reunían los grandes intelectuales de la época. Sagan nos lleva a la biblioteca mediante un viaje del tiempo a su época de mayor esplendor, donde se fraguó el inicio de la aventura espacial. Estudiaban el cosmos y muchas más ciencias, como Euclides, que se dedicó al estudio de la geometría e Hiparlo, que estudió las estrellas y las constelaciones.

Los organizadores de la biblioteca iniciaron una colección de pergaminos que, requisados a sus dueños, eran copiados y devueltos a sus dueños, aumentando así el saber de la civilización egipcia. En el momento de mayor esplendor se calcula que la biblioteca llegó a poseer cerca de un millón de pergaminos, que fueron destruidos y de los que sólo se conserva un pequeña parte.

Muchos astrónomos postularon sus teorías en libros que se destruyeron con la biblioteca, como Aristarco de Samos, que dijo que los planetas giraban alrededor del Sol. Hacia el final del documental, Sagan hace un breve resumen de la edad del Universo en un año cósmico de 15000 millones de años, tomando como escala el minuto, que equivaldría a 30.000 años de la edad terrestre. Sitúa la formación de la Vía Láctea y la Tierra, el nacimiento de la especie humana, el descubrimiento del fuego, la producción de herramientas y el éxodo rural, entre otros acontecimientos dignos de señalar en la historia de la humanidad.

Finalmente, deja un final abierto dándonos a nosotros la responsabilidad de lo que pase en el próximo año cósmico desde el primer segundo de este próximo año.
_____________________________________________

COSMOS episodio 1

ESTRUCTURA DE LOS DOCUMENTOS

DEFINICIONES BÁSICAS

Carácter: Cualquier símbolo numérico, alfabético o especial que se emplea en la escritura y en el calculo
  • Numéricos: 0,1,2,.....9
  • Alfabéticos: a, b, c ...., z, A, B, C... , Z.
  • Especiales: *, /, +, #,..
  • De control: retorno de carro, Fin de fichero (EOF)...
  • Gráficos   ╗
Dato: Representación simbólica (numérica, alfabética, etc.), de un atributo o característica de una entidad. El dato no tiene valor semántico (sentido) en sí mismo, permite ser procesado en la realización de cálculos ó la toma de decisiones.

Información: Conjunto de datos (numéricos, alfabéticos y alfanuméricos) ordenados con los que se representan convencionalmente hechos, objetos e ideas. Son un conjunto de datos con sentido y útiles para algo o alguien.

Capta (Capere-Tomar): Consiste en la Selección Manual ó Automática de Información Relevante, esta debe ser subjetiva y transparente para asegurar de esta forma la supervivencia informacional y prevenir la infoxicación.

Conocimiento: Es la apropiación, procesamiento, depuración, etc.. de la información hecha por un ser humano en estructuras mentales, para realizar alguna tarea.

Documento: Es cualquier Fuente de información usable, todo aquello organizado para permitir su observación, Análisis y Estudio, adicionalmente debe estar codificado en un formato y almacenado en un soporte que facilite a futuro su recuperación.

Documento Electrónico: Es toda representación electrónica que da testimonio de un hecho, una imagen o una idea. Requiere de una máquina para la visualización de su contenido, por ejemplo: un video casette.

Documento Digital: Es la representación en medio digital de un documento, contenido, textos, imágenes, sonidos, videos, etc., es una secuencia de bits (1 y 0) que representan cualquier tipo de información, esto permite almacenar grandes cantidades de información en espacios reducidos, facilitando su reproducción y distribución.

Documento Virtual: Es aquel que se va construyendo de acuerdo a las necesidades particulares del usuario, existe en el momento que es requerido, su generación es automática en un lapso de tiempo determinado.



COMPONENTES DE UN DOCUMENTO

Estructura: Son los elementos constitutivos de un documento, es la disposición lógica dada a la información contenida, por ejemplo: Encabezado, título, párrafo, etc.

Contenido: Es la información como tal a que hace referencia el documento, como su nombre lo indica es el contenido.

Formato: Son las diferentes características usadas a lo largo de todo el documento, son aquellas que dan forma y presentación, por ejemplo: Tipo de fuente, tamaño de fuente, alineación, efecto, etc.

Contexto: Es aquella información que permite la comprensión completa y adecuada del documento, por ejemplo: fecha, autor, tema.

Documento estructurado: Habitualmente el resultado de aplicar un sistema de extracción de información a cualquier texto es un documento estructurado del tipo XML. Si el documento de origen es ya de por sí un documento estructurado, resulta mucho más sencillo analizarlo para obtener las entidades y sus relaciones, siempre y cuando esté debidamente etiquetado. En un documento estructurado son conocidas las entidades a partir del etiquetado y, posiblemente, algunas relaciones o roles de las mismas, se identifican todas y cada una de sus partes constitutivas.
Documento no estructurado: Los documentos escritos en lenguaje natural son el objetivo principal de los sistemas de extracción de información ya que son la gran mayoría de los documentos existentes. Para extraer la información de estos documentos es necesario realizar las tareas descritas anteriormente (reconocimiento de entidades, resolución de anáforas, reconocimiento del rol, reconocer relaciones). El tipo de información que los sistemas de extracción de información son capaces de extraer varía en función del documento. Por ejemplo, entidades con nombre propio como personas, organizaciones o lugares se recuperan actualmente con una fiabilidad del 90 %, pero esta fiabilidad se ve reducida al extraer atributos de dichas entidades, hechos o eventos relacionados. En este tipo de documentos no se ven identificadas las diferentes partes que lo constituyen.
Documento semi - estructurado: Son documentos mixtos que contienen parte estructurada y parte no estructurada, maneja elementos constitutivos pero estos no son de obligatorio cumplimiento.
  • Un registro no necesariamente tiene que tener todos sus atributos definidos. Mientras por ejemplo en una base de datos relacional un campo debe establecerse como NULO cuando no se tiene, en un ambiente de datos semiestructurados basta con omitir dicho atributo.
  • Un atributo de un registro puede ser otro registro
  • No existe necesariamente una diferencia entre un identificador de un campo y el valor mismo de este.

sábado, septiembre 25, 2010

MEMORIAS DE CLASE

SOCIEDAD DE LA INFORMACIÓN 

http://creativecommons.org/licenses/by/2.5/es/
Una sociedad de la información es aquella en la cual las tecnologías que facilitan la creación, distribución y manipulación de la información juegan un papel importante en las actividades sociales, culturales y económicas. La noción de sociedad de la información ha sido inspirada por los programas de los países industrializados. El término sería más bien un término político que teórico, pues se presenta como una aspiración estratégica que permitiría superar el estancamiento social.

INFOXICACIÓN El exceso de información que se produce con el alud de información disponible hoy en día produce una dificultad para digerir tanto volumen en tan poco tiempo.
  • En el 2008 el universo digital era de 487.000 millones de Gigabytes equivalente a 487 Exabytes
  • En el 2012 se calcula que tendrá un crecimiento del 500% respecto al año 2008.