Mostrando entradas con la etiqueta Sistemas de recuperación de información. Mostrar todas las entradas
Mostrando entradas con la etiqueta Sistemas de recuperación de información. Mostrar todas las entradas

domingo, noviembre 28, 2010

Plagio académico: La generación "copia y pega"

Plagio académico: La generación "copia y pega"

"recuperación de información" "programa de sistemas de información" "Universidad de La Salle"

jueves, noviembre 04, 2010

Knowledge Tree Introducción

Introduccion a Knowledge Tree 

"recuperación de información" "programa de sistemas de información" "Universidad de La Salle"

KnowledgeTree

Creacion de Tipos de Archivo en KnowledgeTree


"recuperación de información" "programa de sistemas de información" "Universidad de La Salle"

instalar google desktop


"recuperación de información" "programa de sistemas de información" "Universidad de La Salle"

viernes, octubre 22, 2010

ESQUEMA DIGITALIZACIÓN DE DOCUMENTOS

"recuperación de información" "programa de sistemas de información" "Universidad de La Salle"



Elaborado por: Omaira Rincón

TENDENCIAS EN OUTSOURCING DE LA GERENCIA DEL CONTENIDO DE LA EMPRESA

"recuperación de información" "programa de sistemas de información" "Universidad de La Salle"


María Omaira Rincón

Bogotá, febrero 12 de 2007

 

Trends In Enterprise Content Management Outsourcing

Business pains are driving the emergence of ECM outsourcing services.


Tendencias en Outsourcing de la gerencia del contenido de la empresa
La emergencia en los negocios está conduciendo a la aparición de los servicios de outsourcing del ECM.

La necesidad en los negocios de hoy esta conduciendo a la aparición de los servicios de outsourcing de la administración de contenidos ECM; la mayoría de estos servicios se dan en las áreas donde hay mayor cantidad de información de decisiones, que incluyen imágenes y otro tipo de información de llegada como lo son las formas y los faxes, las impresiones gerencialas por los procesos salientes y entrantes y los documentos electrónicos, que por propósitos legales se deben guardar por largos periodos. Mucho de este tipo de contenidos se origina fuera de la organización por parte de clientes externos o socios que confían en el flujo de trabajo o BMP, para manejar los procesos del negocio.

Los contenidos iniciales del  ECM, tales como la colaboración entre el equipo y la administración documental son para apoyar R&D, o la gerencia del contrato apoyados en ambientes legales corporativos, siguen siendo iniciativas internas para la mayoría de las empresas.

Por lo general este tipo de empresas tienen inconvenientes con su información debido a que la interacción entre usuarios y clientes aun no ha sido estandarizada, para las transacciones o intercambios, haciendo más difícil que los outsourcing desplieguen clientes múltiples y tengan posibilidades de ofrecer alternativas ECM como:


miércoles, octubre 20, 2010

LAS COMUNIDADES VIRTUALES

Se podría definir a las Comunidades Virtuales como "lugares" dentro del ciberespacio en el que interaccionan personas con intereses, aficiones, o motivaciones comunes. “Comunidad virtual es aquel contexto social en el que, entre sus miembros, se producen y mantienen interacciones en las que se negocian significados, al tiempo que sus propias identidades, en una dinámica de construcción de un sistema cultural o cibercultura que les permite acceder, compartir, cogenerar y construir conocimiento socialmente”.

TIPOS DE COMUNIDADES VIRTUALES

A continuación se identificarán cuáles son las diferentes herramientas existentes para la creación de comunidades virtuales:

1) Foros de discusión

Los foros de discusión son una herramienta, sustentada en una base de datos alojada en un servidor, que permite a los usuarios que se conecten a la misma, mediante el uso de su navegador, leer los mensajes incluidos por el resto de miembros de la comunidad, elegir el tema de interés (de forma que se puedan filtrar los mensajes) e incluir si se desea una respuesta a los mensajes visualizados. Un buen ejemplo de esta tecnología se puede encontrar en ICTNet, quizá la comunidad de profesionales de habla hispana que mayor éxito ha tenido en Internet hasta el momento.

El tipo de base de datos que se utilice, o mejor dicho, el software que gestiona la base de datos y que publica los mismos en la web, determinará la forma en la que los usuarios visualizan los mensajes. En este sentido, algunos programas publican los mensajes de forma cronológica, mientras que otros agrupan los mensajes por tema, creando así "arboles" que facilitan el seguimiento de un debate.

Por último, debe señalarse la necesidad de que estos sistemas incluyan la posibilidad de hacer llegar a los participantes los mensajes añadidos el mismo día o la última semana, o bien un resumen de los mismos a través del correo electrónico. Algunos de ellos, incluso incluyen la posibilidad de avisar al individuo cuando alguien ha contestado a un mensaje publicado previamente.

2) Email y email groups

La herramienta de comunicación más antigua en el desarrollo de CVs es seguramente el email, ya que se trata de una de las primeras tecnologías que se generalizaron en Internet. Normalmente, las CVs organizadas mediante email utilizan emails groups o listas de correo, es decir, un sistema de software, más o menos complejo (list-bot), a través del cual los mensajes enviados por un miembro de la CV son reenviados al resto.

Actualmente, el uso de listas de correo como herramienta exclusiva en la gestión de CVs es poco habitual. Lo normal es que se encuentre asociado a una página web que sirve de soporte y mecanismo promocional a la comunidad. En todo caso, existen algunos colectivos cuya única fuente de contacto es el email, como por ejemplo ciertos grupos de investigación.

Existen miles de listas de correo (ver el buscador www.liszt.com/), y en muchas ocasiones, suelen estar asociadas al envío de boletines (newsletter). Además, cabe señalar la conveniencia de que estas listas posean algún tipo de mecanismo de seguridad que impida: (1) que se inscriban en las mismas individuos cuyo perfil no sea el adecuado o (2) que terceros añadan a otros en las listas sin su permiso (una posibilidad es utilizar email de confirmación). Por último, indicar que en muchas ocasiones estas listas necesitan de la moderación para evitar mensajes indeseados como el spam.

ALFABETIZACIÓN INFORMACIONAL (ALFIN)

La alfabetización informacional, expresión conocida por el acrónimo ALFIN, proviene de la traducción de Information literacy, y surge de la evolución y maduración de conceptos y prácticas que se han dado en contextos educativos y bibliotecarios.

Supone mucho más que realizar:

- cursos de informática y acceso a Internet

- actividades de animación y comprensión lectora con textos informativos, impresos y electrónicos

- actividades de formación de usuarios para la localización de materiales

- un eficaz servicio de consulta y préstamo en la mediateca escolar

- trabajos escolares en las bibliotecas, sacando información de enciclopedias u otros documentos.

Su finalidad última es el aprendizaje a lo largo de la vida, siendo las bibliotecas, con sus recursos materiales y humanos, un entorno esencial para la educación formal, no formal e informal. En este sentido, implica a docentes y bibliotecarios, como las dos caras de la misma moneda de este nuevo proceso alfabetizador, de un aprendizaje basado en recursos y en el desarrollo de habilidades para aprender a aprender.

lunes, octubre 18, 2010

LAS REDES ACADÉMICAS AVANZADAS

UNA OPORTUNIDAD PARA COMPARTIR EVENTOS INTERACTIVOS DE DIVULGACIÓN

Los sistemas de telecomunicación se han convertido en un apoyo importante para la difusión de la cultura.Videoconferencias interactivas y sistemas de video en Internet son herramientas muy usadas para la transmisión de eventos culturales importantes y son actualmente medios de comunicación cada vez más accesibles a las instituciones dedicadas a la divulgación de la ciencia.

En Universum, el Museo de las Ciencias de la UNAM, el uso de las herramientas de telecomunicación ha ampliado el área de impacto de las actividades, ha mejorado los mecanismos de colaboración para compartir experiencias exitosas de atención a los jóvenes y ha creado nuevas posibilidades educativas para los visitantes.

El hecho de que el museo Universum forme parte de la Dirección General de Divulgación de la Ciencia de la Universidad Nacional representa tener acceso a las modernas redes académicas de banda ancha, las cuales son una línea de comunicación con amplia capacidad que garantiza transmisiones interactivas de calidad con instituciones de casi todo el mundo. Esta facilidad se aprovecha en el museo mediante el proyecto “Divulgación de la ciencia a distancia”, el cual involucra la transmisión regular de algunas de las actividades de Universum hacia lugares distantes, por medio de videoconferencia interactiva y transmisiones de webcast. Aunque la mayoría de las transmisiones del proyecto se realizan hacia diversos Estados de la República Mexicana, el siguiente trabajo presenta también los casos de colaboración con instituciones en otros países del continente y muestra las posibles vías para compartir eventos a distancia entre programas, museos o centros de ciencia de Latinoamérica aprovechando las redes académicas avanzadas.

miércoles, octubre 13, 2010

TÉCNICAS DE RECUPERACIÓN DE INFORMACIÓN

Sistemas de recuperación de lógica difusa. Permite establecer consultas con frases normales. La máquina, al realizar la búsqueda, elimina signos de puntuación, artículos, conjunciones, plurales, tiempos verbales, etc., dejando sólo las palabras relevantes. La recuperación se basa en proposiciones lógicas con valores de verdadero y falso, teniendo en cuenta la localización de la palabra en el documento.
Técnicas de ponderación de términos. En la búsqueda unos criterios tienen más valor que otros, dependiendo de los intereses del usuario. Los documentos recuperados se encuentran en función del valor obtenido en la ponderación. El documento más pertinente de búsqueda sería aquel que tenga representado todos los términos de búsqueda y, además, el que más valor tenga repetidos más veces.
Técnica de clustering. Es un modelo probabilístico que permite las frecuencias de los términos de búsqueda en los documentos recuperados. Se atribuyen unos valores (pesos) que actúan como agentes para agrupar los documentos por orden de importancia, mediante algoritmos ranking.Algoritmos utilizados para realizar la categorización (cluster): clustering
  • Algoritmo K means
  • COBWEB
  • Algoritmo EM
Técnicas de retroalimentación por relevancia. Con ella, se pretende obtener el mayor número de documentos relevantes. El proceso consiste en repetir nuevamente la consulta; pero esta vez con los elementos interesantes, selecciona dos de los documentos primeramente recuperados.
Técnicas de stemming. Morfológicamente las palabras están estructuradas en prefijos, sufijos y la raíz. La técnica de Stemming lo que pretende es eliminar las posibles confusiones semánticas que se puedan dar en la búsqueda de un concepto, para ello trunca la palabra y busca solo por la raíz. Algoritmos utilizados para desechar prefijos y sufijos:
  • Paice/Husk
  • S stemmer / n gramas
  • Técnicas lingüísticas
Pretenden acotar los documentos relevantes. Esta técnica lo consigue mediante una correcta indización en el proceso de tratamiento de los documentos con ayuda de índices, tesauros, etc.; evitando las ambigüedades léxicas y semánticas a la hora de establecer las consultas.
Metadatos. Se utilizan para detectar información relevante. Las etiquetas describen el contenido del recurso web. Principalmente son las etiquetas de palabra clave y título las que dan paso a localizar el documento.

domingo, octubre 10, 2010

IMPORTANCIA DE LA SEGURIDAD DE LA INFORMACIÓN

La importancia que tiene la seguridad de la información y el poder que implica manejar información es un tema muy delicado que no está en el conocimiento de muchos. En el contexto de internet, muchos usuarios no le dan mayor importancia a la información que publican en la red y de qué forma lo hacen y más aún, muchos no diferencian lo privado de lo público, no por que no quieran o porque no saben cómo diferenciar una cosa de la otra, simplemente es por ignorancia, el problema radica en la recuperación de la información. Para mucha gente es normal pertenecer en redes sociales y publicar su vida, mientras más conocidos sean y más amigos tengan en esa red social más importante se creen y es esta “vulnerabilidad” la que se está explotando: La ingenuidad y/o ignorancia del usuario. Por otro lado están las empresas, quienes son las encargadas de manejar la información privada y/o pública que los usuarios les confían, por ejemplo en el caso de un concurso, típicamente los datos que piden son nombre, apellido, ciudad, Rut/DNI, etc.

La pregunta que sale a flote es ¿Para qué quieren el Rut/DNI en un concurso, si con el teléfono es suficiente para que los puedan ubicar? La respuesta es simple, todos esos datos van a una base de datos que puede ser vendida o usada para enviar publicidad no deseada, más conocido como spam. Con seguridad a nadie le gustaría que esto fuese realidad, pero lo es. Por más que la empresa intente explicar por medio de “letra chica” o “términos y condiciones” que el uso de la información suministrada está fuera de peligro y que serán usados sólo para tal y tal fin. Pues eso es mentira. Se han escuchado experiencias y existen las pruebas necesarias de que eso no ocurre, ni si quiera las entidades del gobierno son capaces de cumplir con algo tan básico como es la protección de la información privada y, de hecho, ni si quiera los mismos usuarios son capaces de proteger su información.
Cabe dentro del tema hacer un análisis de los tipos de passwords que son inseguros, se han clasificado de la siguiente manera:

viernes, octubre 08, 2010

TECNICAS SEO Y SEM

SEO y SEM son técnicas publicitarias por la web universalmente aceptadas por los usuarios con las variaciones propias de cada caso en particular. Las técnicas que se usan en la actualidad para atraer visitantes a una determinada página web pueden ser varias, pero las más difundidas son dos: SEO (optimización de la búsqueda en buscadores) y SEM (“mercadeo” en buscadores).

MUNDO SEO

SEO es en realidad un grupo de pasos y procesos que se ponen en práctica para poder aumentar en forma significativa el número de visitas que se hacen a un determinado sitio web, con este incremento de visitas se logra hacer subir en el “ránking” a ese sitio web en los buscadores más conocidos y consultados,o sea que lo que se consigue es mejorar el posicionamiento de un sitio web dentro de un buscador, lo cual redundará obviamente en beneficios para ese sitio a la hora de publicitar en él. Con esta técnica logramos que nuestra página se ubique lo más alto posible en Google, MSN, Yahoo y todos aquellos buscadores que aseguren un alto número de visitas.
Las técnicas para mejorar el posicionamiento en los buscadores, teniendo la precaución de usar las palabras o frases correctas, son muchas, y deben ser ineludiblemente tenidas en cuenta si se quiere lograr éxito en el tráfico de nuestra página. Ninguna de estas técnicas de posicionamiento es considerada ilegal por los distintos buscadores, mientras no se violen reglas básicas de lealtad comercial y políticas del buscador en cuestión.

MUNDO SEM

SEM son las iniciales en Inglés de “Search Engine Marketing” o , traducido a nuestro idioma, “mercadeo por la web”. Tiene en cuenta todo lo que se relaciona con el marketing y la publicidad dentro de los sistemas de búsqueda en la red,prácticamente todos los buscadores en Internet tienen algún sistema propio de publicidad dentro de su estructura que complementa los servicios que ofrecen a los usuarios, tanto los que visitan el buscador a la espera de encontrar algo como los que presentan sus notas o servicios mediante dicho buscador.Desde ya que estos sistemas pueden direccionar la publicidad de acuerdo a la búsqueda que está realizando el usuario. Así las campañas publicitarias ya parten de un segmento de usuarios que de hecho puede estar interesado en el producto que se publicita.

LA SOCIEDAD DE LA INFORMACIÓN

La Sociedad de la Información es expresión de las realidades y capacidades de los medios de comunicación más nuevos, o renovados merced a los desarrollos tecnológicos que se consolidaron en la última década del siglo: la televisión, el almacenamiento de información, la propagación de video, sonido y textos, han podido comprimirse en soportes de almacenamiento como los discos compactos o a través de señales que no podrían conducir todos esos datos si no hubieran sido traducidos a formatos digitales. La digitalización de la información es el sustento de la nueva revolución informática. Su expresión hasta ahora más compleja, aunque sin duda seguirá desarrollándose para quizá asumir nuevos formatos en el mediano plazo, es la Internet.


CARACTERÍSTICAS DE LA SOCIEDAD DE LA INFORMACIÓN
  1. Exuberancia.. Disponemos de una apabullante y diversa cantidad de datos. Se trata de un volumen de información tan profuso que es por sí mismo parte del escenario en donde nos desenvolvemos todos los días.
  2. Omnipresencia. Los nuevos instrumentos de información, o al menos sus contenidos, los encontramos por doquier, forman parte del escenario público contemporáneo (son en buena medida dicho escenario) y también de nuestra vida privada. Nuestros abuelos (o bisabuelos, según el rango generacional en el que estemos ubicados) fueron contemporáneos del surgimiento de la radio, se asombraron con las primeras transmisiones de acontecimientos internacionales y tenían que esperar varios meses a que les llegara una carta del extranjero; para viajar de Barcelona a Nueva York lo más apropiado era tomar un buque en una travesía de varias semanas. La generación siguiente creció y conformó su imaginario cultural al lado de la televisión, que durante sus primeras décadas era sólo en blanco y negro, se enteró con pasmo y gusto de los primeros viajes espaciales, conformó sus preferencias cinematográficas en la asistencia a la sala de cine delante de una pantalla que reflejaba la proyección de 35mm y ha transitado no sin asombro de la telefonía alámbrica y convencional a la de carácter celular o móvil. Los jóvenes de hoy nacieron cuando la difusión de señales televisivas por satélite ya era una realidad, saben que se puede cruzar el Atlántico en un vuelo de unas cuantas horas, han visto más cine en televisión y en video que en las salas tradicionales y no se asombran con la Internet porque han crecido junto a ella durante la última década: frecuentan espacios de chat, emplean el correo electrónico y manejan programas de navegación en la red de redes con una habilidad literalmente innata. Esa es la Sociedad de la Información. Los medios de comunicación se han convertido en el espacio de interacción social por excelencia, lo cual implica mayores facilidades para el intercambio de preocupaciones e ideas pero, también, una riesgosa supeditación a los consorcios que tienen mayor influencia, particularmente en los medios de difusión abierta (o generalista, como les llaman en algunos sitios).
  3. Irradiación. La Sociedad de la Información también se distingue por la distancia hoy prácticamente ilimitada que alcanza el intercambio de mensajes. Las barreras geográficas se difuminan; las distancias físicas se vuelven relativas al menos en comparación con el pasado reciente. Ya no tenemos que esperar varios meses para que una carta nuestra llegue de un país a otro. Ni siquiera debemos padecer las interrupciones de la telefonía convencional. Hoy en día basta con enviar un correo electrónico, o e-mail, para ponernos en contacto con alguien a quien incluso posiblemente no conocemos y en un país cuyas coordenadas tal vez tampoco identificamos del todo.
  4. Velocidad. La comunicación, salvo fallas técnicas, se ha vuelto instantánea. Ya no es preciso aguardar varios días, o aún más, para recibir la respuesta del destinatario de un mensaje nuestro e incluso existen mecanismos para entablar comunicación simultánea a precios mucho más bajos que los de la telefonía tradicional.
  5. Multilateralidad / Centralidad. Las capacidades técnicas de la comunicación contemporánea permiten que recibamos información de todas partes, aunque lo más frecuente es que la mayor parte de la información que circula por el mundo surja de unos cuantos sitios. En todos los países hay estaciones de televisión y radio y en muchos de ellos, producción cinematográfica.. Sin embargo el contenido de las series y los filmes más conocidos en todo el mundo suele ser elaborado en las metrópolis culturales. Esa tendencia se mantiene en la Internet, en donde las páginas más visitadas son de origen estadounidense y, todavía, el país con más usuarios de la red de redes sigue siendo Estados Unidos.
  6. Interactividad / Unilateralidad. A diferencia de la comunicación convencional (como la que ofrecen la televisión y la radio tradicionales) los nuevos instrumentos para propagar información permiten que sus usuarios sean no sólo consumidores, sino además productores de sus propios mensajes. En la Internet podemos conocer contenidos de toda índole y, junto con ello, contribuir nosotros mismos a incrementar el caudal de datos disponible en la red de redes. Sin embargo esa capacidad de la Internet sigue siendo poco utilizada. La gran mayoría de sus usuarios son consumidores pasivos de los contenidos que ya existen en la Internet.
  7. Desigualdad. La Sociedad de la Información ofrece tal abundancia de contenidos y tantas posibilidades para la educación y el intercambio entre la gente de todo el mundo, que casi siempre es vista como remedio a las muchas carencias que padece la humanidad. Numerosos autores, especialmente los más conocidos promotores de la Internet, suelen tener visiones fundamentalmente optimistas acerca de las capacidades igualitarias y liberadoras de la red de redes (por ejemplo Gates: 1995 y 1999 y Negroponte, 1995). Sin embargo la Internet, igual que cualquier otro instrumento para la propagación y el intercambio de información, no resuelve por sí sola los problemas del mundo. De hecho, ha sido casi inevitable que reproduzca algunas de las desigualdades más notables que hay en nuestros países. Mientras las naciones más industrializadas extienden el acceso a la red de redes entre porcentajes cada vez más altos de sus ciudadanos, la Internet sigue siendo ajena a casi la totalidad de la gente en los países más pobres o incluso en zonas o entre segmentos de la población marginados aún en los países más desarrollados.
  8. Heterogeneidad. En los medios contemporáneos y particularmente en la Internet se duplican y multiplican actitudes, opiniones, pensamientos y circunstancias que están presentes en nuestras sociedades. Si en estas sociedades hay creatividad, inteligencia y arte, sin duda algo de eso se reflejará en los nuevos espacios de la Sociedad de la Información. Pero de la misma manera, puesto que en nuestras sociedades también tenemos prejuicios, abusos, insolencias y crímenes, también esas actitudes y posiciones estarán expresadas en estos medios. Particularmente, la Internet se ha convertido en foro para manifestaciones de toda índole aunque con frecuencia otros medios exageran la existencia de contenidos de carácter agresivo o incómodo, según el punto de vista de quien los aprecie.
  9. Desorientación. La enorme y creciente cantidad de información a la que podemos tener acceso no sólo es oportunidad de desarrollo social y personal. También y antes que nada, se ha convertido en desafío cotidiano y en motivo de agobio para quienes recibimos o podemos encontrar millares de noticias, símbolos, declaraciones, imágenes e incitaciones de casi cualquier índole a través de los medios y especialmente en la red de redes. Esa plétora de datos no es necesariamente fuente de enriquecimiento cultural, sino a veces de aturdimiento personal y colectivo. El empleo de los nuevos medios requiere destrezas que van más allá de la habilidad para abrir un programa o poner en marcha un equipo de cómputo. Se necesitan aprendizajes específicos para elegir entre aquello que nos resulta útil, y lo mucho de lo que podemos rescindir.
  10. Ciudadanía pasiva. La dispersión y abundancia de mensajes, la preponderancia de los contenidos de carácter comercial y particularmente propagados por grandes consorcios mediáticos y la ausencia de capacitación y reflexión suficientes sobre estos temas, suelen aunarse para que en la Sociedad de la Información el consumo prevalezca sobre la creatividad y el intercambio mercantil sea más frecuente que el intercambio de conocimientos. No pretendemos que no haya intereses comerciales en los nuevos medios –al contrario, ellos suelen ser el motor principal para la expansión de la tecnología y de los contenidos–. Pero sí es pertinente señalar esa tendencia, que se ha sobrepuesto a los proyectos más altruistas que han pretendido que la Sociedad de la Información sea un nuevo estadio en el desarrollo cultural y en la humanización misma de nuestras sociedades.

martes, octubre 05, 2010

TECNOLOGÍAS DE INFORMACIÓN Y LAS COMUNICACIÓNES (TIC)

Las Tecnologías de la Información y las Comunicaciones (en adelante TIC), son el conjunto de recursos, herramientas, equipos, programas informáticos, aplicaciones, redes y medios, que permiten la compilación, procesamiento, almacenamiento, transmisión de información como: voz, datos, texto, vídeo e imágenes.

LEY 1341 (30 de julio de 2009)

El Presidente Álvaro Uribe sancionó la Ley 1341 del 30 de julio de 2009 con la que se busca darle a Colombia un marco normativo para el desarrollo del sector de Tecnologías de Información y Comunicaciones (TIC), promueve el acceso y uso de las TIC a través de la masificación, garantiza la libre competencia, el uso eficiente de la infraestructura y el espectro, y en especial, fortalece la protección de los derechos de los usuarios.
Según el Ministerio de Comunicaciones, la nueva Ley permite a los operadores prestar cualquier servicio que técnicamente sea viable, pone en igualdad de condiciones a los operadores en el momento de prestar dichos servicios y hace especial énfasis en la protección de los usuarios de telecomunicaciones. En adelante los ciudadanos que tengan quejas en la prestación de servicios de telefonía móvil, internet o telefonía fija, podrán acudir a la Superintendencia de Industria y Comercio, única entidad encargada de resolver sus reclamaciones.

El Derecho a la comunicación, la información y la educación y los servicios básicos de las TIC

El Estado propiciará a todo colombiano el derecho al acceso a las tecnologías de la información y las comunicaciones básicas, que permitan el ejercicio pleno de los siguientes derechos: La libertad de expresión y de difundir su pensamiento y opiniones, la de informar y recibir información veraz e imparcial, la educación y el acceso al conocimiento, a la ciencia, a la técnica, y a los demás bienes y valores de la cultura. Adicionalmente el Estado establecerá programas para que la población de los estratos desarrollará programas para que la población de los estratos menos favorecidos y la población rural tengan acceso y uso a las plataformas de comunicación, en especial de Internet y contenidos informáticos y de educación integral.

SISTEMAS DE RECUPERACIÓN DE INFORMACIÓN (SRI)

SISTEMAS DE RECUPERACIÓN DE INFORMACIÓN (SRI)
Según María Pinto--> La recuperación de información es el siguiente paso a la determinación de las necesidades de información. Se puede recuperar a través de diferentes herramientas: bases de datos, Internet, tesauros, ontologías, mapas... Conocer y manejar estas herramientas contribuye a una recuperación de calidad.
el proceso de recuperación de información se da en la medida en que se requiera satisfacer una necesidad de información  y se recurra a las diferentes estrategias de búsqueda, para ello no solamente se dice que la recuperación de información se da en las Bases de Datos, también a través de los diferentes buscadores y metabuscadores, que son capaces de traer, con ciertos criterios de búsqueda, la información que se requiere.
Generalmente es automatizado y su finalidad es el almacenamiento, procesamiento, recuperación y difusión de la información, que puede ser cualquier tipo (imagenes, video, texto, entre otros obejtos multimedia. Para el buen funcionamiento del SRI se debe adecuar el conjunto de componentes informáticos tanto de Hardware como de Software, asegurando de esta forma la calidad en el proceso. Cabe aclarar que solamente se realíza manejo de INFORMACIÓN y no de DATOS, este sistema búsca satisfacer un vacio cognitivo, una NECESIDAD que da lugar a partir de la formulación de preguntas o interrogantes por parte de un usuario.
Los SRI pretender ofrecer al usuario diferentes mecanismos de acceso a las fuentes documentales, con el fin de que sea extraida la información relevante o pertinente cuyos contenidos respondan a las necesidades cognitivas.

Todo este proceso inicia con la formulación de una pregunta por parte del usuario, quien después de consultar en la base de datos documental, el sistema somete la información a un proceso de indización arrojando de esta forma un conjunto de documentos relevantes, en cuyo contenido se encuentran los términos citados por el usuario en el motor de búsqueda. Posteriormente estos resultados serán organizados por orden de relevancia, colocando en ultima posición los de menor o nula importancia, que posteriormente serán eliminados. TODO NACE A PARTIR DE UNA NECESIDAD DE INFORMACIÓN.


A través de los diferentes procesos de busqueda podemos encontrarnos con problemas que surgen a medida que se consultan, ya que se pueden recuperar muchos o pocos resultados; aparecen dos factores que tienen que ver con este resultado 
  • El ruido documental 
  • El silencio documental


EL RUIDO DOCUMENTAL


El fenómeno del ruido documental se produce cuando, tras realizar una búsqueda de información, obtenemos una excesiva cantidad de resultados, además la mayoría no nos interesan, y nos cuesta mucho encontrar entre estos resultados lo que necesitamos, perdiendo de esta manera tiempo y dinero si estamos trabajando (para la empresa), el ruido documental no sólo se puede producir tras una búsqueda en Google, sino también en el OPAC de una biblioteca, en el correo electrónico atrasado o en múltiples lugares donde se busca información. 

EL SILENCIO DOCUMENTAL 
Es el fenómeno contrario al ruido documental, son aquellos documentos que no aparecen dentro de la estrategia de recuperación de información, bien sea por que esta quedo mal realizada o por que quedaron mal indizados, y las palabras clave no son las adecuadas para recuperarlos.



El ruido y el silencio documental se presentan debido a diferentes causas. Una de ellas es la ausencia de una utilización óptima y adecuada de LENGUAJES DOCUMENTALES que normalicen y orienten los procesos de análisis de la información y por ende los procesos de recuperación de la misma. Con tanta información, parece evidente que debemos prestar atención a su optimización.

martes, septiembre 28, 2010

DESKTOP SEARCH (BUSCADOR DE ESCRITORIO)

DESKTOP SEARCH (BUSCADOR DE ESCRITORIO)

Concepto: Es una herramienta informática que busca documentos en un ordenador personal (en lugar de hacerlo en Internet) como por ejemplo el historial de navegación web, archivos de correo electrónico, documentos de texto, archivos de sonido, de imágenes o de vídeo.

A medida que pasa el tiempo y la tecnología avanza la capacidad de almacenamiento de los discos duros es más grande. Esto conlleva a que el volumen de información que el usuario puede tener guardado se haga muy difícil de controlar y que cuando tenga que buscar un archivo no lo encuentre. Por este motivo han surgido varios buscadores de escritorio, que si más no sigue la misma idea que un buscador de Internet.

Todos los buscadores en general manejan un mismo principio: la indexación del contenido de nuestros discos duros o más bien, de las particiones/carpetas que les indiquemos a estas herramientas para generar una base de datos en la cual poder luego rebuscar con gran facilidad. A partir de ahí cada solución propone su propia tecnología a la hora de tratar conceptos como los metadatos, la construcción del índice y la generación de resultados, pero lo cierto es que todas ellas funcionan bastante bien y suponen una ayuda imprescindible para un gran número de usuarios, que evitan así tener que estar esperando varios segundos a veces minutos para que las herramientas de búsqueda ‘convencionales’ encuentren lo que uno busca.

Tecnología aplicada: incluye un indexador que rastrea el disco duro en busca de archivos existentes. Cuando encuentra un archivo extrae la siguiente información y la guarda en un archivo de índice:



  • La localización jerárquica al disco duro del archivo.

  • Palabras clave, tipo de archivo, realíza un analisis se contenido según requerimientos de usuario.
Una vez los documentos existentes han sido indexados, el rastreador indexa los nuevos documentos en tiempo real. Durante las búsquedas, el motor de búsqueda relaciona las consultas realizadas por el usuario con los elementos indexados (mira en el archivo de índice) para encontrar los archivos más rápidamente. Finalmente muestra por pantalla los resultados obtenidos.

Objetivos: La búsqueda de escritorio se hace muy complicada debido a que existen muchos tipos de archivos, los cuales pueden ser estructurados o no estructurados. Los estructurados (bases de datos o documentos de texto con etiquetas incrustadas) suelen ser más fáciles de encontrar que los no estructurados (archivos de música, imágenes o vídeo) ya que estos últimos no contienen texto. Los objetivos manejados en la mayoría de Desktop Search son los siguientes:
  • Definir la consulta a realizar con el mínimo de palabras clave.

  • Recuperar la información de un conjunto de documentos que están relacionados de alguna manera con la consulta realizada.


  • Presentar al usuario estos documentos ordenados de una manera primaria. 

lunes, septiembre 27, 2010

ESTRUCTURA DE LOS DOCUMENTOS

DEFINICIONES BÁSICAS

Carácter: Cualquier símbolo numérico, alfabético o especial que se emplea en la escritura y en el calculo
  • Numéricos: 0,1,2,.....9
  • Alfabéticos: a, b, c ...., z, A, B, C... , Z.
  • Especiales: *, /, +, #,..
  • De control: retorno de carro, Fin de fichero (EOF)...
  • Gráficos   ╗
Dato: Representación simbólica (numérica, alfabética, etc.), de un atributo o característica de una entidad. El dato no tiene valor semántico (sentido) en sí mismo, permite ser procesado en la realización de cálculos ó la toma de decisiones.

Información: Conjunto de datos (numéricos, alfabéticos y alfanuméricos) ordenados con los que se representan convencionalmente hechos, objetos e ideas. Son un conjunto de datos con sentido y útiles para algo o alguien.

Capta (Capere-Tomar): Consiste en la Selección Manual ó Automática de Información Relevante, esta debe ser subjetiva y transparente para asegurar de esta forma la supervivencia informacional y prevenir la infoxicación.

Conocimiento: Es la apropiación, procesamiento, depuración, etc.. de la información hecha por un ser humano en estructuras mentales, para realizar alguna tarea.

Documento: Es cualquier Fuente de información usable, todo aquello organizado para permitir su observación, Análisis y Estudio, adicionalmente debe estar codificado en un formato y almacenado en un soporte que facilite a futuro su recuperación.

Documento Electrónico: Es toda representación electrónica que da testimonio de un hecho, una imagen o una idea. Requiere de una máquina para la visualización de su contenido, por ejemplo: un video casette.

Documento Digital: Es la representación en medio digital de un documento, contenido, textos, imágenes, sonidos, videos, etc., es una secuencia de bits (1 y 0) que representan cualquier tipo de información, esto permite almacenar grandes cantidades de información en espacios reducidos, facilitando su reproducción y distribución.

Documento Virtual: Es aquel que se va construyendo de acuerdo a las necesidades particulares del usuario, existe en el momento que es requerido, su generación es automática en un lapso de tiempo determinado.



COMPONENTES DE UN DOCUMENTO

Estructura: Son los elementos constitutivos de un documento, es la disposición lógica dada a la información contenida, por ejemplo: Encabezado, título, párrafo, etc.

Contenido: Es la información como tal a que hace referencia el documento, como su nombre lo indica es el contenido.

Formato: Son las diferentes características usadas a lo largo de todo el documento, son aquellas que dan forma y presentación, por ejemplo: Tipo de fuente, tamaño de fuente, alineación, efecto, etc.

Contexto: Es aquella información que permite la comprensión completa y adecuada del documento, por ejemplo: fecha, autor, tema.

Documento estructurado: Habitualmente el resultado de aplicar un sistema de extracción de información a cualquier texto es un documento estructurado del tipo XML. Si el documento de origen es ya de por sí un documento estructurado, resulta mucho más sencillo analizarlo para obtener las entidades y sus relaciones, siempre y cuando esté debidamente etiquetado. En un documento estructurado son conocidas las entidades a partir del etiquetado y, posiblemente, algunas relaciones o roles de las mismas, se identifican todas y cada una de sus partes constitutivas.
Documento no estructurado: Los documentos escritos en lenguaje natural son el objetivo principal de los sistemas de extracción de información ya que son la gran mayoría de los documentos existentes. Para extraer la información de estos documentos es necesario realizar las tareas descritas anteriormente (reconocimiento de entidades, resolución de anáforas, reconocimiento del rol, reconocer relaciones). El tipo de información que los sistemas de extracción de información son capaces de extraer varía en función del documento. Por ejemplo, entidades con nombre propio como personas, organizaciones o lugares se recuperan actualmente con una fiabilidad del 90 %, pero esta fiabilidad se ve reducida al extraer atributos de dichas entidades, hechos o eventos relacionados. En este tipo de documentos no se ven identificadas las diferentes partes que lo constituyen.
Documento semi - estructurado: Son documentos mixtos que contienen parte estructurada y parte no estructurada, maneja elementos constitutivos pero estos no son de obligatorio cumplimiento.
  • Un registro no necesariamente tiene que tener todos sus atributos definidos. Mientras por ejemplo en una base de datos relacional un campo debe establecerse como NULO cuando no se tiene, en un ambiente de datos semiestructurados basta con omitir dicho atributo.
  • Un atributo de un registro puede ser otro registro
  • No existe necesariamente una diferencia entre un identificador de un campo y el valor mismo de este.

sábado, septiembre 25, 2010

MEMORIAS DE CLASE

SOCIEDAD DE LA INFORMACIÓN 

http://creativecommons.org/licenses/by/2.5/es/
Una sociedad de la información es aquella en la cual las tecnologías que facilitan la creación, distribución y manipulación de la información juegan un papel importante en las actividades sociales, culturales y económicas. La noción de sociedad de la información ha sido inspirada por los programas de los países industrializados. El término sería más bien un término político que teórico, pues se presenta como una aspiración estratégica que permitiría superar el estancamiento social.

INFOXICACIÓN El exceso de información que se produce con el alud de información disponible hoy en día produce una dificultad para digerir tanto volumen en tan poco tiempo.
  • En el 2008 el universo digital era de 487.000 millones de Gigabytes equivalente a 487 Exabytes
  • En el 2012 se calcula que tendrá un crecimiento del 500% respecto al año 2008.