Mostrando entradas con la etiqueta Memorias de clase. Mostrar todas las entradas
Mostrando entradas con la etiqueta Memorias de clase. Mostrar todas las entradas

jueves, noviembre 04, 2010

Knowledge Tree Introducción

Introduccion a Knowledge Tree 

"recuperación de información" "programa de sistemas de información" "Universidad de La Salle"

KnowledgeTree

Creacion de Tipos de Archivo en KnowledgeTree


"recuperación de información" "programa de sistemas de información" "Universidad de La Salle"

instalar google desktop


"recuperación de información" "programa de sistemas de información" "Universidad de La Salle"

jueves, octubre 21, 2010

FIRMA DIGITAL




¿QUÉ ES FIRMA ELECTRÓNICA?


El documento escrito se compone de un continente y un contenido, es decir, datos impresos en un soporte; sin embargo, lo que le da un carácter jurídico a un documento es, además de otros elementos, la firma. La firma electrónica es una manera de representación y confirmación de la identidad en el medio electrónico, es un conjunto de datos únicos encriptados (transformados en códigos). [1]


TIPOS DE FIRMAS [2]


La Ley de Firma Electrónica, que puede ser diferente en cada país, define tres tipos de firma: [3]

Firma Electrónica simple à Incluye un método de identificar al firmante  (autentifica la identidad de la persona, es como "mostrar" la cédula de identidad)

Firma electrónica Avanzada à autentifica la identidad, pero además permite llevar a cabo transacciones comerciales avanzadas y contratos. Además de identificar al firmante permite garantizar la integridad del documento. Se emplean técnicas de PKI

Reconocida à Es la firma avanzada ejecutada con un DSCF (dispositivo seguro de creación de firma) y amparada por un certificado reconocido (certificado que se otorga tras la verificación presencial de la identidad del firmante)

Diferencias:
La diferenciación entre ambas clases de firmas está hecha en función de la protección legal que ellas producen.
Los efectos jurídicos que ella produce son consecuencia de ser un medio apto al que se le atribuye la cualidad de contener la voluntad de la persona.

martes, octubre 05, 2010

EXTRACCIÓN DE INFORMACIÓN (IE)

EXTRACCIÓN DE INFORMACIÓN (IE)

Es la búsqueda realizada manual o automatizadamente de términos, párrafos o partes de un documento, que contengan la información requerida por un usuario a partir de una pregunta o interrogante, y cuyos resultados serán presentados de forma estructurada. La información plasmada en lenguaje natural en un documento se presenta casi siempre de manera no estructurada (texto libre). Esto ha supuesto un obstáculo para la recuperación, por parte de las máquinas, de la información contenida en un documento.

La extracción de información tiene por objetivo que la información desestructurada de un documento sea más accesible y recuperable por parte de la máquina. En otras palabras, se trata de estructurar la información de un documento, de modo que la máquina pueda recuperar la información contenida en el documento. La extracción de información se basa en el uso de técnicas de procesamiento del lenguaje natural sobre dominios muy acotados.

Es preciso diferenciar entre el concepto de extracción de información y el de recuperación de la información. Mientras la recuperación de información se refiere a la recuperación de documentos relevantes existentes en una colección, la extracción de información trata de extraer la información relevante en los documentos.


PROBLEMA DE LOS LENGUAJES DE CONSULTA Y RECUPERACIÓN DE INFORMACIÓN 

TRANSFORMACIÓN DE LENGUAJES
Es el proceso de estandarización de una consulta, para que de esta forma sea "entendida" por una máquina, si los resultados obtenidos después de este proceso no llenan por completo el vacio cognitivo, se debe realizar un cambio en la necesidad inicialmente planteada, esto quiere decir que hay que reformular la pregunta o interrogante hasta obtener información de gran relavancia sobre el tema consultado. LA CLAVE ESTA EN SABER PREGUNTAR.

TIPOS DE REPRESENTACIÓN DE LA INFORMACIÓN
  • Lenguaje natural humano: Lenguaje utilizado de forma cotidiana para la comunicación, es comprensible para un gran número de ususarios, permite expresar cualquier significado o concepto y es tolerante a fallos; pero presenta inconvenientes o desventajas como la ambigüedad, poco conciso y es de dificil interpretación por parte de un computador.

  • Lenguaje natural restringido: Es un subconjunto del lenguaje natural ya que al poseer terminos controlados, hace uso de leguajes también controlados por ejemplo: Las taxonomías y los tesauros. Este lenguaje restringido limita el vocabulario que puede ser utilizado y las reglas sintacticas que pueden aplicarse al mismo, pero presenta inconvenientes tales como la forma de definición de las restricciones, la no aceptación por parte de los usuarios al no poder expresar la información como ellos desearían y adicional a esto se corre el riesgo de que las reglas sintacticas sean pocas y no representen en su totalidad la información deseada.

  • Lenguaje artificial: Es el lenguaje informático, compuesto por un vocabulario muy limitado y por unas reglas sintacticas claras y específicas que no dan lugar a ambigüedades, se gana en la capacidad de almacenamiento y en la simplicidad de los procesos, es fácil controlar los errores cometidos a través de su uso pero la gran desventaja es que los usuarios deben apreneder un lenguaje muy diferente al lenguaje natural.

SISTEMAS DE RECUPERACIÓN DE INFORMACIÓN (SRI)

SISTEMAS DE RECUPERACIÓN DE INFORMACIÓN (SRI)
Según María Pinto--> La recuperación de información es el siguiente paso a la determinación de las necesidades de información. Se puede recuperar a través de diferentes herramientas: bases de datos, Internet, tesauros, ontologías, mapas... Conocer y manejar estas herramientas contribuye a una recuperación de calidad.
el proceso de recuperación de información se da en la medida en que se requiera satisfacer una necesidad de información  y se recurra a las diferentes estrategias de búsqueda, para ello no solamente se dice que la recuperación de información se da en las Bases de Datos, también a través de los diferentes buscadores y metabuscadores, que son capaces de traer, con ciertos criterios de búsqueda, la información que se requiere.
Generalmente es automatizado y su finalidad es el almacenamiento, procesamiento, recuperación y difusión de la información, que puede ser cualquier tipo (imagenes, video, texto, entre otros obejtos multimedia. Para el buen funcionamiento del SRI se debe adecuar el conjunto de componentes informáticos tanto de Hardware como de Software, asegurando de esta forma la calidad en el proceso. Cabe aclarar que solamente se realíza manejo de INFORMACIÓN y no de DATOS, este sistema búsca satisfacer un vacio cognitivo, una NECESIDAD que da lugar a partir de la formulación de preguntas o interrogantes por parte de un usuario.
Los SRI pretender ofrecer al usuario diferentes mecanismos de acceso a las fuentes documentales, con el fin de que sea extraida la información relevante o pertinente cuyos contenidos respondan a las necesidades cognitivas.

Todo este proceso inicia con la formulación de una pregunta por parte del usuario, quien después de consultar en la base de datos documental, el sistema somete la información a un proceso de indización arrojando de esta forma un conjunto de documentos relevantes, en cuyo contenido se encuentran los términos citados por el usuario en el motor de búsqueda. Posteriormente estos resultados serán organizados por orden de relevancia, colocando en ultima posición los de menor o nula importancia, que posteriormente serán eliminados. TODO NACE A PARTIR DE UNA NECESIDAD DE INFORMACIÓN.


A través de los diferentes procesos de busqueda podemos encontrarnos con problemas que surgen a medida que se consultan, ya que se pueden recuperar muchos o pocos resultados; aparecen dos factores que tienen que ver con este resultado 
  • El ruido documental 
  • El silencio documental


EL RUIDO DOCUMENTAL


El fenómeno del ruido documental se produce cuando, tras realizar una búsqueda de información, obtenemos una excesiva cantidad de resultados, además la mayoría no nos interesan, y nos cuesta mucho encontrar entre estos resultados lo que necesitamos, perdiendo de esta manera tiempo y dinero si estamos trabajando (para la empresa), el ruido documental no sólo se puede producir tras una búsqueda en Google, sino también en el OPAC de una biblioteca, en el correo electrónico atrasado o en múltiples lugares donde se busca información. 

EL SILENCIO DOCUMENTAL 
Es el fenómeno contrario al ruido documental, son aquellos documentos que no aparecen dentro de la estrategia de recuperación de información, bien sea por que esta quedo mal realizada o por que quedaron mal indizados, y las palabras clave no son las adecuadas para recuperarlos.



El ruido y el silencio documental se presentan debido a diferentes causas. Una de ellas es la ausencia de una utilización óptima y adecuada de LENGUAJES DOCUMENTALES que normalicen y orienten los procesos de análisis de la información y por ende los procesos de recuperación de la misma. Con tanta información, parece evidente que debemos prestar atención a su optimización.

lunes, octubre 04, 2010

CONTROL DEL PLAGIO

El plagio es una constante, y uno de los sectores donde más existe es dentro de las series de televisión. Ha existido siempre y siempre existirá. En principio, el plagio es definido por el diccionario de la Real Academia de la Lengua como “Copiar en los sustancial obras ajenas dándolas como propias” sin embargo, aunque en España la ley protege la creación artística, literaria o científica, no nombra en ningún momento el plagio, por lo que a través de las múltiples sentencias que ha habido al respecto, se han llegado a una serie de conclusiones que establecen lo que realmente se entiende “legalmente” por plagio:

1. Se debe copiar una obra ajena en lo sustancial. Esto excluye las imitaciones de elementos desde un punto de vista “accidental”, o que la copia solo afecte a elementos secundarios de la serie/obra.

2. Se pueden distinguir dos tipos de plagio, el servil, que es cuando se copia la obra completa y el ideal, en el que solo se copia la esencia.

3. No es plagio aquello que muestra costumbres populares, porque se supone que son de dominio público.

4. El plagio no recae en la idea misma que define una serie, sino de que forma esa serie es contada, es decir de qué forma se ha plasmado la idea.

5. El plagio es un atentado a los derechos morales del autor de la obra plagiada, y por tanto es un acto demandable jurídicamente. Este acto se puede realizar de dos formas: Civilmente, donde el autor plagiado solicita de los tribunales indemnizaciones por el daño moral y las pérdidas económicas que ha sufrido. También por la vía civil puede solicitar que el plagio finalice y que se destruya esa obra que ha plagiado la suya. O utilizar la vía penal, ya que el código penal si que define el plagio como delito, siempre que se use con ánimo de lucro y en perjuicio de terceros, y por supuesto sin la autorización de los autores. La vía penal puede llevar incluso penas de cárcel.


El plagio por tanto es, en definitiva el atentado más importante contra la obra literaria, pues supone la apropiación del esfuerzo y la actividad creativa.


Plagio académico, ¿robo y fraude?
El llamado Plagio Académico es una de las prácticas anti-éticas que realizan los investigadores en sus publicaciones con cierta frecuencia. Muchas veces la falta es cometida por ignorancia pero, en otras los hechos tienen claras evidencias de delitos. Parece por lo tanto importante exponer y aclarar algunas ideas en torno a este tema, para muchos desconocido. La Real Academia Española define plagio como "acción y efecto de plagiar", indicando que plagiar es "copiar en lo sustancial obras ajenas, dándolas como propias". Queda claro que el plagio es un descarado robo, independiente de las palabras que usemos para adornar la definición. En la academia, plagio tiene el mismo significado, aunque se puede dar una definición más exacta como la que hace Hexham de la Univ. de Calgary en Canadá (http://c.faculty.umkc.edu/cowande/plague.htm): "Plagio es el acto de intención deliberada de engañar a un lector a través de la apropiación y representación como propias de las palabras y trabajos de otros". Hexham es incluso más estricto y refuerza lo expresado más arriba, definiendo al plagiador como un ladrón de poca monta, un ladronzuelo (a petty thief, a pilferer). 

Los autores que cometen plagio rara vez copian un trabajo entero, aunque hay algunos casos en la literatura. Había un prolífico autor que publicaba a una velocidad bastante mayor al promedio y en los más diversos temas. Esto llamó la atención de algunos editores que indagaron en el asunto para descubrir la trampa. El autor tomaba artículos ya publicados por otros investigadores en idiomas menos conocidos internacionalmente (urdú, mongol, birmano, nepalés, tibetano, etc.), los traducía o mandaba a traducir al idioma inglés y los enviaba para publicación a prestigiadas revistas. Se cuenta otro caso de un científico indio que publicó un trabajo sobre bioquímica en una revista de la India. Un tiempo después apareció un trabajo de un autor europeo sobre el mismo trabajo, pero realizado con otro microbio; el resto era lo mismo. Sin embargo, no había ni una sola referencia al trabajo anterior del autor de la India. El autor indio se contactó con el europeo para pedir una explicación de lo sucedido. El plagiador envió sólo una corta nota diciendo: "disfruté mucho leyendo su trabajo".

El auto-plagio es también un aspecto anti-ético que los autores deben cuidar de no cometer. Aunque parezca una contradicción el auto-plagio es un robo similar al que hace una persona que se roba así mismo para cobrar el seguro. La duplicidad de publicaciones es claramente un auto-plagio, ya que la intención es abultar el currículo de publicaciones con fines de promoción y mal entendido prestigio del investigador. Es lícito mostrar diversos aspectos de una misma investigación en distintas revistas (y que usualmente van dirigidas a distintos lectores), pero no se puede considerar lícito publicar idénticos artículos en más de una revista. El auto-plagio no debe ser confundido con el reciclaje normal del trabajo propio. Se espera que un investigador recién doctorado presente parte de su tesis en una o varias publicaciones y queincluso continúe en esa línea de trabajo. Pero se espera que cada nuevo trabajo aporte algo novedoso al conocimiento y no sea solo la repetición de pasajes de la tesis doctoral. Se debe dejar en claro también que los trabajos impresos en Actas de Congresos (aunque tengan el código ISBN), y otros documentos impresos o electrónicos de eventos similares, no constituyen publicación en el contexto internacional. Por lo tanto, no se atenta contra la ética cuando se envía para publicación trabajos que fueron presentados en algún congreso. Lo importante de recordar es que el trabajo debe ser re-escrito para una audiencia más amplia que la del congreso y que se deben seguir las normas, usualmente más estrictas, de las revistas internacionales. El trabajo editorial se ha visto enfrentado a varias situaciones de plagio que han sido descubiertas por los evaluadores o por el comité editorial. En todos los casos se han tomado debida cuenta de ello discutiendo con el autor o autora el alcance del supuesto plagio, y cuando ha sido pertinente el trabajo no ha sido publicado.

jueves, septiembre 30, 2010

NECESIDADES DE INFORMACIÓN

La construcción del término necesidades de información es una construcción abstracta usada para responder porqué las personas buscan, encuentran y usan la información. Usualmente se le da diferentes interpretaciones, así como se dan confusiones con otros términos como: demandas de información, requerimientos de información  o deseos de información. Pero hay que  considerar que el termino necesidad tiene una connotación muy profunda  esta información está definida como: conocimientos, ideas, hechos, datos o trabajos creativos o imaginativos producidos por la mente, los cuales son comunicados formalmente y/o informalmente en cualquier formato.

Así mismo en la Recuperación de Información, hay que considerar que la búsqueda, requerimiento, demanda o deseo de información, es el reflejo de que existe una necesidad de información en la persona. Si el individuo presenta una necesidad de información es porque la necesita en ese momento, puesto que se ha visto estimulado, a través de su sistema nervioso, a satisfacerla.

Hay dos caminos para satisfacer las necesidades de información: buscar los conocimientos acumulados por hechos, podría entenderse por el mismo proceso de aprendizaje (experiencia); y aprovechar la información que produce uno mismo, es decir, la que es producto de la actividad humana y la cual se encuentra registrada.

El proceso de satisfacción de una necesidad de información termina cuando se adquiere una claridad suficiente sobre un tema determinado que inicialmente era un vacío, el problema es que no se conoce la cantidad de información que se requiere para la consecución de esta claridad.
Tipos de necesidad de información

  • Necesidad de información concreta:  En este tipo de necesidad ante una pregunta concreta, se encuentra una respuesta concreta con soportes de contenido concreto, la satisfacción es alcanzada a través de un buen documento que corresponde exactamente a los límites temáticos demandados por el interrogante inicialmente planteado.

  • Necesidad de información orientada al problemaEste tipo de necesidad posee unas fronteras temáticas indefinidas, el parámetro de búsqueda es mal formulado generalmente y tan pronto son recuperados documentos buenos con información relevante, los límites temáticos de la necesidad cambian, lo que conduce a no pueda ser satisfecha.

DEFINICIÓN DE RECUPERACIÓN DE INFORMACIÓN
 Proceso de gestión del conocimiento, donde se busca disminuir  la mayor cantidad de espacios conceptuales. Es el proceso para pasar de un estado actual del conocimiento a un estado NECESARIO de conocimiento.
La recuperación de información es basada en la utilización de términos índice para indexar y recuperar documentos. Recuperar puede consistir en especificar un conjunto de términos que deben ser hallados dentro de los indices de un documento, estableciendo el grado de relevancia entre cada uno de éstos para dar respuesta a una pregunta inicialmente planteada.

martes, septiembre 28, 2010

DESKTOP SEARCH (BUSCADOR DE ESCRITORIO)

DESKTOP SEARCH (BUSCADOR DE ESCRITORIO)

Concepto: Es una herramienta informática que busca documentos en un ordenador personal (en lugar de hacerlo en Internet) como por ejemplo el historial de navegación web, archivos de correo electrónico, documentos de texto, archivos de sonido, de imágenes o de vídeo.

A medida que pasa el tiempo y la tecnología avanza la capacidad de almacenamiento de los discos duros es más grande. Esto conlleva a que el volumen de información que el usuario puede tener guardado se haga muy difícil de controlar y que cuando tenga que buscar un archivo no lo encuentre. Por este motivo han surgido varios buscadores de escritorio, que si más no sigue la misma idea que un buscador de Internet.

Todos los buscadores en general manejan un mismo principio: la indexación del contenido de nuestros discos duros o más bien, de las particiones/carpetas que les indiquemos a estas herramientas para generar una base de datos en la cual poder luego rebuscar con gran facilidad. A partir de ahí cada solución propone su propia tecnología a la hora de tratar conceptos como los metadatos, la construcción del índice y la generación de resultados, pero lo cierto es que todas ellas funcionan bastante bien y suponen una ayuda imprescindible para un gran número de usuarios, que evitan así tener que estar esperando varios segundos a veces minutos para que las herramientas de búsqueda ‘convencionales’ encuentren lo que uno busca.

Tecnología aplicada: incluye un indexador que rastrea el disco duro en busca de archivos existentes. Cuando encuentra un archivo extrae la siguiente información y la guarda en un archivo de índice:



  • La localización jerárquica al disco duro del archivo.

  • Palabras clave, tipo de archivo, realíza un analisis se contenido según requerimientos de usuario.
Una vez los documentos existentes han sido indexados, el rastreador indexa los nuevos documentos en tiempo real. Durante las búsquedas, el motor de búsqueda relaciona las consultas realizadas por el usuario con los elementos indexados (mira en el archivo de índice) para encontrar los archivos más rápidamente. Finalmente muestra por pantalla los resultados obtenidos.

Objetivos: La búsqueda de escritorio se hace muy complicada debido a que existen muchos tipos de archivos, los cuales pueden ser estructurados o no estructurados. Los estructurados (bases de datos o documentos de texto con etiquetas incrustadas) suelen ser más fáciles de encontrar que los no estructurados (archivos de música, imágenes o vídeo) ya que estos últimos no contienen texto. Los objetivos manejados en la mayoría de Desktop Search son los siguientes:
  • Definir la consulta a realizar con el mínimo de palabras clave.

  • Recuperar la información de un conjunto de documentos que están relacionados de alguna manera con la consulta realizada.


  • Presentar al usuario estos documentos ordenados de una manera primaria. 

lunes, septiembre 27, 2010

Análisis COSMOS - Carl Sagan


COSMOS (Carl Sagan)
Análisis realizado a documental visto en clase de Recuperación de información

Introducción

Carl Sagan nació en Nueva York en 1934 y se graduó en Física en la universidad de Chicago en 1955 y obtuvo el doctorado en astrofísica en 1960. Colaboró con la NASA durante 30 años en programas de investigación planetaria como Mariner y Voyager y publicó numerosos trabajos relacionados con el mundo de la astronomía. Pero no será hasta 1980 cuando presentará la serie televisiva Cosmos, compuesta por trece capítulos que darían lugar al libro del mismo nombre que fue líder de ventas en 60 países convirtiéndose en el libro de ciencia más vendido del siglo pasado. Sagan murió en 1996 debido a una extraña enfermedad que le fue diagnosticada dos años atrás.

En la orilla del océano cósmico

El primero de los 13 capítulos que componen la serie Cosmos,  introduce de lleno en la vida real, en la que Carl Sagan nos propondrá un viaje en la nave “Imaginación” que nos llevará a descubrir los misterios del Universo, dándonos así a conocer fenómenos cósmicos tales como las supernovas, las estrellas o los quásares. Se emprende el viaje por el cosmos que, guiado por las mismas leyes físicas en toda su extensión, muestra el conjunto de estrellas que forman un quásar, que engulle galaxias más pequeñas a su vez. de igual forma introduce el concepto de año luz, término que empleará para sus explicaciones.

Se puede apreciar el ciclo de vida de una galaxia, que nace y se desarrolla como un ser vivo, y que al morir estallan liberando una gran cantidad de energía que produce un enorme eco a lo largo de la inmensidad cósmica que incinerará estrellas y planetas cercanos a su paso.También se puede dar la explosión de una de las estrellas que componga dicha galaxia, haciendo que su brillo se distinga por encima de la propia galaxia.

En este peculiar viaje se observa un “grupo local”, conjunto de 20 galaxias que ocupan una superficie de 3.000.000 de años luz. Nos acerca a nuestra galaxia, la Vía Láctea, una galaxia espiral de 100.000 años luz de diámetro. En ésta, como en cualquier otra, se pueden apreciar las supernovas, restos de estrellas que se han destruido a sí mismas, al acabar su ciclo estelar. En el centro de la estrella destruida se encuentran sus restos, los denominados púlsares, soles que giran sobre si mismo emitiendo un haz de luz dos veces por segundo con gran exactitud, actuando como faros naturales. Esto hacía pensar en formas de vida extraterrestres. Los púlsares son la prueba de que las estrellas también mueren. En las galaxias, las estrellas más calientes suelen morir antes, mientras que las gigantes rojas tienen una larga vida y no poseen planetas que circulen alrededor de ellas. Las estrellas más comunes son las enanas amarillas, como el Sol. Al comprobar la inmensidad de sistemas planetarios, nos preguntamos acerca de la existencia de inteligencia extraterrestre y su forma de vida.

Eratóstenes y la medida de la circunferencia terrestre

En el antiguo Egipto, Eratóstenes (siglo III a.C.) fue astrónomo, matemático e historiador. También fue director de la gran biblioteca de Alejandría, centro cultural del mundo antiguo. Eratóstenes quiso calcular la circunferencia terrestre fijándose en las sombras que proyectaban dos obeliscos en sus respectivas ciudades separados por 800 Km. Contrató un hombre que midiera la distancia entre las dos ciudades, analizó la sombra que proyectaban los obeliscos y llegó a la conclusión de que las sombras tenían diferente longitud debido a la curvatura de la Tierra, y que cuanto mayor fuera la curvatura mayor sería la diferencia de longitud.
Calculando la amplitud del arco formado por los obeliscos (7º, la cincuentava parte de una circunferencia) y la distancia entre las dos ciudades (800 Km), dedujo que la circunferencia terrestre debía medir unos 40.000 Km, una medida muy exacta teniendo en cuenta los rudimentarios métodos de la época que Eratóstenes utilizó.

La biblioteca de Alejandría

La ciudad de Alejandría poseía una gran biblioteca, en la que se reunían los grandes intelectuales de la época. Sagan nos lleva a la biblioteca mediante un viaje del tiempo a su época de mayor esplendor, donde se fraguó el inicio de la aventura espacial. Estudiaban el cosmos y muchas más ciencias, como Euclides, que se dedicó al estudio de la geometría e Hiparlo, que estudió las estrellas y las constelaciones.

Los organizadores de la biblioteca iniciaron una colección de pergaminos que, requisados a sus dueños, eran copiados y devueltos a sus dueños, aumentando así el saber de la civilización egipcia. En el momento de mayor esplendor se calcula que la biblioteca llegó a poseer cerca de un millón de pergaminos, que fueron destruidos y de los que sólo se conserva un pequeña parte.

Muchos astrónomos postularon sus teorías en libros que se destruyeron con la biblioteca, como Aristarco de Samos, que dijo que los planetas giraban alrededor del Sol. Hacia el final del documental, Sagan hace un breve resumen de la edad del Universo en un año cósmico de 15000 millones de años, tomando como escala el minuto, que equivaldría a 30.000 años de la edad terrestre. Sitúa la formación de la Vía Láctea y la Tierra, el nacimiento de la especie humana, el descubrimiento del fuego, la producción de herramientas y el éxodo rural, entre otros acontecimientos dignos de señalar en la historia de la humanidad.

Finalmente, deja un final abierto dándonos a nosotros la responsabilidad de lo que pase en el próximo año cósmico desde el primer segundo de este próximo año.
_____________________________________________

COSMOS episodio 1

ESTRUCTURA DE LOS DOCUMENTOS

DEFINICIONES BÁSICAS

Carácter: Cualquier símbolo numérico, alfabético o especial que se emplea en la escritura y en el calculo
  • Numéricos: 0,1,2,.....9
  • Alfabéticos: a, b, c ...., z, A, B, C... , Z.
  • Especiales: *, /, +, #,..
  • De control: retorno de carro, Fin de fichero (EOF)...
  • Gráficos   ╗
Dato: Representación simbólica (numérica, alfabética, etc.), de un atributo o característica de una entidad. El dato no tiene valor semántico (sentido) en sí mismo, permite ser procesado en la realización de cálculos ó la toma de decisiones.

Información: Conjunto de datos (numéricos, alfabéticos y alfanuméricos) ordenados con los que se representan convencionalmente hechos, objetos e ideas. Son un conjunto de datos con sentido y útiles para algo o alguien.

Capta (Capere-Tomar): Consiste en la Selección Manual ó Automática de Información Relevante, esta debe ser subjetiva y transparente para asegurar de esta forma la supervivencia informacional y prevenir la infoxicación.

Conocimiento: Es la apropiación, procesamiento, depuración, etc.. de la información hecha por un ser humano en estructuras mentales, para realizar alguna tarea.

Documento: Es cualquier Fuente de información usable, todo aquello organizado para permitir su observación, Análisis y Estudio, adicionalmente debe estar codificado en un formato y almacenado en un soporte que facilite a futuro su recuperación.

Documento Electrónico: Es toda representación electrónica que da testimonio de un hecho, una imagen o una idea. Requiere de una máquina para la visualización de su contenido, por ejemplo: un video casette.

Documento Digital: Es la representación en medio digital de un documento, contenido, textos, imágenes, sonidos, videos, etc., es una secuencia de bits (1 y 0) que representan cualquier tipo de información, esto permite almacenar grandes cantidades de información en espacios reducidos, facilitando su reproducción y distribución.

Documento Virtual: Es aquel que se va construyendo de acuerdo a las necesidades particulares del usuario, existe en el momento que es requerido, su generación es automática en un lapso de tiempo determinado.



COMPONENTES DE UN DOCUMENTO

Estructura: Son los elementos constitutivos de un documento, es la disposición lógica dada a la información contenida, por ejemplo: Encabezado, título, párrafo, etc.

Contenido: Es la información como tal a que hace referencia el documento, como su nombre lo indica es el contenido.

Formato: Son las diferentes características usadas a lo largo de todo el documento, son aquellas que dan forma y presentación, por ejemplo: Tipo de fuente, tamaño de fuente, alineación, efecto, etc.

Contexto: Es aquella información que permite la comprensión completa y adecuada del documento, por ejemplo: fecha, autor, tema.

Documento estructurado: Habitualmente el resultado de aplicar un sistema de extracción de información a cualquier texto es un documento estructurado del tipo XML. Si el documento de origen es ya de por sí un documento estructurado, resulta mucho más sencillo analizarlo para obtener las entidades y sus relaciones, siempre y cuando esté debidamente etiquetado. En un documento estructurado son conocidas las entidades a partir del etiquetado y, posiblemente, algunas relaciones o roles de las mismas, se identifican todas y cada una de sus partes constitutivas.
Documento no estructurado: Los documentos escritos en lenguaje natural son el objetivo principal de los sistemas de extracción de información ya que son la gran mayoría de los documentos existentes. Para extraer la información de estos documentos es necesario realizar las tareas descritas anteriormente (reconocimiento de entidades, resolución de anáforas, reconocimiento del rol, reconocer relaciones). El tipo de información que los sistemas de extracción de información son capaces de extraer varía en función del documento. Por ejemplo, entidades con nombre propio como personas, organizaciones o lugares se recuperan actualmente con una fiabilidad del 90 %, pero esta fiabilidad se ve reducida al extraer atributos de dichas entidades, hechos o eventos relacionados. En este tipo de documentos no se ven identificadas las diferentes partes que lo constituyen.
Documento semi - estructurado: Son documentos mixtos que contienen parte estructurada y parte no estructurada, maneja elementos constitutivos pero estos no son de obligatorio cumplimiento.
  • Un registro no necesariamente tiene que tener todos sus atributos definidos. Mientras por ejemplo en una base de datos relacional un campo debe establecerse como NULO cuando no se tiene, en un ambiente de datos semiestructurados basta con omitir dicho atributo.
  • Un atributo de un registro puede ser otro registro
  • No existe necesariamente una diferencia entre un identificador de un campo y el valor mismo de este.

sábado, septiembre 25, 2010

MEMORIAS DE CLASE

SOCIEDAD DE LA INFORMACIÓN 

http://creativecommons.org/licenses/by/2.5/es/
Una sociedad de la información es aquella en la cual las tecnologías que facilitan la creación, distribución y manipulación de la información juegan un papel importante en las actividades sociales, culturales y económicas. La noción de sociedad de la información ha sido inspirada por los programas de los países industrializados. El término sería más bien un término político que teórico, pues se presenta como una aspiración estratégica que permitiría superar el estancamiento social.

INFOXICACIÓN El exceso de información que se produce con el alud de información disponible hoy en día produce una dificultad para digerir tanto volumen en tan poco tiempo.
  • En el 2008 el universo digital era de 487.000 millones de Gigabytes equivalente a 487 Exabytes
  • En el 2012 se calcula que tendrá un crecimiento del 500% respecto al año 2008.