miércoles, 16 de mayo de 2012

INTRODUCCION AL PROCESAMIENTO DE DATOS UNESR: UNIDAD III. La Estructura de los Datos

La Estructura de los Datos
La estructura de datos es una forma de organizar un conjunto de datos elementales con el objetivo de facilitar su manipulación. 
Una estructura de datos define la organización e interrelación de estos y un conjunto de operaciones que se pueden realizar sobre ellos. Las operaciones básicas son:
  • Alta, adicionar un nuevo valor a la estructura.
  • Baja, borrar un valor de la estructura.
  • Búsqueda, encontrar un determinado valor en la estructura para realizar una operación con este valor, en forma secuencial o binario (siempre y cuando los datos estén ordenados).
Otras operaciones que se pueden realizar son:
  • Ordenamiento, de los elementos pertenecientes a la estructura.
  • Apareo, dadas dos estructuras originar una nueva ordenada y que contenga a las apareadas.
Cada estructura ofrece ventajas y desventajas en relación a la simplicidad y eficiencia para la realización de cada operación. De esta forma, la elección de la estructura de datos apropiada para cada problema depende de factores como la frecuencia y el orden en que se realiza cada operación sobre los datos.
La Base de Datos
Las Bases de Datos son programas que administran información y hacen más ordenada la información, aparte de hacerla fácil de buscar.
Sus características pueden ser ventajosas o desventajosas: pueden ayudarnos para almacenar, organizar, recuperar, comunicar y manejar información en formas que serían imposibles sin los computadores, pero también nos afecta de alguna manera ya que existen enormes cantidades de información en bases de datos de las que no se tiene control del acceso .
Las Bases de Datos tienen muchos usos: nos facilitan el almacenamiento de grandes cantidades de información; permiten la recuperación rápida y flexible de información, con ellas se puede organizar y reorganizar la información, así como imprimirla o distribuirla en formas diversas.
Dato: Información que una computadora registra y almacena.
Campo: es cada trozo discreto de información en un registro.
Registro: es la información relacionada con una persona, un producto o suceso. En una Base de Dato un simple archivo es un conjunto de registros.
Archivo: es una colección de información relacionada. En él la información se guarda como si fuera un archivero.
Consulta: puede ser una búsqueda simple de un registro específico o una solicitud para seleccionar todos los registros que satisfagan un conjunto de criterios.
Reporte o informe: es una lista ordena de los campos y registros seleccionados en un formato fácil de leer.
Los tipos de datos que se pueden introducir a una base de datos son:
Numéricos: se pueden introducir números para identificar partes del archivo, esto identifica la parte que numera al archivo o lo distingue de alguna manera.
Texto: el texto es un nombre que identifica al campo, ya sea el nombre del autor o
Etiquetas: son los títulos con los que cada campo es designado.
Fórmulas: son datos que aparecen como numéricos pero fueron hechos por medio de fórmulas
Un paquete manejador de bases de datos es más conveniente cuando se esta trabajando con bases de datos, y un administrador de archivos se usa más cuando sólo se esta buscando un archivo desde un procesador de textos.
Estructura de Archivos Secuenciales
Se refiere al procesamiento de los registros, no importa el orden en que se haga, para eso los registros están organizados en forma de una lista y recuperarlos y procesarlos uno por uno de principio a fin.
Rudimentos de los archivos Secuenciales; dependiendo del dispositivo de almacenamiento utilizado el archivo se puede mostrar el usuario como si fuera un sistema secuencial.
Al finalizar un archivo secuencial se denota con una marca de fin de archivo. (End end-of-file)
El usuario de un archivo secuancial puede ver los registros en un orden secuancial simple.
La única forma de recuperar registros es comenzar al principio y extraerlos en el orden contemplado.
Cuestiones de programación; la manipulación de los archivos se hace en el contexto de la programación en un lenguaje por procedimientos de alto nivel. Estos lenguajes tienden a expresar la manipulación de archivos mediante subrutinas que se definen como parte del lenguaje formal o se incluyen como extensiones del lenguaje en una biblioteca estándar.
La mayor parte de los lenguajes por procedimiento de alto nivel cuenta con características que ayudan a detectar la marca de fin de archivo.
El indice provee una capacidad de búsqueda para llegar rapidamente a las proximidades de un registro deseado. El archivo de desbordamiento (overflow) es similar al archivo de registro usado en un archivo secuencial, pero esta intregrado de forma que los registros del archivo de desbordamiento se ubican en la dirección de un puntero desde si registro precedente.
En la estructura secuencial indexada mas simple, se usa un solo nivel de indexacion. El indice, en este caso, es un archivo secuencial simple. Cada registro del archivo indice tiene dos campos: un campo clave, que es el mismo que el campo clave del archivo principal y un puntero al archivo principal.
Para encontrar un campo especifico se busca en el indice hasta encontrar el valor mayor de la clave que es igual o precede al valor deseado de la clave. La busqueda continua en el archivo principal a partir de la posición indicada por el puntero.
Archivos Secuenciales
La forma mas común de estructura de archivo es el archivo secuencial. En este tipo de archivo, un formato fijo es usado para los registros. Todos los registros tienen el mismo tamaño, constan del mismo numero de campos de tamaño fijo en un orden particular. Como se conocen la longitud y la posición de cada campo, solamente los valores de los campos se necesitan almacenarse; el nombre del campo y longitud de cada campo son atributos de la estructura de archivos.
Un campo particular, generalmente el primero de cada registro se conoce como el campo clave. El campo clave identifica unívocamente al registro. así, los valores de la clave para registros diferentes son siempre diferentes.
Los archivos secuenciales son típicamente utilizados en aplicaciones de proceso de lotes Y son óptimos para dichas aplicaciones si se procesan todos los registros. La organización secuencias de archivos es la única que es fácil de usar tanto en disco como en cinta.
Para las aplicaciones interactivas que incluyen peticione s o actualizaciones de registros individuales, los archivos secuenciales ofrecen un rendimiento pobre.
Normalmente un archivo secuencial se almacena en bloques, en un orden secuencial simple de los registros. La organización física del archivo en una cinta o disco se corresponde exactamente con la ubicación lógica del archivo. En este caso, el procedimiento para ubicar los nuevos registros en un archivo de pila separado, llamado archivo de registro (log file) o archivo de transacciones. Periódicamente, se realiza una actualización por lotes que mezcla el archivo de registro con el archivo maestro para producir un nuevo archivo en secuencia correcta de claves.
Organización de Archivos Secuenciales.
La manera básica de organizar un conjunto de registros, que forman un archivo, es utilizando una organización secuencial. En un archivo organizado secuencialmente, los registros quedan grabados consecutivamente cuando el archivo se usa como entrada.
Un archivo organizado secuencialmente es un conjunto de registros lógicamente relacionados cuya secuencia de acceso está determinada por su ordenamiento. Los registros deben ser grabados consecutivamente cuando el archivo es creado, y deben ser leídos de la misma manera cuando es usado posteriormente como entrada.
Los requerimientos de proceso determinan el orden adecuado para la orden de los registros de un archivo secuencial. Por ejemplo para generar un directorio telefónico el archivo que contenga tal información deberá ordenarse con base al apellido y nombre de la persona, porque así se necesita el reporte de los datos.
Sin embargo, si se requiere tener un directorio telefónico ordenado de acuerdo a la zona postal o por su dirección, deberá de existir dos archivos, que podrán contener la misma información pero ordenada de forma diferente, por lo que los sistemas de información que se construyen utilizando esta organización, tienden a duplicar registros. Esto se podría decir que es una desventaja de la organización de archivos secuenciales.
Los sistemas de información que se construyen utilizando archivos secuenciales tienden a duplicar registros por los archivos que estén en orden diferente. Por lo regular no todos los archivos se conservan; muchos se consideran como temporales y se borran después de que se han utilizado como entrada al programa de aplicación y la información contendida se ha explotado para un propósito particular.
Debido a que los registros de un archivo secuencialmente deben de accesarse constantemente se utilizan con mayor frecuencia en procesamiento por lotes (que pueden tomar varios registros a la ves) que en procesamiento interactivo.
El desempeño de los archivos secuenciales depende de:
Factor de bloqueo
Longitud del archivo
Selección de la llave.
Actualización de archivos secuenciales.
Un archivo maestro representa un panorama estático de algún aspecto de una empresa. Sin embargo muchos de los aspectos de dicha organización no son estáticos, sino que continuamente ocurren cambios internos y/o externos que afectan directa o indirectamente a la empresa, como puede ser la contratación de personal, despidos, los ajustes de precios, etc. Para que un archivo pueda reflejar un estado actual lo más confiable posible, nuestro archivo debe ser actualizado.

No hay comentarios:

Publicar un comentario

Nota: solo los miembros de este blog pueden publicar comentarios.