“Año de la Promoción de la Industria Responsable y Compromiso Climático”
“Universidad Nacional José Faustino SánchezCarrión” Facultad de Ing. Industrial, Sistemas e Informática
TEMA: Identificación de las diferentes tecnologías de base de datos, BD columnares y BD basados en registros. Comparación entre BD propietarias y libres
CURSO: Base de Datos II PROFESOR: MORALES, JULIO INTEGRANTES:GRADOS AGURTO, POOL OBISPO VISCAINO, GILMAR PANASPAICO TORIBIO, LUIS SANCHEZ MORALES, RUBEN
HUACHO – PERU
AGRADECIMIENTO El agradecimiento a nuestras madres y padres quienes con sus sabios consejos supieron hacer un hombre de bien y vocación de servicio a la colectividad, a mis alumnos gracias a ellos, aprendí y aprendo hacer un mejor profesional.
DEDICATORIA Al Dios Supremo, por haberme dado la vida, el conocimiento y estar rodeado de las personas que más queremos.
RESUMEN En vista de que estamos cursando el curso de base de datos y no tenemos algunos conceptos claros sobre los tipos de base de datos, características, ventajas y desventajas de cada una de ellas presentamos este trabajo en esperanza de que sirva de gran ayuda para ampliar el conocimiento de los estudiantes de la facultad de Facultad de Ing. Industrial, Sistemas e Informática de la Universidad Nacional José Faustino Sánchez Carrión sobre estos temas que son de suma importancia para nuestra carrera profesional.
CONTENIDOS Portada………………………………………………………………...………….Pg. 1 Agradecimiento…………………………………………………………..…..Pg. 2 Dedicatoria……………………………………………………………….……..Pg. 3 Resumen…………………………………………………………………….……Pg. 4 Introducción……………………………………………………...…….........Pg.7 CAPÍTULOI: Bases de datos 1.1Conceptualización: Bases de datos……………………….…….Pg. 8 1.2 Ventajas de su uso……………………………………………………..Pg. 8 1.3 Tecnologías de base de datos…………………………………….Pg. 9 1.3.1 Base de datos personales……………………………………….Pg. 9 1.3.2 Base de datos corporativas.......................................Pg. 9 1.3.3 Datawarehouse o Almacén de Datos........................Pg. 10 1.3.4 Datamart...................................................................Pg. 10 1.3.5 Cubos de información...............................................Pg. 10 1.3.6 Data Mining o Minería de Datos...............................Pg. 12 1.4 Tipo de base de datos..................................................Pg. 12 1.4.1 Base de datos basados en registros...........................Pg. 12 1.4.1.1 Definición................................................................Pg. 12 1.4.1.2 Los 3 modelos de datos más ampliamente aceptados............................................................................Pg. 12 1.4.1.3 Modelo Jerárquicas.................................................Pg. 13 1.4.1.4 Modelo Red.............................................................Pg. 13 1.4.1.5 Modelos Transaccionales........................................Pg. 15
1.4.1.6 Modelo Relacionales..............................................Pg. 15 1.4.1.6 Modelo Entidad/Relación......................................Pg. 16 1.4.1.6 Modelo Multidimensionales.................................Pg. 17 1.4.1.6 Modelo Orientado A Objetos................................Pg. 17 1.4.1 Base de datos Columnares.......................................Pg. 18 1.4.1.1
Definición........................................................Pg. 18
1.4.1.2
Características.................................................Pg. 19
1.4.1.2.1 Tiempo de carga................................................Pg. 19 1.4.1.2.2 Carga instrumental............................................Pg. 20 1.4.1.2.3 Comprensión de datos......................................Pg. 20 1.4.1.2.4 Limitaciones estructurales................................Pg. 20 1.4.1.2.5 Tánicas de ..............................................Pg. 21 1.4.1.2.5 Rendimiento.....................................................Pg. 21 1.4.2.5 Escalabilidad........................................................Pg. 21 1.4.1.3 Column-Oriented vs Row-Oriented.....................Pg. 22 1.4.1.4 Ventajas..............................................................Pg. 22 1.4.1.5 Desventajas........................................................Pg. 23 1.5 Base De Datos y Tecnologías Web...........................Pg. 24 1.6 Comparación entre bases de datos propietarias y bases de datos libres..................................................Pg. 26 1.6.1 Software Libre (llamado también OpenSource)...Pg. 27 1.6.2 Software Propietario............................................Pg. 27 1.6.3 Casos de éxito de MySQL (Base de datos Libre)…Pg. 33
INTRODUCCION Desde que el término bases de datos fue escuchado por primera vez en un simposio celebrado en California en 1963. Este término ha tomado peso en la sociedad por ser una herramienta que permite el manejo de información veraz y objetiva de esta forma se puede acceder con mayor rapidez y seguridad a la información que se necesita. Esta herramienta ha servido en gran parte de la sociedad, más en la parte de los negocios y empresas. Pero quedan las dudas sobre qué tipos de base de datos hay, que tecnologías usan, como es su desempeño en determinado ámbito, cuáles son sus ventajas de cada una y sus desventajas. El objetivo de este trabajo es responder a estas preguntas y dudas que podemos tener sobre base de datos.
CAPÍTULO I: BASE DE DATOS 1.1 Conceptualización: Base de datos Las Bases de datos hacen en el dominio de la información lo que las bases de datos hacen en el dominio de los datos. La ventaja del uso de Bases de Información está en que permiten realizar un trabajo de diseño y desarrollo de aplicaciones más cercano al el cual tiende a producir aplicaciones bien comportadas desde el punto de vista de la Arquitectura de Información. Esto significa aplicaciones de calidad: confiables, seguras, fáciles de entender, de usar, de mantener y de extender.
1.2 Ventajas de su uso: Ventajas adicionales del uso de bases de información son la facilidad de definición, desarrollo, implementación y transferencia tecnológica, lo cual normalmente reduce los costos y aumenta la productividad de las organizaciones, así como la de sus grupos de desarrollo de aplicaciones. Cuando se trabaja con bases de datos se deben traducir los requerimientos de la aplicación en el dominio de la información a requerimientos en el dominio de los datos, obligando a realizar un trabajo de programación sofisticado, difícil y con muchos posibles puntos de falla. Por el contrario, cuando se trabaja con bases de información los requerimientos de la aplicación en el dominio de la
información se usan en forma muy directa para diseñar la base de información, por lo que el desarrollo de la aplicación se simplifica, puede realizarse con la participación de los s y obtiene resultados de calidad en tiempos mucho menores que los de la aproximación tradicional, ya que la conversión de los requerimientos de información en requerimientos de datos los realiza en forma automática el motor de bases de información.
1.3 Tecnología de Bases de Datos: 1.3.1. Base de datos personales: • Son colecciones de datos que integran información de personas, tales como su nombre, su RFC, su dirección, su teléfono, su estado civil, su correo, entre otras. • Estas Bases de Datos se encuentran y deben estar protegidas por la Ley de Datos Personales para que no se haga mal uso de ellas
1.3.2 Base de datos corporativas:
1.3.3 Datawarehouse o Almacén de Datos: • En el contexto de la informática, un almacén de datos (del inglés data warehouse) es una colección de datos orientada a un determinado ámbito (empresa, organización, etc.), integrado, no volátil y variable en el tiempo, que ayuda a la toma de decisiones en la entidad en la que se utiliza. • Se trata, sobre todo, de un expediente completo de una organización, más allá de la información transaccional y operacional, almacenado en una base de datos diseñada para favorecer el análisis y la divulgación eficiente de datos (especialmente OLAP, procesamiento analítico en línea). • El almacenamiento de los datos no debe usarse con datos de uso actual.
1.3.4 Datamart: • Los Data marts son subconjuntos de datos de un data warehouse para áreas específicas. • Entre las características de un Datamart destacan :
1.3.5 Cubos de información: • Los cubos de información o cubos OLAP funcionan como los cubos de rompecabezas en los juegos, en el juego se trata de armar los colores y en el data warehouse se trata de organizar los datos por tablas o relaciones; los primeros (el juego) tienen 3 dimensiones, los
cubos OLAP tienen un número indefinido de dimensiones, razón por la cual también reciben el nombre de hipercubos. • Un cubo OLAP contendrá datos de una determinada variable que se desea analizar, proporcionando una vista lógica de los datos provistos por el sistema de información hacia el data warehouse, esta vista estará dispuesta según unas dimensiones y podrá contener información calculada. • El análisis de los datos está basado en las dimensiones del hipercubo, por lo tanto, se trata de un análisis multidimensional. • A la información de un cubo puede acceder el ejecutivo mediante "tablas dinámicas" en una hoja de cálculo o a través de programas personalizados. • Las tablas dinámicas le permiten manipular las vistas (cruces, filtrados, organización, totales) de la información con mucha facilidad. • Las diferentes operaciones que se pueden realizar con cubos de información se producen con mucha rapidez. • Llevando estos conceptos a un data warehouse, éste es una colección de datos que está formada por «dimensiones» y «variables», entendiendo como dimensiones a aquellos elementos que participan en el análisis y variables a los valores que se desean analizar.
1.3.6 Data Mining o Minería de Datos • Es un campo de las ciencias de la computación referido al proceso que intenta descubrir patrones en grandes volúmenes de conjuntos de datos. • Utiliza los métodos de la inteligencia artificial, aprendizaje automático, estadística y sistemas de bases de datos. • El objetivo general del proceso de minería de datos consiste en extraer información de un conjunto de datos y transformarla en una estructura comprensible para su uso posterior. • Además de la etapa de análisis en bruto, que involucra aspectos de bases de datos y gestión de datos, procesamiento de datos, el modelo y las consideraciones de inferencia, métricas de Intereses, consideraciones de la Teoría de la complejidad computacional, postprocesamiento de las estructuras descubiertas, la visualización y actualización en línea.
1.4 Tipo de base de datos 1.4.1 Base de datos basados en registros: 1.4.1.1 Definición: Se utilizan para describir los datos en los niveles conceptual y externo. A diferencia de los modelos de datos basados en objetos, estos modelos sirven para especificar la estructura lógica general de la BD; sin embargo no permiten especificar en forma clara los limitantes de los datos.
1.4.1.2 Los 3 modelos de datos más ampliamente aceptados son: -Modelo Jerárquicas -Modelo de Red -Modelos Transaccionales -Modelo Relacionales -Modelo Entidad/Relación -Modelo Multidimensionales -Modelos Orientadas a Objetos
1.4.1.3 Modelo Jerárquicas: Éstas son bases de datos que, como su nombre indica, almacenan su información en una estructura jerárquica. En este modelo los datos se organizan en una forma similar a un árbol (visto al revés), en donde un nodo padre de información puede tener varios hijos. El nodo que no tiene padres es llamado raíz, y a los nodos que no tienen hijos se los conoce como hojas. Las bases de datos jerárquicas son especialmente útiles en el caso de aplicaciones que manejan un gran volumen de información y datos muy compartidos permitiendo crear estructuras estables y de gran rendimiento. Una de las principales limitaciones de este modelo es su incapacidad de representar eficientemente la redundancia de datos.
1.4.1.4 Modelo Red: Este es un modelo ligeramente distinto del jerárquico; su diferencia fundamental es la modificación del concepto de nodo: se permite que un mismo nodo tenga varios padres (posibilidad no permitida en el modelo jerárquico). Fue una gran mejora con respecto al modelo jerárquico, ya que ofrecía una solución eficiente al problema de redundancia de datos;pero, aun así, la dificultad que significa manejar la información en una base de datos de red ha significado que sea un modelo utilizado en su mayoría por programadores más que por s finales. 1) Se tiene el siguiente modelo relacional, el cual será transformado en un modelo de datos de red:
Esta modelo relacional transformada al modelo de red sería la siguiente:
1.4.1.5 Modelos Transaccionales: Son bases de datos cuyo único fin es el envío y recepción de datos a grandes velocidades, estas bases son muy poco comunes y están dirigidas por lo general al entorno de análisis de calidad, datos de producción e industrial, es importante entender que su fin único es recolectar y recuperar los datos a la mayor velocidad posible, por lo tanto la redundancia y duplicación de información no es un problema como con las demás bases de datos, por lo general para poderlas aprovechar al máximo permiten algún tipo de conectividad a bases de datos relacionales.
1.4.1.6Modelo Relacionales: En este modelo se representan los datos y las relaciones entre estos, a través de una colección de tablas, en las cuales los renglones (tuplas) equivalen a los cada uno de los registros que contendrá la base de datos y las columnas corresponden a las características (atributos) de cada registro localizado en la tupla.
1.4.1.6Modelo Entidad/Relación: Técnica de análisis basada en la identificación de las entidades y de las relaciones que se dan entre ellas en la parte de realidad que pretendemos modelar. El modelo E/R permite representar de forma abstracta los datos que se pretenden almacenar en una base de datos. Existen notaciones alternativas para la representación gráfica del diseño conseguido mediante la técnica de análisis que propone el modelo E/R: -Diagramas E/R - Diagramas UML (Lenguaje Unificado de Modelado)
1.4.1.6 Modelo Multidimensionales: Son bases de datos ideadas para desarrollar aplicaciones muy concretas, como creación de Cubos OLAP. Básicamente no se diferencian demasiado de las bases de datos relacionales (una tabla en una base de datos relacional podría serlo también en una base de datos multidimensional), la diferencia está más bien a nivel conceptual; en las bases de datos multidimensionales los campos o atributos de una tabla pueden ser de dos tipos, o bien representan dimensiones de la tabla, o bien representan métricas que se desean estudiar.
1.4.1.6 Modelo Orientado A Objetos: Este modelo, bastante reciente, y propio de los modelos informáticos orientados a objetos, trata de almacenar en la base de datos los objetos complejos (estado y comportamiento). El modelo orientado a objetos también soporta relaciones de mucho a muchos, siendo el primer modelo que lo permite. Aun que se debe ser muy cuidadoso cuando se diseñan estas relaciones para evitar pérdidas de información
1.4.2 Base de datos Columnares: 1.4.2.1 Definición: Las Bases de Datos Columnares se introdujeron por primera vez en 1970 en productos como Model 204 y ABABAS, este enfoque ha resurgido recientemente en Vertical y en cierta medida en QD Technology. Como su nombre lo indica, las bases de datos están organizados de columna por columna en lugar de la como una unidad. Esto los hace especialmente eficaz en las consultas analíticas, como la lista de selecciones, que a menudo lee unos pocos elementos de datos, pero necesitamos ver todas las instancias de estos elementos. En contraste, una convencional base de datos relacional almacena los datos por las, por lo que toda la información de un registro (fila) es inmediatamente accesible. Esto tiene
Sentido para las consultas transaccionales, que suelen referirse a un registro a lavez. Cada columna es almacenada contiguamente en un lugar separado en disco, usando generalmente unidades de lectura grandes para facilitar el trabajo al buscarvarias columnas en disco. Para mejorar la eficiencia de lectura, los valoresse empaquetan de forma densa usando esquemas de compresión ligera cuandoes posible. Los operadores de lectura de columnas se diferencian de los comunes(de filas) en que son responsables de traducir las posiciones de los valores en locacionesde disco y de combinar y reconstruir, si es necesario, tuplas de diferentescolumnas.
1.4.2.2 Características: 1.4.1.2.1 Tiempo de carga ¿Cuánto tiempo se necesita para convertir datos de origen en el formato de Columna? Esta es la pregunta más básica de todas. Tiempos de carga son a menudo medidos en gigabytes por hora, que puede ser extremadamente lento, cuando de decenas o cientos de gigabytes de datos se trata. La cuestión a menudo carece de una respuesta sencilla, porque la velocidad de carga puede variar en función de la naturaleza de los datos y las elecciones realizadas por el . Por ejemplo, algunos sistemas pueden almacenar varias versiones de los mismosdatos, ordenados en diferentes secuencias o en los diferentes niveles de agregación. Los s pueden construir un menor número de versiones a cambiode una carga rápida, pero puede pagar un precio más adelante con consultas más lentas. Pruebas realistas basadas en sus propios datos son el mejor camino para una respuesta clara.
1.4.1.2.2 Carga instrumental: Una vez que un conjunto de datos se ha cargado, todo debe ser recargado cadavez que hay una actualización. Muchos sistemas columnares permiten carga incremental,teniendo solo los registros nuevos o modificados y la fusión de losdatos anteriores. Pero la atención al detalle es fundamental, ya que las funcionesde carga
incremental varían ampliamente. Algunas cargas incrementales tardanhasta una completa reconstrucción y algunos resultados son el rendimientomás lento, algunos pueden agregar registros, pero no cambiar o suprimirlos. Las Cargas incrementales a menudo deben completarse periódicamente con una reconstrucción completa.
1.4.1.2.3 Comprensión de datos: Algunos sistemas columnares pueden comprimir mucho la fuente de datos y archivos resultantes irán de tomar una fracción de espacio en el disco original. Puede ocasionar en estos casos un impacto negativo en el rendimiento por la Descompresión de datos a realizar la lectura. Otros sistemas utilizan menos compresión o almacenan varias versiones de los datos comprimidos, teniendo másespacio en disco, pero cobrando otros beneficios a cambio. El enfoque más adecuadodependerá de sus circunstancias. Tenga en cuenta que la diferencia de los requisitos de hardware pueden ser sustanciales.
1.4.1.2.4 Limitaciones estructurales: Las bases de datos columnares utilizan diferentes técnicas para imitar una estructurarelacional. Algunos requieren la misma clave principal en todas las tablas,es decir, la jerarquía de la base de datos está limitada a dos niveles. Los límitesimpuestos por un sistema en particular no parecen tener importancia, pero recuerde Que sus necesidades pueden cambiar mañana. Limitaciones que parecenaceptable ahora podrá evitar que la ampliación del sistema en el futuro.
1.4.1.2.5 Tánicas de : Algunas bases de datos de columnares solo se pueden acceder utilizando su propio proveedor de lenguaje de consultas y herramientas. Estos pueden ser muy poderosos, incluyendo capacidades que son difíciles o imposibles usando el estándar SQL. Pero a veces faltan funciones especiales, tales como las consultas Que comparan valores con o en los registros. Si necesita acceder al sistema Con herramientas basadas en SQL, determine exactamente
qué funciones SQL y dialectos son compatibles. Es casi siempre un subconjunto completo de SQL y, en particular, rara vez se dispone de las actualizaciones. También asegures de encontrar si el rendimiento de las consultas SQL es comparable a los resultados con el sistema de la propia herramienta de consulta. A veces, el ejecutar consultas SQL mucho más lento.
1.4.1.2.5 Rendimiento: Los sistemas columnares por lo general superan a los sistemas de relaciones en casi todas las circunstancias, pero el margen puede variar ampliamente. Las consultas que incluyen cálculos o individual a los registros puede ser tanlento o más que un sistema relacional adecuadamente indexado.
1.4.2.5 Escalabilidad: El punto de las bases de datos columnares es obtener buenos resultados engrandes bases de datos. Pero no puede asumir todos los sistemas pueden escalara decenas o centenares de terabytes. Por ejemplo, el rendimiento puede depender de determinados índices de carga en la memoria, de modo que su equipo debe tener memoria suficiente para hacer esto. Como siempre, en primerlugar preguntar si el vendedor tiene en ejecución los sistemas existentes a unaescala similar a la suya y hablar con las referencias para obtener los detalles. Siel suyo será más grande que cualquiera de las instalaciones existentes, asegúrese de probar antes de comprar.
1.4.2.3 Column-Oriented vs Row-Oriented: La base de datos orientada a filas debe leer toda la fila con el fin de acceder alos atributos necesarios. Como resultado, las consultas analíticas y de inteligenciade negocios terminan leyendo más datos de lo necesario para satisfacer suconsulta. Además este tipo de bases de datos habiendo sida diseñada para actividadestransaccionales, es a menudo construido para la recuperaciónóptimay unión de conjunto de datos pequeños en lugar de grandes, cargando así lossubsistemas de entrada y salida
que soportan el almacenamiento analítico. Enrespuesta, los es de base de datos tratan de ajustar el entorno delas diferentes consultas mediante la construcción de índices adicionales así comola creación de vistas especiales. Esto requiere mayor tiempo de procesamiento yconsumo adicional de almacenamiento de datos.
1.4.1.4 Ventajas: 1. La principal ventaja de este tipo de sistemas es el rápido a los datos: esto ya lo hemos demostrado con el modelo DSM el cual nos permite consultar rápidamente los datos columna a columna, al guardarse físicamente de manera contigua. 2. Un BBMS en una base de datos orientada a columnas, lee solo los valores decolumnas necesarios para el procesamiento de una consulta determinada porlo cual las bases de datos orientadas a columnas tienen una mayor eficienciaen entornos de almacenes, donde las consultas, típicas incluyen los agregadosrealizados por un gran número de elementos de datos. 3. Se comprime la información asignable de cada columna con el fin de mejorar el procesamiento desde el ancho de banda del a disco. 4. Cambios en el esquema tiene menor impacto y por lo tanto el coste de realizarloses menor.
1.4.1.5 Desventajas: 1. No orientado a transacciones: este es el factor más débil de esta tecnología.El hecho de tener los datos guardada columna a columna nos permite retornarnos las filas más rápidamente, pero al insertar, actualizar o borrar unregistro, se deberá hacer en más de una ubicación (al tener que actualizar todoslos pares clave-valor asociados a una relación). Por esta razón, este tipode bases de datos no se recomienda para sistemas de tipo OLTP orientadosa transacciones y alta concurrencia.
2. Reportes operacionales: también llamados reportes de seguimiento en los quese desea ver toda la información de una relación que puede contener muchastuplas. En algunos casos esto puede resultar inocente comparado con losRow-Stores. 3. No existe un modelo de datos que soporte teóricamente este modelo de basede datos. 4. No existe un estándar que unifique los criterios de implementación de estemodelo de base de datos.
1.5 Base De Datos y Tecnologías Web: Los avances en las comunicaciones y las nuevas tecnologías están acercando la información al final, así como facilitando su procesamiento. Uno de los cambios más importantes, tiene que ver con el soporte y canal de transmisión de la información. Internet y las Tecnologías Web, han conseguido que el esté familiarizado con información hipermedia, incluyendo texto, imágenes, audio y vídeo. Cualquier ordenador conectado a la red constituye una fuente fácil de entrada de información y de servicios. Este hecho hace que cada vez cobre más fuerza la idea de que nos encontramos inmersos en una “sociedad de la información”. World Wide Web, o simplemente Web, constituye uno de los intentos más recientes y a la vez más poderosos de sistematizar y simplificar el a la información en Internet. Este nuevo sistema ha revolucionado la forma en que los s se comunican y utilizan los servicios de la llamada “red de redes”, y constituye la causa fundamental del espectacular aumento en el número de personas que usan Internet y de la popularidad e importancia que ha adquirido en la actualidad. La Tecnología Web permite el desarrollo de aplicaciones distribuidas basadas en el modelo Cliente/Servidor. Las aplicaciones web suponen un importante cambio de enfoque con respecto al desarrollo de aplicaciones tradicionales. Su principal característica consiste en que la comunicación con el se establece utilizando páginas web, que se pueden visualizar desde un navegador que se esté ejecutando en cualquier ordenador conectado a la red. Otra característica importante, consiste en que
el código de la aplicación se puede ejecutar en el cliente, en el servidor o distribuirse entre ambos. Además debido al gran volumen de información que se maneja, las aplicaciones web suelen utilizar una Base de Datos, para organizar y facilitar el a la información. La Tecnología Web permite el desarrollo de aplicaciones distribuidas basadas en el modelo Cliente/Servidor. Las aplicaciones web suponen un importante cambio de enfoque con respecto al desarrollo de aplicaciones tradicionales. Su principal característica consiste en que la comunicación con el se establece utilizando páginas web, que se pueden visualizar desde un navegador que se esté ejecutando en cualquier ordenador conectado a la red. Otra característica importante, consiste en que el código de la aplicación se puede ejecutar en el cliente, en el servidor o distribuirse entre ambos. Además debido al gran volumen de información que se maneja, las aplicaciones web suelen utilizar una Base de Datos, para organizar y facilitar el a la información.
Para implementar el desarrollo de la WEB se hace uso de los recursos como la arquitectura cliente-servidor ya que es la herramienta primordial para el desarrollo WEB. Aquí tenemos algunas tecnologías cliente de navegadores WEB como son: • Internet • Nexcape • Mozilla • Opera • Zafarí Herramientas cliente como son los lenguajes de programación: • • • •
HTML Java script Aplets java C++
•
Visual Basic script
Aquí servidores WEB como tecnologías servidor: • • • •
Internet información server (iis) Apache WEB sphere Motores de java y php
Esta son algunas herramientas servidor como son estos lenguajes de programación: • • • • •
Php Asp Jsp Servlets cgl´s
Una consulta realizada en el programaLucidDB Query 4: SELECT DIM_AREAFUNCIONAL.DESC_CATEGORIA , DIM_GRADO_ACADEMICO.DESC_CORTA , DIM_CATEGORIA_GRUPO.DESC_CLASIFICACION , DIM_CATEGORIA_GRUPO.DESC_CATEGORIA_GRUPO , DIM_CATEGORIA_GRUPO.CAT_2 , DIM_AREA_CIENTIFICA.ID_AREA_CIENTIFICA_ODS , COUNT(DISTINCT H_RRHH.ID_PERSONA) as m0 FROM DIM_AREAFUNCIONAL, H_RRHH , DIM_GRADO_ACADEMICO , DIM_CATEGORIA_GRUPO, DIM_AREA_CIENTIFICA WHERE H_RRHH.ID_AREAFUNC = DIM_AREAFUNCIONAL.ID_AREA_FUNCIONAL and DIM_AREAFUNCIONAL.DESC_CATEGORIA = 'Ingenieros' and H_RRHH.ID_GRADO_ACADEMICO = DIM_GRADO_ACADEMICO.ID_GRADO_ACADEMICO and H_RRHH.ID_CUERPO = DIM_CATEGORIA_GRUPO.ID_CATEGORIA_GRUPO and DIM_CATEGORIA_GRUPO.DESC_CLASIFICACION = 'Grupo' and DIM_CATEGORIA_GRUPO.DESC_CATEGORIA_GRUPO in ('A', 'B', 'C', 'D') and H_RRHH.ID_CUERPO = DIM_CATEGORIA_GRUPO.ID_CATEGORIA_GRUPO and H_RRHH.ID_AREA_CIENTIFICA_PERSONAL = DIM_AREA_CIENTIFICA.ID_AREA_CIENTIFICA GROUP BY DIM_AREAFUNCIONAL.DESC_CATEGORIA, DIM_GRADO_ACADEMICO.DESC_CORTA, DIM_CATEGORIA_GRUPO.DESC_CLASIFICACION, DIM_CATEGORIA_GRUPO.DESC_CATEGORIA_GRUPO , DIM_CATEGORIA_GRUPO.CAT_2, DIM_AREA_CIENTIFICA.ID_AREA_CIENTIFICA_ODS;
1.6 Comparación entre bases de datos propietarias y bases de datos libres: En la actualidad existe una gran variedad de gestores de base de datosrelacionales entre los que podemos mencionar a: MSSQL, ORACLE, DB2, SYBASE, INFORMIX, MySQL, POSTGRESQL, etc. Una forma de clasificarlas es por si son libres o propietarias. Veamos a continuación que significa software libre y propietario para tener una idea:
1.6.1 Software Libre (llamado también OpenSource): Es también llamado en ingles free software que es la denominación del software que respeta la libertad de los s sobre su producto adquirido y por tanto, a su vez obtenido puede ser copiado, usado, estudiado, modificado y retribuido libremente.
1.6.2 Software Propietario: Es un software comercializado, es decir, que las compañías que lo producen, cobran dinero por el producto, su distribución y soporte. Posee restricciones en el uso, copia o modificación o cuyo código fuente no está disponible, es decir, que es un código cerrado. Ahora veremos algunas ventajas y desventajas que tienen:
Ahora, las bases de datos libres y propietarios al ser software libre y propietario respectivamente, tienen esas características también. El gran dilema para muchos es, ¿cuál elegir?, ¿cuál es mejor o peor? La verdad es que todas las bases de datos son válidas y todas sirven si se configuran y utilizan bien. A continuación veremos un pequeño cuadro donde analizamos las bases de datos libres y propietarios:
Las que actualmente son las más reconocidas son Oracle por parte de las propietarias y MySQL por parte de las libres. Antes de empezar a comparar estas 2 bases de datos, conozcámoslas un poco más:
Oracle
Es un manejador de base de datos relacional que hace uso de los recursos del sistema informático en todas las arquitecturas de hardware Es el mayor y más usado Sistema Manejador de Base de Dato Relacional (RDBMS) en el mundo. La Corporación Oracle ofrece este RDBMS como un producto incorporado a la línea de producción. Además incluye cuatro generaciones de desarrollo de aplicación, herramientas de reportes y utilitarios. Oracle corre en computadoras personales (PC), microcomputadoras, mainframes y computadoras con procesamiento paralelo masivo
MySQL
MySQL es un sistema de gestión de base de datos relacional. Capaz de almacenar una enorme cantidad de datos de gran variedad. Mysql utiliza el lenguaje de consulta estructurado (SQL). Incluye un motor de almacenamiento InnoDb y ACID. Además dispone de storeprocedures, triggers, vistas. Mysql es GPL (General Public Licencie) no tiene costo, en lo que gana la empresa es en el soporte y entrenamiento. Al ser una empresa que maneja sus códigos con el tipo de licencia GPL reduce los costos de desarrollo, istración. A continuación presentaremos una serie de comparaciones entre estas 2 bases de datos:
1.- Sistemas Operativos Soportados
2.- Interfaces (Api´s) / Conectores soportados
3.- Características
4.- Comparativo de tipos de datos
1.6.3 Casos de éxito de MySQL (Base de datos Libre): Lycos migro a MySQL Server
Algunas bases de datos de columnares solo se pueden acceder utilizando su propio proveedor de lenguaje de consultas y herramientas. Estos pueden ser muy poderosos, incluyendo capacidades que son difíciles o imposibles usando el estándar SQL. Pero a veces faltan funciones especiales, tales como las consultas Que comparan valores con o en los registros. Si necesita acceder al sistema Con herramientas basadas en SQL, determine exactamente qué funciones SQL y dialectos son compatibles. Es casi siempre un subconjunto completo de SQL y, en particular, rara vez se dispone de las actualizaciones. También asegures de encontrar si el rendimiento de las consultas SQL es comparable a los resultados con el sistema de la propia herramienta de consulta. A veces, el ejecutar consultas SQL mucho más lento.
1.6.4 Casos de éxito de SQL Server 2000(Base de datos propietaria): Disco
Disco es una cadena de supermercados líder en Argentina que tiene más de 800GB de datos y 2000 millones de registros almacenados en la base de datos SQL Server 2000. La compañía utiliza esta base de datos para realizar minería de datos en los datos recogidos de los 1.5 millones de s de su programa de fidelización de clientes.