viernes, 5 de julio de 2013

Inteligencia de Negocios



Introducción


A partir de los años 90’s la Inteligencia de negocio o Bussines Intelligence, han ido evolucionando constantemente y en muchas direcciones, producto del crecimiento exponencial de la información y las nuevas tecnologías que han permitido que el BI  se desarrolle de manera íntegra.
La tecnología de BI ha encontrado lugar en dos niveles primaros dentro de las organizaciones uno es entre los altos ejecutivos, para quienes es de vital importancia obtener información estratégica y también entre los administradores de la línea de negocios quienes son los responsables del análisis táctico.
Desde los años 90’s las tecnologías de Bussines Inteligence han evolucionado dramáticamente y muchas empresas han empezado a invertir en estas nuevas tecnologías pero la pregunta es ¿Por qué las empresas realizan estas inversiones? ¿Cuál es la importancia de estas tecnologías? ¿Qué es la inteligencia de negocio (BI)? Estas son algunas de las respuestas a las que responderá este documento.






Historia del Bussines Inteligence


Es importante saber que la inteligencia de negocios tiene sus principios en el siglo XIX, uno de los primeros hitos que dio paso al desarrollo de la Inteligencia de Negocios fue la aparición  del concepto de bases de datos (CODD)  en 1969. Después de la creación del concepto de las bases de datos en 1970 se crearon las primeras bases de datos y también aparecieron las primeras aplicaciones empresariales (SAP, JD Edwards, Sibel, PeopleSoft). Estas aplicaciones permitieron realizar lo que se conoce como “Data Entry” en los sistemas, aumentando la información disponible, sin embargo, no fueron capaces de ofrecer acceso fácil y rápido a la información por lo cual no era lo suficientemente eficiente a la hora de generar reportes o tomar decisiones. A mediados de 1980 se creó un nuevo concepto llamado “Datawarehouse”[i] (Ralph Kimball, Bill Inmon), y aparecieron los primeros sistemas de reporting. A pesar de todo seguía siendo complicado y funcionalmente pobre. Existían relativamente potentes sistemas de bases de datos pero no existían aplicaciones que facilitaran su explotación.
En el año 1989 aparece el primer concepto de Inteligencia de negocio por Howrd Dresner, y en el año 1990 aparece Bussines Intelligence 1.0. Proliferación de múltiples aplicaciones de BI. Estos proveedores resultaban caros pero facilitaron el acceso a la información, y en cierto modo agravaron los problemas que pretendían resolver.
En el año 2000 apareció Bussines Intelligence 2.0. Consolidación de las aplicaciones de Bi en unas pocas plataformas como Oracle, SAP, IBM,, Microsoft. A partir de la información estructurada se empieza a considerar otro tipo de información y documentación no estructurada.
En los últimos años y con los grandes avances en las tecnologías de la información las plataformas de BI se han convertido en herramientas fundamentales para la gran mayoría de las empresas a nivel mundial tanto para las pequeñas y medianas empresas como también para las grandes empresas y compañías como lo podemos observar en la figura 1.0.

Definición de Bussines Intelligence


Las aplicaciones de Inteligencia de Negocios o Bussines Intelligence (BI) son herramientas de soporte de decisiones que permite a las empresas el análisis, la manipulación de información crítica y el acceso interactivo a la información en tiempo real. El fin de estas aplicaciones es proporcionar a los usuarios un mayor entendimiento de la información que les permita identificar las oportunidades y los problemas de os negocios. Con estas herramientas y con la información que proveen los usuarios son capaces de acceder y apalancar una vasta cantidad de información y analizar sus relaciones para entender las tendencias que apoyan las decisiones de las empresas y negocios. Estas herramientas previenen una potencial perdida de conocimientos dentro de una empresa que resulta de una acumulación masiva de la información que no es fácil de leer o de usar.
La Inteligencia de negocios es una arquitectura y una colección de herramientas que buscan mejorar a las organizaciones, proporcionando información relevante para las distintas áreas que componen la empresa, proporcionando vistas y aspectos de negocios para cada uno de los empleados ya sea a nivel táctico, estratégico u operacional para que puedan tomar decisiones de la manera más eficiente para potenciar las capacidades de la empresa con la mayor cantidad de información disponible.
La base y objetivo de los sistemas de Inteligencia de negocios es la entrega oportuna de información, además esta información debe ser correcta y relevante para el sujeto que quiere usarla, es decir no solo la información debe ser correcta si no también la persona a quien se le entrega.
Un sistema de BI esta compuesto por una arquitectura y una colección de aplicaciones operacionales y de soporte de decisiones con bases de datos relacionales que proporcionan a los usuarios de la organización un fácil y rápido acceso a los datos de la organización.
Como se ha mencionado anteriormente las principales características de un sistema de Inteligencia de negocios son:
1)     Accesibilidad de la información: los datos son la fuente principal de este concepto. Lo primero que deben garantizar este tipo de herramientas y técnicas será l acceso de los usuarios a los datos independencia de la procedencia de estos.

2)     Apoyo en la toma de decisiones: Se busca ir más allá en la presentación de la información, de manera que los usuarios tengan acceso a herramientas de análisis que les permitan seleccionar y manipular solo aquellos datos que les interese.

3)     Orientación al usuario final: Se busca independencia entre los conocimientos técnicos de los usuarios y sus capacidades para utilizar estas herramientas.



Niveles de Realización de BI (Herramientas de Explotación)


Según el nivel de complejidad se pueden clasificar las soluciones de Bussines Intelligence en:
1)     Consultas de Informes Simples (Query Reports): son herramientas que nos permiten realizar consultas o informes para obtener información sobre los datos. Entre estos se encuentran el entorno transaccional a nivel de bases de datos, entorno de Datawarehouse.

2)     Cubos OLAP (On-Line Analytic processing): exploración, tablas dinámicas, etc…

3)     EIS: Solución que permite visualizar de una forma rápida y fácil el estado de una determinada situación empresarial,  presente o pasada, y que permite detector anomalías u oportunidades.

4)     DSS: Aplicación informática que basándose en modelos matemáticos y mediante análisis de sensibilidad permite ayudar a la toma de decisiones.

5)     Data Minding o Minería de datos: Pueden considerarse sistemas expertos que nos permiten interrogar a los datos para obtener información.

6)     KMS: Nuevas tecnologías para la gestión del conocimiento y su integración en una única plataforma.
En definitiva una solución de BI completa, que utiliza estos elementos mencionados anteriormente nos permite observar que es lo que está ocurriendo, comprender el por qué ocurre, predecir porqué ocurre, colaborar, es decir, que debe hacer el equipo y decir que camino es el que se debe seguir.



Ventajas y desventajas de BI


Las principales ventajas que proporciona la integración del BI en las empresas y organizaciones son las siguientes:
1)     Información concisa y relevante en tiempo real.
2)     Ayuda a la toma de decisiones
3)     Ventajas competitivas frente al mercado.
4)     Generación de Informes tácticos, técnicos y operacionales.
5)     Facilita las gestiones administrativas de las empresas.
6)     Muestra el estado real de la empresa en todo momento.
Retos y Desventajas de BI
Las principales desventajas que tiene la inteligencia de negocios son:
1)     Requiere de una gran inversión, dado que la construcción correcta de estos sistemas no es una tarea sencilla y se consumes muchos recursos, de los tres niveles principales de las organizaciones,  estos recursos son: Económicos, Humanos y materiales (equipos de última generación).

2)     No solo es capacitar los recursos humanos para que usen de forma adecuada las herramientas proporcionadas, sino que también se ven afectados los recursos económicos para obtener infraestructura acorde con las herramientas esto implica tecnología de última generación y por ende muy costosa, adema se debe tener claro que los recursos tecnológicos en ocasiones no permiten un adecuado uso o bien los resultados no son los esperados ya que habrán de ser sometidos al máximo rendimiento de sus funciones.

3)     Ya que las tecnologías están inmersas en un también que está evolucionando y cambiando constantemente en proporciones aceleradas producto de las nuevas tendencias, nuevos proveedores y su amplio mercado existe un alto riesgo a la hora de adquirir los recursos tecnológicos necesarios ya que lo más caro no siempre es lo más conveniente no lo mejor.

4)      La implementación implica desde la adquisición de herramientas de consultas y análisis hasta la capacitación de o los usuarios y operarios encargados de la utilización del sistema, lo cual implica que las empres no quieren correr el riesgo que los operarios del sistema migren a otras organizaciones con los conocimientos adquiridos y que el conocimiento gestado pierda calidad y privacidad.

5)     A la hora de la implementación existe una fuerte resistencia al cambio por parte de los operarios y usuarios del sistema, esto debido a las constantes dudas que surgen como por ejemplo ¿Por qué cambiar si este sistema funciona de forma adecuada y cómoda?

6)     No existe una gestión de cuando debemos cambiar nuestro sistema de comunicación e información, por lo cual los cambios aparentemente sencillos y rápidos sueles ser tediosos para clientes y usuarios.



Análisis de Mercado de BI


El exceso de información no es poder, sin embargo el conocimiento si, con mucha frecuencia el tratamiento y análisis de la información y los datos generados por las propias empresas suelen convertirse en verdaderos problemas y por lo tanto la toma de decisiones se vuelve desesperadamente lento.
Las tecnologías de BI como lo mencionamos anteriormente sirven para mejorar la toma de decisiones de forma rápida y eficiente para que finalmente se mejore la consecución de objetivos de la organización. Los objetivos claves de la Inteligencia de Negocios son incrementar la eficiencia organizacional y efectiva de las empresas proporcionando grandes ventajas competitivas frente a al mercado y sus competidores convirtiéndose en una herramienta fundamental para cualquier empresa u organización. Algunas de las Tecnologías de Inteligencia de Negocios apuntan a crear un flujo de datos dentro de la organización más rápido y accesible. Por otro lado novedosas tecnologías de BI toman un enfoque más agresivo redefiniendo los procesos existentes con otros nuevos, mucho más estilizados que eliminan gran cantidad de procesos o crean nuevas capacidades.
En una reciente encuesta realizada por Gartner, BI fue catalogado en el número dos en la lista de prioridades tecnológicas de los CIO para el 2005, después de ubicarse en el lugar número dos en el año 2004.
Debido a este nuevo énfasis en BI, el mercado de herramientas de Software de BI  alrededor del mundo creció en un 7.7% en el 2004, basado en estimaciones preliminares del mercado compuesto.
El crecimiento de 2004 fue conocido por el alto desempeño de vendedores específicos incluyendo Cognos y Microsoft. El ranking no cambo respecto al año 2003 tal y como se esperaba. Los tres mayores vendedores de herramientas de BI en el mercado global, según datos Gartner son los que se exponen en la tabla 1.0
Proveedor
Posición en el Mercado Compartido
Bussines Objects
1
SAP Institute
2
Cognos
3

En los últimos años el mercado de BI ha tenido un descenso en las ventas a nivel mundial.
El año 2012 el mercado de BI ascendió a 13.100 millones de dólares los que representan un crecimiento del 6.8% con respecto a los 12.300 millones de dólares del 2011. Sin embargo, el ritmo del crecimiento  desacelero considerablemente con respecto al 17% que experimento en el año 2011.

“Aunque es una caída impresionante, está en línea con nuestros pronósticos publicados durante el 2012”, escribieron los analistas Dan Sommer y Bhavish Sood en el informe. Asimismo, “las condiciones macroeconómicas globales no pueden ignorarse”, agrega el estudio. “Éstas generaron un mayor escrutinio de los presupuestos tanto de lo nuevo como del mantenimiento en todo el espacio de TI, y BI no fue la excepción”.[ii]
El rendimiento para el mercado de BI fue especialmente difícil en Europa y América Latina el año pasado, aunque no en Medio Oriente, África y los mercados emergentes de Asia-Pacífico, “que aún  se encuentran en fase de subida”, señala el reporte.
 
Mientras tanto, “la cada vez mayor confusión alrededor de los términos de moda y sobre dónde se encuentran los beneficios tangibles, contribuyeron muy probablemente con la desaceleración de los ciclos de ventas en BI mientras que los administradores de los presupuestos están intentando identificar las herramientas y el valor para el negocio”, de acuerdo a Gartner.
 
Más aún, el gasto en las plataformas de infraestructura BI más importantes “se mostró plano con un crecimiento de un solo dígito” el año pasado, mientras que el mayor gasto se realizó fuera de TI a nivel departamental, ya que las unidades de negocio buscaban aplicaciones analíticas y herramientas de descubrimiento de datos para sus necesidades particulares.

En términos de cuota de mercado, SAP se mantuvo en el primer lugar en la encuesta de Gartner con alrededor de 2.900 millones de dólares en ingresos por BI, aunque el crecimiento anual fue de solo 0,6%. Oracle se mantiene segunda con 1.950 millones de dólares, seguida por IBM con 1.620 millones de dólares.

 

Tipos de productos y ejemplos de BI


Las herramientas de software de BI son usadas para acceder a los datos de los negocios y proporcionar reportes, análisis, visualizaciones y alertas a los usuarios. La gran mayoría de las herramientas de BI son usadas por usuarios finales para acceder, analizar y reportar contra los datos que más frecuentemente residen en data warehouse, data marts y almacenes de datos operacionales. Los desarrolladores de aplicaciones usan plataformas de BI para desarrollar y desplegar aplicaciones (las cuales no son consideradas herramientas de BI). Ejemplos de una aplicación de BI son las aplicaciones de consolidación financiera y presupuestos.
Actualmente el mercado de herramientas de BI se encuentra constituido de dos subsegmentos: suites de BI empresarial (EBIS, por sus siglas en inglés) y plataformas de BI. La mayoría de las herramientas de BI, como las desarrolladas por los vendedores mencionados en la tabla 1, son BI empresarial y plataformas de BI. Gartner Dataquest (2005) realizó un pronóstico a cinco años, basado en una estimación preliminar de tamaño del mercados y una revisión de los inhibidores e impulsores, llegando a la conclusión de que el total de mercado de herramientas de BI proyecta un crecimiento de $ 2.5 billones en 2004 a $ 2.9 billones en 2009, con una tasa de crecimiento anual de 7.4%.

Conceptos y soluciones integrales (herramientas) BI


Dentro las los conceptos y herramientas principales de la inteligencia de negocios tenemos principalmente:
·        Sistemas Fuentes: Son los sistemas transaccionales que han sido diseñados fundamentalmente para el soporte de las operaciones del negocio como: Compras, Ventas, Almacenes, Contabilidad, etc. Estos sistemas deben cumplir un requisito fundamental: ya deben de estar consolidados en cuanto al registro de información de las operaciones. No sería limitante si le carece de reportes para toma de decisiones, ya que es ahí el vació que cubrirá la Inteligencia de Negocios adicionando módulos de gestión para las decisiones operacionales.
·        Bases de Datos Operacionales OLTP: Los sistemas transaccionales son los encargados de registrar o grabar las operaciones dentro de las bases de datos operacionales (On Line Transactional Process: OLTP). Estos datos permiten generar los informes para la toma de decisiones a nivel operacional. Estas bases de datos fundamentalmente lo que persiguen son el registro de las transacciones y la consistencia de los datos.
·        Requerimientos Estratégicos (Plan Estratégico): Es altamente recomendable tener definido el Plan Estratégico de la Organización. En caso extremo no se obtenga, a partir de las entrevistas se pueden buscar: objetivos, estrategias, indicadores de estrategias que permitan orientar el producto a diseñar. Son bastante útiles además del plan y las entrevistas los reportes de gestión que los tomadores de decisiones poseen para medir su gestión.

Estos requerimientos estratégicos deberán contrastarse con la Base de Datos Operacional, ya que muchos de ellos se obtendrán de esta fuente. En caso no puedan ser obtenidos se recomienda re-estructurar la Base de datos y las aplicaciones, a fin de satisfacer estos requerimientos estratégicos.
·        ETL (Extraer, Transformar y Cargar-Poblar): es el componente que permite dos cosas fundamentales:
o      Integrar datos cuando se tengan distintas fuentes (diferentes manejadores de bases de datos)
o      Llevar información de las bases de datos operacionales a las bases de datos dimensionales.
·        Data WareHouse (DWH): Es el gran almacén de datos que está estructurado para analizar la información, a diferente nivel de detalle, de todos los procesos de negocios que tiene la organización. Es la Base de Datos llamada estratégica o multidimensional. Una vez diseñadas mediante el ETL es poblada o llenada a partir de las Bases de Datos operacionales. El diseño va orientado a encontrar medidas (Por ejemplo: montos vendidos, montos cobrados, horas hombre utilizadas, etc.) y dimensiones (Clientes, Productos, Tiempo, Organización, Servicios, etc.).
·        Data Marts: Constituyen una parte de un DWH. Si un DWH está formado por todos los procesos de la organización, un Data Mart constituye un determinado proceso. Por ejemplo podríamos tener un Data Mart para Finanzas, otro para Logística. Pueden ser preparados a partir de un DWH o ser elaborados independientemente.
·        Tecnologías OLAP (On Line Analytical process): Es la tecnología que permite aprovechar como está estructurada la información de un DataMart o un Data WareHouse. Fundamentalmente es una tecnología que permitirá analizar información dinámicamente a los niveles táctico y estratégico basados en Cubos que contienen las medidas y las Dimensiones.
·        Minería de datos: Constituyen algoritmos avanzados (estadísticas, inteligencia artificial) que intenta descubrir cosas ocultas en los datos capturados a lo largo de las operaciones del negocio. Es el llamado el descubrimiento del conocimiento y va direccionado al nivel estratégico directamente.
·        Aplicaciones para soporte de decisiones: Van diseñadas para cubrir las decisiones tácticas y estratégicas. En el mercado existen una serie de herramientas que permiten construir estas aplicaciones, que se montan sobre una solución OLAP o Bases de Datos transaccionales.
·        Sistemas de Ejecución para Ejecutivos: Son sistemas diseñados para la alta dirección y que están basados en alertas o semáforos que indican el estado de un determinado indicador de negocio. Este indicador se le llama KPI (Key Performance Indicator). Estos estados están reflejados en símbolos como un semáforo (rojo, verde, ámbar) entre otros. Generalmente son obtenidos a partir de un Balance ScoredCard).



Bases de Datos Operacionales OLTP


Las bases de datos operacionales son bases de datos orientadas al procesamiento de transacciones. Una transacción genera un proceso atómico (Debe ser validado con un commit, o invalidado con un rollback), puede incorporar operaciones de inserción, modificación y borrado de datos. El proceso transaccional es típico de las bases de datos operacionales.
Una base de datos operacional debe contener:
1)     El acceso a los datos, esta optimizado para tareas frecuentes de lectura y escritura. Por ejemplo la enorme cantidad de transacciones que deben soportar las bases de datos de bancos o hipotecados diariamente.
2)     Los datos se estructuran según el nivel aplicativo como los programas de gestión, ERP o CRM implantados, sistemas de información departamental, Etc.
3)     Los formatos de los datos no son necesariamente uniformes en los diferentes departamentos (es común la falta de compatibilidad y la existencia de islas de datos).
4)     El historial de datos suele limitarse a los datos actuales o recientes.

ETL Extraer, Transformar y Cargar-Poblar


Es el proceso que le permite a las organizaciones mover datos desde múltiples fuentes, reformatearlos, limpiarlos y cargarlos en otras bases de datos.
La primera parte del ETL es la extracción de datos de los sistemas de origen, comúnmente los datos vienen de ficheros de textos u archivos de diferentes formatos, también pueden proceder de bases de datos con distintas estructuras y organizaciones. La mayoría de los proyectos de almacenamiento de datos fusiona datos provenientes de diferentes sistemas de origen.
Una parte intrínseca del proceso de extracción es el análisis de los datos extraídos, de lo que resulta un chequeo que verifica si los datos cumplen la pauta o estructura que se espera. De no ser así los datos se rechazan.
El proceso de transformación es el encargado de definir los parámetros y reglas  requeridos por el negocio para que los datos puedan ser cargados
El proceso de carga de información es el proceso por el cual los datos obtenidos en el proceso de transformación son cargados en los sistemas de destino. Dependiendo de los requerimientos de la organización, este proceso puede abarcar amplia variedad de acciones diferentes. En algunas bases de datos se sobrescribe información antigua con nuevos datos. Los Data Warehouse mantienen un registro de manera de que se pueda hacer una auditoria de los mismos y disponer de un rastro de toda la historia de un valor a lo largo del tiempo.
Existen dos formas básicas de desarrollar el proceso de carga estas son:
1)     Acumulación Simple: la acumulación simple es la mas sencilla y común. Consiste en realizar un resumen de todas las transacciones comprendidas en el periodo de tiempo seleccionado y transportar el resultado como una única transacción hacia el Data Warehouse, almacenando un valor calculado que consiste típicamente en una sumatoria o un promedio de la magnitud considerada.
2)     Rolling: El proceso de Rolling por su parte, se aplica en los casos en que se opta por mantener varios niveles de granularidad. Para ello se almacena información resumida a distintos niveles, correspondientes a distintas agrupaciones de la unidad de tiempo o diferentes niveles jerárquicos en alguna o varias de las dimensiones de la magnitud almacenada (por ejemplo totales diarios, totales semanales, totales mensuales, etc.).
La fase de carga interactúa directamente con la base de datos de destino. AL realizar esta operación se aplicaran todas las restricciones y triggers (disparos) que se hayan definido en esta. Estas restricciones y trigger si están bien definidos contribuyen a que se garantice la calidad de los datos en el proceso ETL y deben ser tenidos en cuenta.




Data Warehouse DWH


Un almacén de datos es una colección de datos orientados a un determinado ámbito (empresarial, organizacional, etc.), integrado, no volátil y variable en el tiempo, que ayuda a la toma de decisiones en la entidad en la que se utiliza.
Los principales objetivos fundamentales de Data Warehouse son:
·        Hacer que la información de la organización sea accesible: Los contenidos de Data Warehouse son entendibles, navegables y el acceso a ellos son caracterizados por el rápido desempeño. Estos requerimientos no tienen fronteras y tampoco limites fijos. Cuando se habla de entendibles quiere decir que la información sea correcta y coherente. Cuando se habla de navegables significa el reconocer el destino en la pantalla y llegar donde queremos con un solo clic. El rápido desempeño, significa, que los tiempos de espera deben tener una tendencia a cero. Todo lo demás es un compromiso y por consiguiente algo que queremos mejorar.
·        Hacer que la información de la organización de la organización sea consistente: La información de una parte de la organización puede hacerse coincidir con la información de la otra parte de la organización. Si dos medios de la organización tienen el mismo nombre, entonces deben significar la misma cosa. Y a la inversa, si dos medidas no significan la misma cosa, entonces son etiquetados diferentes. Información consistente significa información de alta calidad. Significa que toda la información es contabilizada y completa.
·        Es información adaptable y elástica: El data Warehouse está diseñado para cambios continuos. Cuando se le hacen nuevas preguntas al Data Warehouse, los datos existentes y las tecnologías, no cambian ni se corrompen. El diseño de Data Marts separados que hacen al Data Warehouse, deben ser distribuidos e incrementados.
·        Es un seguro baluarte que protege los valores de la información: El Data Warehouse no solamente controla el acceso efectivo a los datos, si no que da a los dueños de la información gran visibilidad en el uso y abuso de los datos, aun después de haber dejado el Data Warehouse.
·        Es la función de la toma de decisiones: el Data Warehouse tiene los datos correctos para soportar la toma de decisiones. Solo hay una salida verdadera del Data Warehouse: las decisiones que son hechas después de que el Data Warehouse haya presentado las evidencias. La etiqueta original que preside en el Data Warehouse sigue siendo la mejor descripción de lo que queremos construir, un sistema de soporte a las decisiones.

Los principales elementos de un Data Warehouse son:
·        Sistemas fuentes: sistemas operacionales de registros donde sus funciones son capturar las transacciones del negocio. A los sistemas fuentes también se les conoce como Legacy System.
·        Área de tráfico de Datos: es un área de almacenamiento y grupo de procesos, que limpian transforman, combinan, remueven los datos duplicados, guardan, archivan y presentas los datos fuentes para ser usados en la Data Warehouse.
·        Servidor de presentación: la maquina física objetiva en donde los datos del Data Warehouse son organizados y almacenados para ser usados por los usuarios finales, reportes y otras aplicaciones.
·        OLAP: Actividad general de búsqueda para presentación de texto y número de Data Warehouse, también un estilo dimensional especifico de búsqueda y presentación de información  y que es ejemplificada por vendedores de OLAP.
·        ROLAP: un grupo de interfaces de usuarios y aplicaciones que le dan a la base de datos relacional un estilo dimensional.
·        MOLAP: un grupo de interfaces de usuario, aplicaciones y propietarios de tecnologías de bases de datos que tienen un fuerte estilo dimensional.
·        Aplicaciones para usuarios finales: una colección de herramientas que haces las Querys, analizan y representan la información objetivo para el soporte de decisiones del negocio.
·        Herramientas de acceso a datos por usuarios finales: Un cliente de Data Warehouse.
·        Ad Hoc Query Tool: un tipo especifico de herramientas de acceso a datos por usuarios finales que invita al usuario a formar sus propias query, manipulando directamente las tablas relacionales y sus uniones.
·        Moldeamiento de aplicaciones: Un sofisticado tipo de cliente de Data Warehouse con capacidades analíticas que transforma o dirige las salidas de Data Warehouse.
·        Meta Data: Toda la información en el ámbito de Data Warehouse que son así mismo los datos actuales.

Data Marts


Es una versión especial de un Data Warehouse. Son subconjuntos de datos con el propósito de ayudar a un área especifica dentro del negocio pueda tomar mejores decisiones.
El Data Mart a diferencia del Data Warehouse está diseñado para cubrir necesidades de un grupo de trabajo o de un determinado departamento dentro de la organización, en cambio, el ámbito de un Data Warehouse es el organismo en su conjunto. Se caracteriza por disponer de un estructura optima de los datos para analizar la información al detalle desde rodas las perspectivas que afectan a los procesos de dicho departamento.
Supone una buena opción para pequeñas y medianas empresas que no puedan afrontar el costo de poner en marcha un Data Warehouse. La escalabilidad de los Data Marts hacia el Data Warehouse puede ser una solución si el número de Marts aumenta considerablemente.
Existen dos tipos de Data Marts:
1)     Data Marts Dependientes: Los datos que se utilizan para poblar el Data Marts provienen del Data Warehouse.  Esta estrategia es particularmente apropiada cuando el data Warehouse crece muy rápidamente y los distintos departamentos requieren solo una péquela porción de los daros contenidos en él.
2)     Data Marts Independientes: Los datos que se utilizan para poblar el Data Marts provienen de los sistemas operacionales y/o fuentes existentes.

Existen sin embargo las siguientes problemáticas:

-          El hecho de tener varios Data Marts, sin ningún tipo de integración, que puede hacer que las tareas de administración y mantenimiento se conviertan en un lastre.
-          Se puede dar el caso de que algunas Data Marts necesiten los mismos datos para dar respuesta a determinadas preguntas, por lo que tenemos redundancia de datos, ya que cada Data Marts se alimenta con sus procesos de extracción y trasformación propios.

Tecnologías OLAP (On-Line Analytical Processing)


Es un concepto utilizado en la inteligencia de negocios y su objetivo principal es agilizar las consultas de grandes volúmenes de datos. Para ello utiliza estructuras multidimensionales (o Cubo OLAP) quienes contienen datos resumidos de grandes bases de datos o Sistemas Transaccionales (OLTP). Se usa en informes de negocios de ventas, marketing, informes de dirección, minería de datos y áreas similares.
OLAP no es más que acceder a la información utilizando un lenguaje natural.
Existen varias tecnologías OLAP pero básicamente todas asen las mismas acciones sobre la información estas son:
1)     Segmentar: Es como cuando pides las ventas por productos o por trimestres.
2)     Filtrar: Cuando pides el informe de ventas de una sucursal el 2012.
3)     Profundizar (Drill Down): Cuando pides el desglose del trimestre 2 y te interesa el desglose de abril, mayo y junio.
4)     Sintetizar (Drill Up): Desase el glose anterior y vuelve al desglose por trimestre.
5)     Rotar (Drill Anywhere): Cuando en lugar de pasar de un desglose por trimestre a uno mensual, te interesa un desglose por familia de productos, o por nacionalidad, es decir, por una característica de una jerarquía distinta a la que lo estás viendo actualmente.
Lo relevante del análisis OLAP es que te permite navegar fisilmente por la información, solicitándola con el detalle preciso y con filtros adecuados, que puedes hacerlo de manera dinámica, fácil, ad hoc, sobre la marcha, sin necesitar asistencia, rápido y sin la necesidad de usar un lenguaje de negocios.
Existen 3 herramientas de OLAP estas son:
1)     ROLAP: Implementación OLAP que almacena los datos en un motor relacional. Típicamente, los datos son detallados, evitando las agregaciones y las tablas se encuentran desnormalizadas. Los esquemas más comunes sobre los que se trabaja son estrella o copo de nieve, aunque es posible trabajar sobre cualquier base de datos relacional. La arquitectura está compuesta por un servidor de banco de datos relacional y motor  OLAP se encuentra en un servidor dedicado. La principal ventaja de esta arquitectura es que te permite el análisis de una enorme cantidad de datos.

2)     MOLAP: Esta implementación OLAP almacena los datos en una base de datos multidimensional. Para optimizar los tiempos de respuesta, el resumen de la información es usualmente calculada por adelantado. Estos valores pre calculados o agregaciones son la base de las ganancias de desempeño de este sistema. Algunos sistemas utilizan técnicas de comprensión de datos para disminuir el espacio almacenado en el disco debido los valores recalculados.

3)     HOLAP: Almacena algunos datos en un motor relacional y otros en un base de datos multifuncional.

Minería de Datos.


La minería de datos es tal vez uno de los puntos más importantes de la inteligencia de negocios de después del Data WareHouse y la base de datos. La minería de datos es un proceso por el cual podemos obtener información de una colección de datos. La minería de datos utiliza un conjunto de análisis matemáticos y estadísticos para deducir los patrones y tendencias que existen en los datos. Normalmente no se puede detectar mediante la exploración tradicional de los datos porque son demasiado complejas o simplemente porque hay demasiados datos.
Estos patrones y tendencias se pueden recopilar y definir como un modelo de minería de datos. Los modelos de datos se pueden aplicar en escenarios como los siguientes:
·        Pronostico: Calculo de las ventas y predicción de las cargas de servidor o tiempo de inactividad del servidor.
·        Riesgo y probabilidad: Elección de los mejores clientes para la distribución de correo directo, determinación del punto de equilibrio probable para escenarios de riesgo, y asignación de probabilidades a diagnostico.
Un proceso de minería de datos consta de los siguientes pasos generales:
1)     Selección del conjunto de datos, tanto al que se refiere a las variables objetivas que son aquellas que se quieren predecir, calcular o inferir, como también a las variables independientes que son las que sirven para hacer el cálculo o proceso, como posiblemente al muestreo de los registros disponibles.
2)     Análisis de las propiedades de los datos, en especial los histogramas, diagramas de dispersión, presencia de valores atípicos y ausencia de datos (valores nulos).
3)     Transformación del conjunto de datos de entrada, se realiza de diversas formas en función del análisis previo, con el objetivo de prepararlos para aplicar la técnica minería de datos que mejor se adapte a los datos, a este paso también se le conoce como preprocesamiento de los datos.

4)     Seleccionar y aplicar la técnica de minería de datos, se construye el modelo predictivo, de clasificación o segmentación.
5)     Atracción de conocimiento, mediante una técnica de minería de datos, se obtiene un modelo de conocimiento, que representa patrones de comportamiento observado en los valores de las variables del problema o relaciones de asociación entre dichas variables. También pueden usarse varias técnicas a la vez para genere distintos modelos, aunque generalmente cada técnica obliga a un preprocesamiento diferente de datos.
6)     Interpretación y evaluación de datos, una vez obtenido el modelo, se debe proceder a su validación comprobando que las conclusiones que arroja son validas y suficientemente satisfactorias. En el caso de haber obtenido varios modelos mediante el uso de distintas técnicas, se deben comparar los modelos en busca de aquel que se ajuste mejor al problema. Sin ninguno de los modelos alcanza los resultados esperados, debe alterarse alguno de los pasos anteriores para generar nuevos modelos.
Si el modelo no supera la evaluación y si el experto lo considera oportuno el proceso podría repetirse desde el principio.
Una vez validado el modelo, si los resultados son aceptables, el modelo ya está listo para su explotación.  Los modelos obtenidos por las técnicas de minería de datos se aplican incorporándolos en los sistemas e análisis de la información de las organizaciones, e incluso, en los sistemas transaccionales.
El siguiente diagrama describe las relaciones existentes entre cada paso del proceso.



Un ejemplo habitual de negocios que utilizan  minería de datos son los supermercados y las empresas de retail quienes estudian el comportamiento de sus clientes para ofrecer nuevos productos u ofertas, mediante el análisis de la información historia de los clientes y aplicando técnicas de minería de datos son capaces de descubrir patrones de comportamientos en los clientes, de esta manera a la hora de ofrecer un producto en vez de enviarle sus ofertas a todos sus clientes, solo se enfocan en aquellos que predicen que tendrán una respuesta positiva frente al ofrecimiento.
En los supermercados es muy común encontrar en los sectores de bebestibles cosas como maní, papas fritas, suflés, etc. Esto debido que se han descubierto patrones que indican que los clientes luego de comprar algún bebestible también compra maní o papas fritas, esta información se obtiene de las transacciones realizadas (análisis de boletas y facturas).



Conclusión


En la actualidad las herramientas de Inteligencia de negocios se han convertido en piezas fundamentales para las organizaciones a la hora de tomar decisiones y formular estrategias en el mercado.
Con el paso del tiempo y los avances de  las tecnologías de la información las herramientas de inteligencia de negocios han ido cambiando y mejorando constantemente, sin embargo aun hay procesos que deben seguir mejorando y evolucionando para que puedan entregar mejores informes para la toma de decisiones. Uno de los grandes desafíos de la inteligencia de negocios son sus altos costos y la disminución de tiempos.
Con las capacidades analíticas de la inteligencia de negocios una empresa puede marcar la brecha entre el éxito y el fracaso frente a las tendencias del mercado ya que si bien la información y los datos no son el poder, el conocimiento si lo es, con la inteligencia de negocios se pueden explotar los datos históricos para obtener conocimientos y lograr predecir las nuevas tendencias de los mercados.



[i] Datawarehouse es un repositorio de datos de muy fácil acceso, que es alimentado por numerosas fuentes, transformadas en grupos de información sobre temas específicos de negocios, para permitir nuevas consultas, análisis, reportes y decisiones.



















Referencias

 


Enlace a documento Word: http://es.slideshare.net/CarlosBetoHin/bi-final-23961985
 
Enlace a presentación: http://es.slideshare.net/CarlosBetoHin/1385-final