Introducción
A partir de los
años 90’s la Inteligencia
de negocio o Bussines Intelligence, han ido evolucionando constantemente y en
muchas direcciones, producto del crecimiento exponencial de la información y
las nuevas tecnologías que han permitido que el BI se desarrolle de manera íntegra.
La tecnología de BI
ha encontrado lugar en dos niveles primaros dentro de las organizaciones uno es
entre los altos ejecutivos, para quienes es de vital importancia obtener
información estratégica y también entre los administradores de la línea de
negocios quienes son los responsables del análisis táctico.
Desde los años 90’s
las tecnologías de Bussines Inteligence han evolucionado dramáticamente y
muchas empresas han empezado a invertir en estas nuevas tecnologías pero la
pregunta es ¿Por qué las empresas realizan estas inversiones? ¿Cuál es la importancia
de estas tecnologías? ¿Qué es la inteligencia de negocio (BI)? Estas son
algunas de las respuestas a las que responderá este documento.
Historia del Bussines Inteligence
Es importante saber
que la inteligencia de negocios tiene sus principios en el siglo XIX, uno de
los primeros hitos que dio paso al desarrollo de la Inteligencia de
Negocios fue la aparición del concepto
de bases de datos (CODD) en 1969. Después
de la creación del concepto de las bases de datos en 1970 se crearon las primeras
bases de datos y también aparecieron las primeras aplicaciones empresariales
(SAP, JD Edwards, Sibel, PeopleSoft). Estas aplicaciones permitieron realizar
lo que se conoce como “Data Entry” en los sistemas, aumentando la información
disponible, sin embargo, no fueron capaces de ofrecer acceso fácil y rápido a
la información por lo cual no era lo suficientemente eficiente a la hora de
generar reportes o tomar decisiones. A mediados de 1980 se creó un nuevo
concepto llamado “Datawarehouse”[i]
(Ralph Kimball, Bill Inmon), y aparecieron los primeros sistemas de reporting.
A pesar de todo seguía siendo complicado y funcionalmente pobre. Existían
relativamente potentes sistemas de bases de datos pero no existían aplicaciones
que facilitaran su explotación.
En el año 1989
aparece el primer concepto de Inteligencia de negocio por Howrd Dresner, y en
el año 1990 aparece Bussines Intelligence 1.0. Proliferación de múltiples
aplicaciones de BI. Estos proveedores resultaban caros pero facilitaron el
acceso a la información, y en cierto modo agravaron los problemas que
pretendían resolver.
En el año 2000 apareció
Bussines Intelligence 2.0. Consolidación de las aplicaciones de Bi en unas
pocas plataformas como Oracle, SAP, IBM,, Microsoft. A partir de la información
estructurada se empieza a considerar otro tipo de información y documentación
no estructurada.
En los últimos años
y con los grandes avances en las tecnologías de la información las plataformas
de BI se han convertido en herramientas fundamentales para la gran mayoría de
las empresas a nivel mundial tanto para las pequeñas y medianas empresas como
también para las grandes empresas y compañías como lo podemos observar en la
figura 1.0.
Definición de Bussines Intelligence
Las aplicaciones de
Inteligencia de Negocios o Bussines Intelligence (BI) son herramientas de
soporte de decisiones que permite a las empresas el análisis, la manipulación
de información crítica y el acceso interactivo a la información en tiempo real.
El fin de estas aplicaciones es proporcionar a los usuarios un mayor
entendimiento de la información que les permita identificar las oportunidades y
los problemas de os negocios. Con estas herramientas y con la información que
proveen los usuarios son capaces de acceder y apalancar una vasta cantidad de
información y analizar sus relaciones para entender las tendencias que apoyan
las decisiones de las empresas y negocios. Estas herramientas previenen una
potencial perdida de conocimientos dentro de una empresa que resulta de una
acumulación masiva de la información que no es fácil de leer o de usar.
La Inteligencia de
negocios es una arquitectura y una colección de herramientas que buscan mejorar
a las organizaciones, proporcionando información relevante para las distintas áreas
que componen la empresa, proporcionando vistas y aspectos de negocios para cada
uno de los empleados ya sea a nivel táctico, estratégico u operacional para que
puedan tomar decisiones de la manera más eficiente para potenciar las
capacidades de la empresa con la mayor cantidad de información disponible.
La base y objetivo
de los sistemas de Inteligencia de negocios es la entrega oportuna de
información, además esta información debe ser correcta y relevante para el
sujeto que quiere usarla, es decir no solo la información debe ser correcta si
no también la persona a quien se le entrega.
Un sistema de BI
esta compuesto por una arquitectura y una colección de aplicaciones
operacionales y de soporte de decisiones con bases de datos relacionales que
proporcionan a los usuarios de la organización un fácil y rápido acceso a los
datos de la organización.
Como se ha
mencionado anteriormente las principales características de un sistema de
Inteligencia de negocios son:
1)
Accesibilidad de la información: los datos
son la fuente principal de este concepto. Lo primero que deben garantizar este
tipo de herramientas y técnicas será l acceso de los usuarios a los datos
independencia de la procedencia de estos.
2)
Apoyo en la toma de decisiones: Se busca ir
más allá en la presentación de la información, de manera que los usuarios
tengan acceso a herramientas de análisis que les permitan seleccionar y
manipular solo aquellos datos que les interese.
3)
Orientación al usuario final: Se busca
independencia entre los conocimientos técnicos de los usuarios y sus
capacidades para utilizar estas herramientas.
Niveles de Realización de BI (Herramientas de Explotación)
Según el nivel de
complejidad se pueden clasificar las soluciones de Bussines Intelligence en:
1)
Consultas de Informes Simples (Query
Reports): son herramientas que nos permiten realizar consultas o informes para
obtener información sobre los datos. Entre estos se encuentran el entorno
transaccional a nivel de bases de datos, entorno de Datawarehouse.
2) Cubos OLAP (On-Line Analytic processing): exploración,
tablas dinámicas, etc…
3)
EIS: Solución que permite visualizar de una
forma rápida y fácil el estado de una determinada situación empresarial, presente o pasada, y que permite detector anomalías
u oportunidades.
4)
DSS: Aplicación informática que basándose
en modelos matemáticos y mediante análisis de sensibilidad permite ayudar a la
toma de decisiones.
5)
Data Minding o Minería de datos: Pueden
considerarse sistemas expertos que nos permiten interrogar a los datos para
obtener información.
6)
KMS: Nuevas tecnologías para la gestión del
conocimiento y su integración en una única plataforma.
En definitiva una
solución de BI completa, que utiliza estos elementos mencionados anteriormente
nos permite observar que es lo que está ocurriendo, comprender el por qué
ocurre, predecir porqué ocurre, colaborar, es decir, que debe hacer el equipo y
decir que camino es el que se debe seguir.
Ventajas y desventajas de BI
Las principales
ventajas que proporciona la integración del BI en las empresas y organizaciones
son las siguientes:
1)
Información concisa y relevante en tiempo
real.
2)
Ayuda a la toma de decisiones
3)
Ventajas competitivas frente al mercado.
4)
Generación de Informes tácticos, técnicos y
operacionales.
5)
Facilita las gestiones administrativas de
las empresas.
6)
Muestra el estado real de la empresa en
todo momento.
Retos y Desventajas
de BI
Las principales
desventajas que tiene la inteligencia de negocios son:
1)
Requiere de una gran inversión, dado que la
construcción correcta de estos sistemas no es una tarea sencilla y se consumes
muchos recursos, de los tres niveles principales de las organizaciones, estos recursos son: Económicos, Humanos y
materiales (equipos de última generación).
2)
No solo es capacitar los recursos humanos
para que usen de forma adecuada las herramientas proporcionadas, sino que
también se ven afectados los recursos económicos para obtener infraestructura
acorde con las herramientas esto implica tecnología de última generación y por
ende muy costosa, adema se debe tener claro que los recursos tecnológicos en
ocasiones no permiten un adecuado uso o bien los resultados no son los
esperados ya que habrán de ser sometidos al máximo rendimiento de sus
funciones.
3)
Ya que las tecnologías están inmersas en un
también que está evolucionando y cambiando constantemente en proporciones
aceleradas producto de las nuevas tendencias, nuevos proveedores y su amplio
mercado existe un alto riesgo a la hora de adquirir los recursos tecnológicos
necesarios ya que lo más caro no siempre es lo más conveniente no lo mejor.
4)
La
implementación implica desde la adquisición de herramientas de consultas y
análisis hasta la capacitación de o los usuarios y operarios encargados de la
utilización del sistema, lo cual implica que las empres no quieren correr el
riesgo que los operarios del sistema migren a otras organizaciones con los
conocimientos adquiridos y que el conocimiento gestado pierda calidad y
privacidad.
5)
A la hora de la implementación existe una
fuerte resistencia al cambio por parte de los operarios y usuarios del sistema,
esto debido a las constantes dudas que surgen como por ejemplo ¿Por qué cambiar
si este sistema funciona de forma adecuada y cómoda?
6)
No existe una gestión de cuando debemos
cambiar nuestro sistema de comunicación e información, por lo cual los cambios
aparentemente sencillos y rápidos sueles ser tediosos para clientes y usuarios.
Análisis de Mercado de BI
El exceso de
información no es poder, sin embargo el conocimiento si, con mucha frecuencia
el tratamiento y análisis de la información y los datos generados por las
propias empresas suelen convertirse en verdaderos problemas y por lo tanto la
toma de decisiones se vuelve desesperadamente lento.
Las tecnologías de
BI como lo mencionamos anteriormente sirven para mejorar la toma de decisiones
de forma rápida y eficiente para que finalmente se mejore la consecución de
objetivos de la organización. Los objetivos claves de la Inteligencia de
Negocios son incrementar la eficiencia organizacional y efectiva de las
empresas proporcionando grandes ventajas competitivas frente a al mercado y sus
competidores convirtiéndose en una herramienta fundamental para cualquier
empresa u organización. Algunas de las Tecnologías de Inteligencia de Negocios
apuntan a crear un flujo de datos dentro de la organización más rápido y
accesible. Por otro lado novedosas tecnologías de BI toman un enfoque más
agresivo redefiniendo los procesos existentes con otros nuevos, mucho más
estilizados que eliminan gran cantidad de procesos o crean nuevas capacidades.
En una reciente encuesta
realizada por Gartner, BI fue catalogado en el número dos en la lista de
prioridades tecnológicas de los CIO para el 2005, después de ubicarse en el
lugar número dos en el año 2004.
Debido a este nuevo
énfasis en BI, el mercado de herramientas de Software de BI alrededor del mundo creció en un 7.7% en el
2004, basado en estimaciones preliminares del mercado compuesto.
El crecimiento de
2004 fue conocido por el alto desempeño de vendedores específicos incluyendo
Cognos y Microsoft. El ranking no cambo respecto al año 2003 tal y como se
esperaba. Los tres mayores vendedores de herramientas de BI en el mercado
global, según datos Gartner son los que se exponen en la tabla 1.0
Proveedor
|
Posición en el
Mercado Compartido
|
Bussines
Objects
|
1
|
SAP Institute
|
2
|
Cognos
|
3
|
En los últimos años
el mercado de BI ha tenido un descenso en las ventas a nivel mundial.
El año 2012 el
mercado de BI ascendió a 13.100 millones de dólares los que representan un
crecimiento del 6.8% con respecto a los 12.300 millones de dólares del 2011.
Sin embargo, el ritmo del crecimiento
desacelero considerablemente con respecto al 17% que experimento en el
año 2011.
“Aunque
es una caída impresionante, está en línea con nuestros pronósticos publicados
durante el 2012”,
escribieron los analistas Dan Sommer y Bhavish Sood en el informe. Asimismo,
“las condiciones macroeconómicas globales no pueden ignorarse”, agrega el
estudio. “Éstas generaron un mayor escrutinio de los presupuestos tanto de lo
nuevo como del mantenimiento en todo el espacio de TI, y BI no fue la
excepción”.[ii]
El rendimiento para
el mercado de BI fue especialmente difícil en Europa y América Latina el año
pasado, aunque no en Medio Oriente, África y los mercados emergentes de
Asia-Pacífico, “que aún se encuentran en
fase de subida”, señala el reporte.
Mientras tanto, “la
cada vez mayor confusión alrededor de los términos de moda y sobre dónde se
encuentran los beneficios tangibles, contribuyeron muy probablemente con la
desaceleración de los ciclos de ventas en BI mientras que los administradores
de los presupuestos están intentando identificar las herramientas y el valor
para el negocio”, de acuerdo a Gartner.
Más aún, el gasto
en las plataformas de infraestructura BI más importantes “se mostró plano con
un crecimiento de un solo dígito” el año pasado, mientras que el mayor gasto se
realizó fuera de TI a nivel departamental, ya que las unidades de negocio
buscaban aplicaciones analíticas y herramientas de descubrimiento de datos para
sus necesidades particulares.
En términos de cuota de mercado, SAP se mantuvo en el primer lugar en la encuesta de Gartner con alrededor de 2.900 millones de dólares en ingresos por BI, aunque el crecimiento anual fue de solo 0,6%. Oracle se mantiene segunda con 1.950 millones de dólares, seguida por IBM con 1.620 millones de dólares.
Tipos de productos y ejemplos de BI
Las herramientas de
software de BI son usadas para acceder a los datos de los negocios y
proporcionar reportes, análisis, visualizaciones y alertas a los usuarios. La
gran mayoría de las herramientas de BI son usadas por usuarios finales para
acceder, analizar y reportar contra los datos que más frecuentemente residen en
data warehouse, data marts y almacenes de datos operacionales. Los
desarrolladores de aplicaciones usan plataformas de BI para desarrollar y
desplegar aplicaciones (las cuales no son consideradas herramientas de BI).
Ejemplos de una aplicación de BI son las aplicaciones de consolidación
financiera y presupuestos.
Actualmente el
mercado de herramientas de BI se encuentra constituido de dos subsegmentos:
suites de BI empresarial (EBIS, por sus siglas en inglés) y plataformas de BI.
La mayoría de las herramientas de BI, como las desarrolladas por los vendedores
mencionados en la tabla 1, son BI empresarial y plataformas de BI. Gartner
Dataquest (2005) realizó un pronóstico a cinco años, basado en una estimación
preliminar de tamaño del mercados y una revisión de los inhibidores e
impulsores, llegando a la conclusión de que el total de mercado de herramientas
de BI proyecta un crecimiento de $ 2.5 billones en 2004 a $ 2.9 billones en
2009, con una tasa de crecimiento anual de 7.4%.
Conceptos y soluciones integrales (herramientas) BI
Dentro las los
conceptos y herramientas principales de la inteligencia de negocios tenemos
principalmente:
·
Sistemas Fuentes: Son los sistemas
transaccionales que han sido diseñados fundamentalmente para el soporte de las
operaciones del negocio como: Compras, Ventas, Almacenes, Contabilidad, etc.
Estos sistemas deben cumplir un requisito fundamental: ya deben de estar
consolidados en cuanto al registro de información de las operaciones. No sería
limitante si le carece de reportes para toma de decisiones, ya que es ahí el vació
que cubrirá la
Inteligencia de Negocios adicionando módulos de gestión para
las decisiones operacionales.
·
Bases de Datos Operacionales OLTP: Los
sistemas transaccionales son los encargados de registrar o grabar las
operaciones dentro de las bases de datos operacionales (On Line Transactional
Process: OLTP). Estos datos permiten generar los informes para la toma de
decisiones a nivel operacional. Estas bases de datos fundamentalmente lo que
persiguen son el registro de las transacciones y la consistencia de los datos.
·
Requerimientos Estratégicos (Plan
Estratégico): Es altamente recomendable tener definido el Plan Estratégico de la Organización. En
caso extremo no se obtenga, a partir de las entrevistas se pueden buscar:
objetivos, estrategias, indicadores de estrategias que permitan orientar el
producto a diseñar. Son bastante útiles además del plan y las entrevistas los
reportes de gestión que los tomadores de decisiones poseen para medir su
gestión.
Estos requerimientos estratégicos deberán contrastarse con la Base de Datos Operacional, ya que muchos de ellos se obtendrán de esta fuente. En caso no puedan ser obtenidos se recomienda re-estructurar la Base de datos y las aplicaciones, a fin de satisfacer estos requerimientos estratégicos.
·
ETL (Extraer, Transformar y Cargar-Poblar):
es el componente que permite dos cosas fundamentales:
o Integrar
datos cuando se tengan distintas fuentes (diferentes manejadores de bases de
datos)
o Llevar
información de las bases de datos operacionales a las bases de datos
dimensionales.
·
Data WareHouse (DWH): Es el gran almacén de
datos que está estructurado para analizar la información, a diferente nivel de
detalle, de todos los procesos de negocios que tiene la organización. Es la Base de Datos llamada
estratégica o multidimensional. Una vez diseñadas mediante el ETL es poblada o
llenada a partir de las Bases de Datos operacionales. El diseño va orientado a
encontrar medidas (Por ejemplo: montos vendidos, montos cobrados, horas hombre
utilizadas, etc.) y dimensiones (Clientes, Productos, Tiempo, Organización,
Servicios, etc.).
·
Data Marts: Constituyen una parte de un
DWH. Si un DWH está formado por todos los procesos de la organización, un Data
Mart constituye un determinado proceso. Por ejemplo podríamos tener un Data
Mart para Finanzas, otro para Logística. Pueden ser preparados a partir de un
DWH o ser elaborados independientemente.
·
Tecnologías OLAP (On Line Analytical
process): Es la tecnología que permite aprovechar como está estructurada la
información de un DataMart o un Data WareHouse. Fundamentalmente es una
tecnología que permitirá analizar información dinámicamente a los niveles
táctico y estratégico basados en Cubos que contienen las medidas y las
Dimensiones.
·
Minería de datos: Constituyen algoritmos
avanzados (estadísticas, inteligencia artificial) que intenta descubrir cosas
ocultas en los datos capturados a lo largo de las operaciones del negocio. Es
el llamado el descubrimiento del conocimiento y va direccionado al nivel
estratégico directamente.
·
Aplicaciones para soporte de decisiones:
Van diseñadas para cubrir las decisiones tácticas y estratégicas. En el mercado
existen una serie de herramientas que permiten construir estas aplicaciones,
que se montan sobre una solución OLAP o Bases de Datos transaccionales.
·
Sistemas de Ejecución para Ejecutivos: Son
sistemas diseñados para la alta dirección y que están basados en alertas o
semáforos que indican el estado de un determinado indicador de negocio. Este
indicador se le llama KPI (Key Performance Indicator). Estos estados están
reflejados en símbolos como un semáforo (rojo, verde, ámbar) entre otros.
Generalmente son obtenidos a partir de un Balance ScoredCard).
Bases de Datos Operacionales OLTP
Las bases de datos
operacionales son bases de datos orientadas al procesamiento de transacciones.
Una transacción genera un proceso atómico (Debe ser validado con un commit, o
invalidado con un rollback), puede incorporar operaciones de inserción,
modificación y borrado de datos. El proceso transaccional es típico de las
bases de datos operacionales.
Una base de datos
operacional debe contener:
1)
El acceso a los datos, esta optimizado para
tareas frecuentes de lectura y escritura. Por ejemplo la enorme cantidad de
transacciones que deben soportar las bases de datos de bancos o hipotecados
diariamente.
2)
Los datos se estructuran según el nivel
aplicativo como los programas de gestión, ERP o CRM implantados, sistemas de
información departamental, Etc.
3)
Los formatos de los datos no son
necesariamente uniformes en los diferentes departamentos (es común la falta de
compatibilidad y la existencia de islas de datos).
4)
El historial de datos suele limitarse a los
datos actuales o recientes.
ETL Extraer, Transformar y Cargar-Poblar
Es el proceso que le
permite a las organizaciones mover datos desde múltiples fuentes,
reformatearlos, limpiarlos y cargarlos en otras bases de datos.
La primera parte
del ETL es la extracción de datos de los sistemas de origen, comúnmente los
datos vienen de ficheros de textos u archivos de diferentes formatos, también
pueden proceder de bases de datos con distintas estructuras y organizaciones.
La mayoría de los proyectos de almacenamiento de datos fusiona datos
provenientes de diferentes sistemas de origen.
Una parte
intrínseca del proceso de extracción es el análisis de los datos extraídos, de
lo que resulta un chequeo que verifica si los datos cumplen la pauta o
estructura que se espera. De no ser así los datos se rechazan.
El proceso de
transformación es el encargado de definir los parámetros y reglas requeridos por el negocio para que los datos
puedan ser cargados
El proceso de carga
de información es el proceso por el cual los datos obtenidos en el proceso de
transformación son cargados en los sistemas de destino. Dependiendo de los
requerimientos de la organización, este proceso puede abarcar amplia variedad
de acciones diferentes. En algunas bases de datos se sobrescribe información
antigua con nuevos datos. Los Data Warehouse mantienen un registro de manera de
que se pueda hacer una auditoria de los mismos y disponer de un rastro de toda
la historia de un valor a lo largo del tiempo.
Existen dos formas
básicas de desarrollar el proceso de carga estas son:
1)
Acumulación Simple: la acumulación simple
es la mas sencilla y común. Consiste en realizar un resumen de todas las
transacciones comprendidas en el periodo de tiempo seleccionado y transportar
el resultado como una única transacción hacia el Data Warehouse, almacenando un
valor calculado que consiste típicamente en una sumatoria o un promedio de la
magnitud considerada.
2)
Rolling: El proceso de Rolling por su
parte, se aplica en los casos en que se opta por mantener varios niveles de
granularidad. Para ello se almacena información resumida a distintos niveles,
correspondientes a distintas agrupaciones de la unidad de tiempo o diferentes
niveles jerárquicos en alguna o varias de las dimensiones de la magnitud
almacenada (por ejemplo totales diarios, totales semanales, totales mensuales,
etc.).
La fase de carga
interactúa directamente con la base de datos de destino. AL realizar esta
operación se aplicaran todas las restricciones y triggers (disparos) que se
hayan definido en esta. Estas restricciones y trigger si están bien definidos
contribuyen a que se garantice la calidad de los datos en el proceso ETL y
deben ser tenidos en cuenta.
Data Warehouse DWH
Un almacén de datos
es una colección de datos orientados a un determinado ámbito (empresarial,
organizacional, etc.), integrado, no volátil y variable en el tiempo, que ayuda
a la toma de decisiones en la entidad en la que se utiliza.
Los principales
objetivos fundamentales de Data Warehouse son:
·
Hacer que la información de la organización
sea accesible: Los contenidos de Data Warehouse son entendibles, navegables y
el acceso a ellos son caracterizados por el rápido desempeño. Estos
requerimientos no tienen fronteras y tampoco limites fijos. Cuando se habla de
entendibles quiere decir que la información sea correcta y coherente. Cuando se
habla de navegables significa el reconocer el destino en la pantalla y llegar
donde queremos con un solo clic. El rápido desempeño, significa, que los
tiempos de espera deben tener una tendencia a cero. Todo lo demás es un
compromiso y por consiguiente algo que queremos mejorar.
·
Hacer que la información de la organización
de la organización sea consistente: La información de una parte de la organización
puede hacerse coincidir con la información de la otra parte de la organización.
Si dos medios de la organización tienen el mismo nombre, entonces deben
significar la misma cosa. Y a la inversa, si dos medidas no significan la misma
cosa, entonces son etiquetados diferentes. Información consistente significa
información de alta calidad. Significa que toda la información es contabilizada
y completa.
·
Es información adaptable y elástica: El
data Warehouse está diseñado para cambios continuos. Cuando se le hacen nuevas
preguntas al Data Warehouse, los datos existentes y las tecnologías, no cambian
ni se corrompen. El diseño de Data Marts separados que hacen al Data Warehouse,
deben ser distribuidos e incrementados.
·
Es un seguro baluarte que protege los
valores de la información: El Data Warehouse no solamente controla el acceso
efectivo a los datos, si no que da a los dueños de la información gran
visibilidad en el uso y abuso de los datos, aun después de haber dejado el Data
Warehouse.
·
Es la función de la toma de decisiones: el
Data Warehouse tiene los datos correctos para soportar la toma de decisiones.
Solo hay una salida verdadera del Data Warehouse: las decisiones que son hechas
después de que el Data Warehouse haya presentado las evidencias. La etiqueta
original que preside en el Data Warehouse sigue siendo la mejor descripción de
lo que queremos construir, un sistema de soporte a las decisiones.
Los principales elementos
de un Data Warehouse son:
·
Sistemas fuentes: sistemas operacionales de
registros donde sus funciones son capturar las transacciones del negocio. A los
sistemas fuentes también se les conoce como Legacy System.
·
Área de tráfico de Datos: es un área de
almacenamiento y grupo de procesos, que limpian transforman, combinan, remueven
los datos duplicados, guardan, archivan y presentas los datos fuentes para ser
usados en la Data
Warehouse.
·
Servidor de presentación: la maquina física
objetiva en donde los datos del Data Warehouse son organizados y almacenados
para ser usados por los usuarios finales, reportes y otras aplicaciones.
·
OLAP: Actividad general de búsqueda para
presentación de texto y número de Data Warehouse, también un estilo dimensional
especifico de búsqueda y presentación de información y que es ejemplificada por vendedores de
OLAP.
·
ROLAP: un grupo de interfaces de usuarios y
aplicaciones que le dan a la base de datos relacional un estilo dimensional.
·
MOLAP: un grupo de interfaces de usuario,
aplicaciones y propietarios de tecnologías de bases de datos que tienen un
fuerte estilo dimensional.
·
Aplicaciones para usuarios finales: una
colección de herramientas que haces las Querys, analizan y representan la
información objetivo para el soporte de decisiones del negocio.
·
Herramientas de acceso a datos por usuarios
finales: Un cliente de Data Warehouse.
·
Ad Hoc Query Tool: un tipo especifico de
herramientas de acceso a datos por usuarios finales que invita al usuario a
formar sus propias query, manipulando directamente las tablas relacionales y
sus uniones.
·
Moldeamiento de aplicaciones: Un
sofisticado tipo de cliente de Data Warehouse con capacidades analíticas que
transforma o dirige las salidas de Data Warehouse.
·
Meta Data: Toda la información en el ámbito
de Data Warehouse que son así mismo los datos actuales.
Data Marts
Es una versión
especial de un Data Warehouse. Son subconjuntos de datos con el propósito de
ayudar a un área especifica dentro del negocio pueda tomar mejores decisiones.
El Data Mart a
diferencia del Data Warehouse está diseñado para cubrir necesidades de un grupo
de trabajo o de un determinado departamento dentro de la organización, en
cambio, el ámbito de un Data Warehouse es el organismo en su conjunto. Se
caracteriza por disponer de un estructura optima de los datos para analizar la
información al detalle desde rodas las perspectivas que afectan a los procesos
de dicho departamento.
Supone una buena
opción para pequeñas y medianas empresas que no puedan afrontar el costo de
poner en marcha un Data Warehouse. La escalabilidad de los Data Marts hacia el
Data Warehouse puede ser una solución si el número de Marts aumenta
considerablemente.
Existen dos tipos
de Data Marts:
1)
Data Marts Dependientes: Los datos que se
utilizan para poblar el Data Marts provienen del Data Warehouse. Esta estrategia es particularmente apropiada
cuando el data Warehouse crece muy rápidamente y los distintos departamentos
requieren solo una péquela porción de los daros contenidos en él.
2)
Data Marts Independientes: Los datos que se
utilizan para poblar el Data Marts provienen de los sistemas operacionales y/o
fuentes existentes.
Existen sin embargo
las siguientes problemáticas:
-
El hecho de tener varios Data Marts, sin
ningún tipo de integración, que puede hacer que las tareas de administración y
mantenimiento se conviertan en un lastre.
-
Se puede dar el caso de que algunas Data Marts
necesiten los mismos datos para dar respuesta a determinadas preguntas, por lo
que tenemos redundancia de datos, ya que cada Data Marts se alimenta con sus
procesos de extracción y trasformación propios.
Tecnologías OLAP (On-Line Analytical Processing)
Es un concepto
utilizado en la inteligencia de negocios y su objetivo principal es agilizar
las consultas de grandes volúmenes de datos. Para ello utiliza estructuras
multidimensionales (o Cubo OLAP) quienes contienen datos resumidos de grandes
bases de datos o Sistemas Transaccionales (OLTP). Se usa en informes de
negocios de ventas, marketing, informes de dirección, minería de datos y áreas
similares.
OLAP no es más que
acceder a la información utilizando un lenguaje natural.
Existen varias
tecnologías OLAP pero básicamente todas asen las mismas acciones sobre la
información estas son:
1)
Segmentar: Es como cuando pides las ventas
por productos o por trimestres.
2)
Filtrar: Cuando pides el informe de ventas
de una sucursal el 2012.
3)
Profundizar (Drill Down): Cuando pides el
desglose del trimestre 2 y te interesa el desglose de abril, mayo y junio.
4)
Sintetizar (Drill Up): Desase el glose
anterior y vuelve al desglose por trimestre.
5)
Rotar (Drill Anywhere): Cuando en lugar de
pasar de un desglose por trimestre a uno mensual, te interesa un desglose por
familia de productos, o por nacionalidad, es decir, por una característica de
una jerarquía distinta a la que lo estás viendo actualmente.
Lo relevante del
análisis OLAP es que te permite navegar fisilmente por la información, solicitándola
con el detalle preciso y con filtros adecuados, que puedes hacerlo de manera
dinámica, fácil, ad hoc, sobre la marcha, sin necesitar asistencia, rápido y
sin la necesidad de usar un lenguaje de negocios.
Existen 3 herramientas
de OLAP estas son:
1)
ROLAP: Implementación OLAP que almacena los
datos en un motor relacional. Típicamente, los datos son detallados, evitando
las agregaciones y las tablas se encuentran desnormalizadas. Los esquemas más comunes
sobre los que se trabaja son estrella o copo de nieve, aunque es posible
trabajar sobre cualquier base de datos relacional. La arquitectura está
compuesta por un servidor de banco de datos relacional y motor OLAP se encuentra en un servidor dedicado. La
principal ventaja de esta arquitectura es que te permite el análisis de una
enorme cantidad de datos.
2)
MOLAP: Esta implementación OLAP almacena
los datos en una base de datos multidimensional. Para optimizar los tiempos de
respuesta, el resumen de la información es usualmente calculada por adelantado.
Estos valores pre calculados o agregaciones son la base de las ganancias de
desempeño de este sistema. Algunos sistemas utilizan técnicas de comprensión de
datos para disminuir el espacio almacenado en el disco debido los valores recalculados.
3) HOLAP:
Almacena algunos datos en un motor relacional y otros en un base de datos
multifuncional.
Minería de Datos.
La minería de datos
es tal vez uno de los puntos más importantes de la inteligencia de negocios de
después del Data WareHouse y la base de datos. La minería de datos es un
proceso por el cual podemos obtener información de una colección de datos. La
minería de datos utiliza un conjunto de análisis matemáticos y estadísticos
para deducir los patrones y tendencias que existen en los datos. Normalmente no
se puede detectar mediante la exploración tradicional de los datos porque son
demasiado complejas o simplemente porque hay demasiados datos.
Estos patrones y
tendencias se pueden recopilar y definir como un modelo de minería de datos.
Los modelos de datos se pueden aplicar en escenarios como los siguientes:
·
Pronostico: Calculo de las ventas y
predicción de las cargas de servidor o tiempo de inactividad del servidor.
·
Riesgo y probabilidad: Elección de los mejores
clientes para la distribución de correo directo, determinación del punto de
equilibrio probable para escenarios de riesgo, y asignación de probabilidades a
diagnostico.
Un proceso de
minería de datos consta de los siguientes pasos generales:
1)
Selección del conjunto de datos, tanto al
que se refiere a las variables objetivas que son aquellas que se quieren
predecir, calcular o inferir, como también a las variables independientes que
son las que sirven para hacer el cálculo o proceso, como posiblemente al
muestreo de los registros disponibles.
2)
Análisis de las propiedades de los datos,
en especial los histogramas, diagramas de dispersión, presencia de valores
atípicos y ausencia de datos (valores nulos).
3)
Transformación del conjunto de datos de
entrada, se realiza de diversas formas en función del análisis previo, con el
objetivo de prepararlos para aplicar la técnica minería de datos que mejor se
adapte a los datos, a este paso también se le conoce como preprocesamiento de
los datos.
4)
Seleccionar y aplicar la técnica de minería
de datos, se construye el modelo predictivo, de clasificación o segmentación.
5)
Atracción de conocimiento, mediante una
técnica de minería de datos, se obtiene un modelo de conocimiento, que
representa patrones de comportamiento observado en los valores de las variables
del problema o relaciones de asociación entre dichas variables. También pueden
usarse varias técnicas a la vez para genere distintos modelos, aunque
generalmente cada técnica obliga a un preprocesamiento diferente de datos.
6)
Interpretación y evaluación de datos, una
vez obtenido el modelo, se debe proceder a su validación comprobando que las
conclusiones que arroja son validas y suficientemente satisfactorias. En el
caso de haber obtenido varios modelos mediante el uso de distintas técnicas, se
deben comparar los modelos en busca de aquel que se ajuste mejor al problema.
Sin ninguno de los modelos alcanza los resultados esperados, debe alterarse
alguno de los pasos anteriores para generar nuevos modelos.
Si el modelo no supera
la evaluación y si el experto lo considera oportuno el proceso podría repetirse
desde el principio.
Una vez validado el
modelo, si los resultados son aceptables, el modelo ya está listo para su
explotación. Los modelos obtenidos por
las técnicas de minería de datos se aplican incorporándolos en los sistemas e
análisis de la información de las organizaciones, e incluso, en los sistemas
transaccionales.
El siguiente
diagrama describe las relaciones existentes entre cada paso del proceso.
Un ejemplo habitual
de negocios que utilizan minería de
datos son los supermercados y las empresas de retail quienes estudian el
comportamiento de sus clientes para ofrecer nuevos productos u ofertas,
mediante el análisis de la información historia de los clientes y aplicando
técnicas de minería de datos son capaces de descubrir patrones de
comportamientos en los clientes, de esta manera a la hora de ofrecer un
producto en vez de enviarle sus ofertas a todos sus clientes, solo se enfocan
en aquellos que predicen que tendrán una respuesta positiva frente al ofrecimiento.
En los
supermercados es muy común encontrar en los sectores de bebestibles cosas como
maní, papas fritas, suflés, etc. Esto debido que se han descubierto patrones
que indican que los clientes luego de comprar algún bebestible también compra
maní o papas fritas, esta información se obtiene de las transacciones
realizadas (análisis de boletas y facturas).
Conclusión
En la actualidad las herramientas de Inteligencia de
negocios se han convertido en piezas fundamentales para las organizaciones a la
hora de tomar decisiones y formular estrategias en el mercado.
Con el paso del tiempo y los avances de las tecnologías de la información las
herramientas de inteligencia de negocios han ido cambiando y mejorando
constantemente, sin embargo aun hay procesos que deben seguir mejorando y
evolucionando para que puedan entregar mejores informes para la toma de
decisiones. Uno de los grandes desafíos de la inteligencia de negocios son sus
altos costos y la disminución de tiempos.
Con las capacidades analíticas de la inteligencia de
negocios una empresa puede marcar la brecha entre el éxito y el fracaso frente
a las tendencias del mercado ya que si bien la información y los datos no son
el poder, el conocimiento si lo es, con la inteligencia de negocios se pueden
explotar los datos históricos para obtener conocimientos y lograr predecir las
nuevas tendencias de los mercados.
[i] Datawarehouse es un repositorio de datos de
muy fácil acceso, que es alimentado por numerosas fuentes, transformadas en
grupos de información sobre temas específicos de negocios, para permitir nuevas
consultas, análisis, reportes y decisiones.
[ii] http://www.computerworld.es/business-intelligence/el-crecimiento-del-mercado-de-business-intelligence-se-freno-en-2012
Referencias
- “Introducción al Business Intelligence “, AUTOR:Jordi Conesa Caralt (coord.), Josep Curto Díaz , número de páginas:238.
- “History of Business Intelligence” , Microsoft Business Intelligence, http://www.youtube.com/watch?v=_1y5jBESLPE
- http://es.scribd.com/doc/963002/Inteligencia-de-negocios
- http://www.sinnexus.com/business_intelligence/
- http://www.buenastareas.com/ensayos/Concepto-De-Dato-e-Informaci%C3%B3n/961662.html
- http://www.baquia.com/posts/2011-11-07-la-inteligencia-de-negocios-y-la-direccion-general
- http://www.google.cl/url?sa=t&rct=j&q=&esrc=s&source=web&cd=8&ved=0CGcQFjAH&url=http%3A%2F%2Fcibertec.googlecode.com%2Ffiles%2FInteligencia%2520de%2520Negocios%2520Teor%25C3%25ADa.pdf&ei=cabRUeOGNOb7igLmw4C4Dg&usg=AFQjCNH5keZ5V3dhOjJhXcupcpuM2Ir9Dg&sig2=3FH0u0amPR3J5uFRxLG51Q&bvm=bv.48572450,d.cGE&cad=rja
- http://www.slideshare.net/hugoces/inteligencia-de-negocios-business-intelligence
- http://www.sonda.com/business-intelligence/#
- http://www.computerworld.es/business-intelligence/el-crecimiento-del-mercado-de-business-intelligence-se-freno-en-2012
- “Almacén de datos” : https://es.wikipedia.org/wiki/Almac%C3%A9n_de_datos
Enlace a documento Word: http://es.slideshare.net/CarlosBetoHin/bi-final-23961985
Enlace a presentación: http://es.slideshare.net/CarlosBetoHin/1385-final