miércoles, 7 de enero de 2015

Tema 6: BUSINESS INTELLIGENCE

Es hora de echar el telón para este blog con una última entrada sobre la que hablaremos sobre el Business Intelligence, la gestión empresarial y de las técnicas y tecnología que emplean. Empecemos:

Puede que en algún momento de tu vida estés decidido a montar tu propia empresa, y requieras almacenar una gran cantidad de datos, gestionarlos correctamente y analizarlos para poder hacer predicciones sobre el futuro de la empresa, para este tipo de acciones las empresas utilizan el denominado Business Intelligence (BI), también llamado Inteligencia Empresarial o Inteligencia Institucional. 

La información en una empresa:
Una de las claves para el exito de una empresa es la información que ha almacenado durante su vida, aunque a veces es desaprovechada. En qué época del año obtienes más ganancias, y cuando menos, conocer qué trabajadores son los más productivos o qué clientes son los más importantes; son datos que pueden significar el exito de una empresa.
 Por ejemplo, aumentar el stock en la época de mayor demanda, o encontrar el factor por el cual en cierta época del año ganas menos, saber recompensar a los buenos trabajadores y "mimar a los mejores clientes" son solo unos ejemplos de las acciones que puedes tomar si conoces los datos de tu propia empresa. 
Esto te permitirá esta un paso por delante de la competencia, ya que con el conocimiento obtenido puedes mejorar los posibles fallos y tener un mejor control financiero, conviertiendo a tu empresa en una potente competencia a tener en cuenta.

Por un módico precio cualquier empresa, aunque forme parte de las PYME puede conocer este tipo de información mediante un programa informático. Oracle es una de las empresas que ofrecen este tipo de software empresarial.

Actuales Sistemas Informáticos:
Han existido varios sistemas anteriormente, pero sólo unos pocos se utilizan actualmente:
  • Sistema de soporte a decisiones(DSS): Es una herramienta informática que ayuda en la toma de decisiones; se alimenta de la información que obtiene de los ERP, Que son los sistemas esenciales para el negocio ( Como el sistema de nóminas, de contabilidad, recursos humanos, ventas, marqueting...) es decir, la base de datos.[Info. extra]
  • Sistema Experto de soporte a decisiones(EDSS): Esta herramienta es muy parecida a los DSS vistos antes, con la diferencia de que estos son más inteligentes; cuentan con una inteligencia artificial potente que les permite hacer sugerencias sobre las posibles opciones a seguir, aunque la decisión final recae en manos de las personas encargadas (Presidente, vicepresidente, asamblea...)
  • Sistema de información para ejecutivos(EIS): este tipo de DSS accede a información que no tiene por que encontrarse en la base de datos de la empres, sino que puede ser tanto del interior como del exterior. es decir, es una herramienta muy globalizada y útil. Además la información qu emuestra suele estar muy simplificada, con pocos ratios o variables. Es la herramienta mas usada.[Info. extra]

Gestión del sistema:
Un sistema Business Intelligence se nutre de la información almacenada en diferentes bases de datos, los tipos de bases de datos comunes son:
  • DataMart: Cada uno de los DataMart se encarga de almacenar información sobre una parte del negocio, le que significa que la información se divide en departamentos y cada departamento tiene su propia base de datos a la que llamamos DataMart. Todos los datos de cada DataMart están optimizados y se pueden obtenner desde un mismo sistema gestor llamado DataWareHouse del que hablaremos a continuación. Normalmente el sistema gestor usa una estructura por cubos OLAP (Online-Analytical Procesing).
    • Cubos OLAP: La estructura interna de cada cubo se organiza en función de los requisitos de cada departamento. Estan basados en un sistema "¿Qué pasaría si?" ;es decir, se basa en diminutos cambios en la información y el resultado que se obtendría de ellos.[Info. Extra]
  • DataWareHouse: Son conocidos como "almacenes de datos". Son enormes bases de datos que tratan las taresa de busqueda, inserción y eliminacion de la forma más eficiente posible. Al contrario que los DataMart, los DataWare House no tienen un tema concreto.

Ventajas:
Las ventajas que este tipo de sistemas puede ofrecer son inmensas, y como ya hemos dicho al principio de la entrda, pueden significar el exito de una empresa:
  • Encontrar fallos en la empresa actuar en consecuencia para solventarlos.
  • Comprender por qué se produjero esos fallos para evitar repetirlos.
  • Predecir el futuro de la empresa.
  • Aumentar la colaboración de la empresa al estar la información bien estructurada y de forma accesible a todos los miembros que la necesiten.

Reflexión:
La Business Intelligence está ampliamente implantada en un alto porcentaje de las empresas del mundo, lo que quiere decir que está en auge. La pregunta que me hago es, ¿Hacia dónde evolucionará ahora?¿Es posible superar las ventajas que ya nos da? A mi personalmente no se me ocurre  ninguna mejora, salvo hacer una interfaz más intuitiva o mejorar la IA de los EDSS, pero no se escandalicen si en un futuro no muy lejano alguna mente maravillosa consigue idear un sistema que deje obsoletos a los sistemas actuales, pues como ya sabeis, en la tecnología y en la informática avanza día a día sin poder frenar.



Agradecimientos:
Gracias a todos los lectores que han leido el blog y a sus criticas, tanto positivas como negativas, (Aunque ninguna en la caja de comentarios), ya que aunque es una asignatura en la cual nos dan los temas, el recolectar toda la información, entenderla e intentar plasmarla de forma simple, no es precisamente un camino de rosas.
Hacer el blog me parece una forma eficaz y amena de dar la asignatura, Ya que existe una parte de teoría de clase, una parte de busqueda e indagación personal y una última de exponer los conocimientos de una forma entendible para mas o menos cualquier persona, lo cual nos crea la necesidad de entender más que de meramente memorizar.


MUCHAS GRACIAS A TODOS.



viernes, 28 de noviembre de 2014

Tema 5: Recuperación de la información

Bienvenidos de nuevo a nuestro blog sobre la búsqueda y gestión de datos. En el tema de hoy vamos a hablar sobre la recuperación de la información, tema que está íntimamente relacionado con la entrada anterior Tema 4: Los buscadores. 3, 2, 1... y comenzamos.

El concepto de recuperación de la información es bastante complejo, se trata de un área científica encargada del almacenamiento y la representación de la información. Las formas de almacenar la información la vimos en el Tema 3: Almacenamiento de la información. Para poder representar esta información almacenada primero necesitamos recuperarla. Esta recuperación se hace mediante documentos cuyo contenido responde a la búsqueda. Por lo tanto, la búsqueda de información se complementa con la de recuperación. La información que necesitamos recuperar tras hacer una búsqueda se obtiene mediante las siguientes técnicas:
De almacenamiento: Se accede a la información almacenada en una base de de datos usando el lenguaje de consultas para extraer y recuperar la información.
Sistemas dedicados a la recuperación de la información: Procesan lenguaje natural y arrojan los resultados.

Características de las sistemas de recuperación de información.
 Antes de empezar a hablar de cómo se realiza la recuperación es necesario profundizar un poco en los sistemas de recuperación de la información y ver sus características fundamentales.
  • Pertinencia: Esta cualidad permite a los docuentos recuperados adaptarse adecuadamente a las necesidades del usuario.
  • Exhaustividad: La capacidad del sistema para recuperar toda la información relevante sobre una búsqueda. 
  • Consistencia: Capacidad para coordinar el sistema de clasificación con el lenguaje de búsqueda.
  • Tasa de acierto: Coeficiente de el numero de documentos relevantes recuperados entre el número total de docuentos relevantes de la colección.
Aquí dejo un enlace con estas y más cualidades.

Técnicas de recuperación: 
Los sitemas de recuperación están basados en estas complejas técnicas, dependiendo del sistema se empleará una técnica u otra. No olvidéis que estos sistemas no son exclusivamente de los motores de búsqueda. Algunas de las técnicas son:
  • Ad-hoc: Es la más empleada por los motores de búsqueda, estos tienen un conjunto de documentos en la web de carácter estático, sobre los que se hacen las consultas. Las consultas usuario, por el contrario, tienen un carácter dinámico.
  • Categorización de documentos: Esta técnica también está ampliamente extendida, consiste en agrupar los documentos en otros documentos según ciertos valores, como por ejemplo su uso. A la hora de categorizar un documento distinguiremos dos tipos: Filtrado y enrutamiento. Esta categorización es muy limitada debido a que asume la preexistencia de las clases de documentos. Para este caso se usan las siguientes:
    • Segmentación: Dividir el documento en partes sucesivas de diferentes temas.
    • Clustering de documentos: Agrupa documentos en clases de diferentes temas.  

Modelos de recuperación:
Los modelos de recuperación son las formas de representar los documentos (información). Estos modelos se definen cuando se diseña el sistema de recuperación. Nosotros vamos a hablar sobre los modelos de primera generación (matemáticos), pero hay que señalar que existen otros, denominados "de segunda generación" que dependen del propio modelo.
  • Modelo booleano: Se basa en el uso de expresiones booleanas y los operadores AND/OR/NOT, la consulta sólo devolverá los resultados que la satisfagan. Es uno de los modelos más sencillos y utilizados, aunque debido a la facilidad con la que los cambios alteran las consultas no es el más recomendado.
  • Modelo basado en la teoría de conjuntos: Determina utilizando la teoría matemática de los conjuntos si una frase pertenece a un conjunto o no.
  • Modelos probabilísticos: usan la estadística y la probabilidad para estimar si un documento es o no relevante para una cierta búsqueda a partir de unos determinados parámetros.
  • Modelos algebraicos: La información se representa mediante vectores y matrices, aparte de otras propiedades matemáticas comunes en la computación.
  • Modeo vectorial: Está basado en espacios vectoriales, los cuales utiliza para localizar los docuentos más relevantes. Un documento será relevante si dos vectores se encuentran próximos espacialmente. En el modelo vectorial comparamos las consultas con los documentos dentro del sistema de recuperación.

jueves, 6 de noviembre de 2014

Tema 4: Los buscadores.

Nos encontramos un día mas en nuestro blog de Busqueda y gestión de la información y los recursos multimedia. En esta entrada vamos a hablar sobre algo que usamos todos los días, los buscadores.
¿Cómo podemos saber que buscador es mejor?¿Cómo buscan la información y la gestionan?
Vamos a intentar aclarar estas y muchas más preguntas en esta entrada, no te la pierdas:

Existe un gran número de buscadores, más de los que te piensas, además de diferentes tipos, por eso es imposible hablar de cada uno de ellos. La importancia de algunos de estos a sido prácticamente inexistente teniendo una aparición fugaz, sin embargo, otros han ido escalando puestos hasta llegar a la cima de los buscadores de Internet, vamos a hablar un poco de estos últimos:

Buscadores más Populares:
(Hay un link en cada imagen para que pruebes el buscador.)

https://www.google.es/
El famoso Google. ¿Quién no ha oido hablar de este gigante? Google es el buscador más usado en el mundo con un aplastante 71'6%. Con este porcentaje no cabe duda de su alta eficacia. Google se ha hecho popular con técnicas como absorver a otras plataformas de gran popularidad como Youtube, además de usar un sistema de mensajería propio, Gmail.
Google, al igual que muchos otros buscadores internacionales, emplea buscadores jerárquicos (Arañas o Spiders) Lo que hacen es recorrer las páginas recopilando información sobre su contenido y lo almacena en su base de datos. Cuando hacemos una busqueda, estos buscan en su base de datos las paginas que contengan las palabras que has buscado y las mustran por orden de relevancia.
Si una página no es relevante y queiere aparecer en los primeros puestos de la búsqueda deberá pagar.
Ahora además gracias a Google Maps tambien se puede tener en cuenta nuestra localización geográfica a la hora de enseñar la información, por ejemplo a la hora de buscar un restaurante, google mostrará los que estén cerca de tu ubicación.

Las principales ventajas que tiene Google es un diseño muy intuitivo además de sencillo, por lo que tiene poco peso a la hora de cargar la página (salvo con los famosos Doodles).
Tambien es capaz de ofrecer acceso a la gran mayoria de la Web, otros sólo tienen acceso a una pequeña parte. Pero la mayor ventaja que tiene Google es su popularidad.
Como contras, Google tiene una privacidad no demasiado bien protegida, servidores vulnerables y el uso de PageRank hace que tengas que ir al indice 5.000 de la busqueda si la página que buscas es de poca popularidad.





http://www.baidu.com.br/
Un buscador que cada vez toma más importancia desde su nacimiento en el año 1999 es Baidu (significa "100 veces" en chino), con un 16'35% este buscador es muy similar a Google, con 57 servicios de busqueda, servicio de correo... Es el buscador mas popular en toda Asia, en sus inicios NO aceptaba carácteres occidentales.
Baidu se podría definir rápidamente como una copia de Google para chinos, tambien a copiado a Wikipedia (Baidu Baike) y Blogger (Baidu Space), paginas censuradas en china.
Lo que resalta más de este buscador es que permite hacer busquedas de archivos de audio (MP3, WMA, SWF...). por lo que es ampliamente usado en China para la busqueda y descarga de musica, lo cual llevo en 2007 a la empresa a los tribunales contra las grandes discográficas EMI, Warner Music, Universal Music y Sony BMG. Baidu ganó el juicio ya que en China no está prohibida la descarga de estos archivos.
Baidu también tiene un buscador de noticias, pero además tiene permiso de Pekin para generar sus propias noticias, con un departamento especifico.



http://www.bing.com/
Es el buscador predeterminado de Microsoft. Microsoft es una compañía que está en todos los ambitos de la tecnología, ya sea en juegos, sistemas operativos, navegadores... y los buscadores no podía ser la excepción. Ofrece una tasa de acierto bastante alta y una buena velocidad. Pero su punto fuerte es la facilidad y velocidad a la hora de buscar contenido multimedia, en este aspecto es mejor que Google. Tambien ofrece la protección de los datos y de la propiedad intelectual. Con todo esto no es de extrañar que sea el tercer buscador más usado en el mundo con un 5'45%

El 6'6 % restante se lo reparten el resto de buscadores, con yahoo a la cabeza.



Tipos de buscadores:
Todos estos buscadores anteriores son jerárquicos, pero existen otros tipos:

Buscadores de Directorios: No requiere muchos recursos informáticos, pero si mantenimiento y soporte humano. Registran algunos de los datos de la página como el titulo, o la descripción que se haga en el momento de registrar la página que son revisados por supervisores humanos y clasficado en categorías. Es decir no buscan información en el contenido de la página, sino por temática. Algo parecido a los tags de Blogger. Yahoo! y Terra son ejemplos de este tipo de buscadores.

Buscadores Verticales: Especializados en un sector concreto como por ejemplo futbol, o peliculas, lo que permite analizar la información de forma más profunda. Un ejemplo es Nestoria, un buscador de pisos.

Buscadores de Portal: Estos buscadores sólo realizan busquedas en su Portal o Web. Por ejemplo Youtube, Facebook, MySpace...

Meta-buscadores: Estos no son buscadores reales, sino pseudobuscadores que utilizan varios buscadores autenticos para realizar busquedas en paralelo de los principales buscadores. En las versiones más modernas se puede elegir qué buscadores utilizar.
Les dejo un enlace para que prueben ustedes mismos un meta-buscador, podéis dejar un comentario de la experiencia.
http://www.zoo.com/


Curiosidades y Opinión general:

En mi opinión el mejor buscador es Google, rapido, sencillo, intuitivo, eficaz... Aunque si por algún capricho del destino no encuentro lo que busco (que a veces pasa) Bing es una buena carta para guardarse bajo la manga.
En cualquier caso yo jamás utilizaré Baidu, ya que en mi opinión se aprovechan de las leyes Chinas para plagiar ideas de otras empresas sin ninguna consecuencia legal en su contra.

Para acabar aquí te dejo un enlace sobre 12 técnicas para sacarle más partido a tus busquedas en Google.

No olvides dejar tu comentario abajo.