Análisis de conglomerados 1c. Análisis de datos y pronósticos. Uso de diseños de documentos de texto

El mecanismo está representado por un conjunto de objetos del lenguaje incorporado de 1C:Enterprise. El esquema de interacción de los objetos principales del mecanismo se muestra en la figura. Configuración de las columnas de análisis de datos: un conjunto de configuraciones para las columnas de entrada de análisis de datos. Para cada columna, el tipo de datos contenidos en ella, el papel desempeñado por la columna, ajustes adicionales dependiendo del tipo de análisis que se realice. Parámetros de análisis de datos: un conjunto de parámetros para realizar el análisis de datos. La composición de los parámetros depende del tipo de análisis. Por ejemplo, para el análisis de conglomerados se indica el número de conglomerados en los que se deben dividir los objetos fuente, el tipo de medida de la distancia entre objetos, etc. Los datos sin procesar son la fuente de datos para el análisis. El resultado de una consulta, el área de celda de un documento de hoja de cálculo, una tabla de valores puede actuar como fuente de datos. Un analizador es un objeto que realiza directamente el análisis de datos. Se establece la fuente de datos para el objeto, se establecen los parámetros. El resultado de la operación de este objeto es el resultado del análisis de datos, cuyo tipo depende del tipo de análisis. El resultado del análisis de datos es un objeto especial que contiene información sobre el resultado del análisis. Cada tipo de análisis tiene su propio resultado. Por ejemplo, el resultado del análisis de datos: un árbol de decisión será un objeto de tipo DataAnalysisResultDecisionTree. En el futuro, el resultado se puede mostrar en un documento de hoja de cálculo usando el generador de informes de análisis de datos, se puede mostrar a través del acceso programático a su contenido, se puede usar para crear un modelo de pronóstico. Cualquier resultado del análisis de datos se puede guardar para su uso posterior. Un modelo de pronóstico es un objeto especial que le permite hacer un pronóstico basado en datos de entrada. El tipo de modelo depende del tipo de análisis de datos. Por ejemplo, un modelo creado para el análisis de datos: la búsqueda de asociación será del tipo AssociationSearch PredictionModel. La fuente de datos para el pronóstico se pasa a la entrada del modelo de pronóstico. El resultado es una tabla de valores que contiene los valores pronosticados. Selección para el pronóstico: una tabla de valores, el resultado de una consulta o un área de un documento de hoja de cálculo que contiene información sobre la cual es necesario construir un pronóstico. Por ejemplo, para el modelo de previsión: búsqueda de asociaciones, la selección puede contener una lista de productos del documento de ventas. El resultado del trabajo del modelo puede recomendar qué productos aún se pueden ofrecer al comprador. La configuración de la columna de muestra es un conjunto de objetos especiales que muestran la correspondencia entre las columnas del modelo de pronóstico y las columnas de la muestra de pronóstico. Configuración de la columna de resultados: le permite controlar qué columnas se colocarán en la tabla resultante del modelo de pronóstico. El resultado del modelo es una tabla de valores, que consta de columnas, como se especifica en la configuración de las columnas resultantes, y que contiene los datos pronosticados. El contenido específico está determinado por el tipo de análisis. El generador de informes de análisis de datos es un objeto que le permite mostrar un informe sobre el resultado del análisis de datos. Además, el generador de informes proporciona objetos especiales para vincular a los datos a fin de permitir que el usuario controle de forma interactiva los parámetros de análisis, la configuración de la columna de la fuente de datos, la configuración de la columna del modelo de pronóstico, etc. Tipos de análisis El mecanismo le permite realizar los siguientes tipos de análisis:
  • Estadísticas Generales
  • Búsqueda de asociaciones
  • Búsqueda de secuencia
  • árbol de decisión
  • análisis de conglomerados
El mecanismo de análisis de datos en 1C 8.2 y 8.3 simplifica el trabajo del desarrollador en términos de identificación de patrones basados ​​en varios datos. Por ejemplo, con este mecanismo, puede mostrar los productos que se compran juntos con mayor frecuencia. Otro ejemplo es construir un pronóstico de ventas basado en datos anteriores. Este no es todo el rango de aplicación del mecanismo de análisis de datos en 1C, profundicemos en sus capacidades con más detalle. Los principales objetos del mecanismo de análisis de datos en 1C Este mecanismo está representado en el sistema 1C Enterprise por 3 objetos del sistema:
  • El análisis de datos es un objeto que realiza el análisis de datos. Para ello, debe especificar la fuente de datos y los parámetros necesarios para el análisis.
  • El resultado del análisis de datos es un objeto que es el resultado del trabajo de análisis de datos.
  • Se crea un modelo de pronóstico basado en el resultado del análisis de datos. El objeto es el eslabón final en el mecanismo de análisis 1C y genera una tabla de valores que contiene los valores pronosticados.
Tipos de análisis de datos 1C 8.3 Sistema 1C Una empresa puede usar diferentes tipos de análisis, los consideraremos con más detalle.
  1. Estadísticas generales: este tipo de análisis es un muestreo estadístico simple de una fuente de datos. Un ejemplo de aplicación es el análisis de ventas por artículo de un período. El resultado del análisis será información sobre cuánto se vendió un producto en particular. El sistema también calculará campos específicos: máximo, mínimo, mediana, media, rango, desviación estándar, número de valores, número de valores únicos, moda.
  2. Búsqueda de asociación: el tipo de análisis está diseñado para buscar combinaciones que a menudo ocurren juntas. Muy bueno para encontrar artículos comprados con frecuencia juntos. Como resultado del análisis, el sistema generará la siguiente información: información sobre los datos procesados, grupos asociativos, reglas de asociación por las cuales se comparan los grupos.
  3. Búsqueda de secuencias: análisis que le permite identificar patrones en los datos analizados y ofrecer más predicciones. Como resultado del análisis, el sistema mostrará información sobre la posibilidad de ocurrencia de ciertos eventos en términos porcentuales.

El mecanismo de análisis y pronóstico de datos brinda a los usuarios (economistas, analistas, etc.) la capacidad de buscar patrones no obvios en los datos acumulados en la base de información. Este mecanismo permite:

  • buscar patrones en los datos de origen base de información;
  • gestionar los parámetros del análisis que se está realizando tanto de forma programática como interactiva;
  • proporcionar acceso programático al resultado del análisis;
  • mostrar automáticamente el resultado del análisis en un documento de hoja de cálculo;
  • cree modelos de pronóstico que le permitan predecir automáticamente eventos posteriores o los valores de ciertas características de nuevos objetos.

El mecanismo de análisis de datos es un conjunto de objetos del lenguaje incorporado que interactúan entre sí, lo que permite al desarrollador utilizar sus partes constituyentes en cualquier combinación en cualquier solución de aplicación. Los objetos integrados facilitan la organización configuración interactiva parámetros de análisis por el usuario, y también le permiten mostrar el resultado del análisis en una forma conveniente para mostrar en un documento de hoja de cálculo.

El mecanismo permite trabajar tanto con datos recibidos de la infobase como con datos recibidos de una fuente externa, previamente cargados en una tabla de valores o en un documento de hoja de cálculo:

Aplicando uno de los tipos de análisis a los datos de origen, puede obtener el resultado del análisis. El resultado del análisis es un determinado modelo de comportamiento de los datos. El resultado del análisis puede mostrarse en el documento final o guardarse para su uso posterior.

El uso adicional del resultado del análisis es que, sobre su base, se puede crear un modelo de pronóstico que permita predecir el comportamiento de nuevos datos de acuerdo con el modelo existente.

Por ejemplo, puede analizar qué artículos se compran juntos (en la misma factura) y almacenar el resultado de este análisis en una base de datos. En el futuro, al crear otra factura:

Con base en el resultado del análisis guardado, es posible construir un modelo de pronóstico, alimentarlo "en la entrada" con los nuevos datos contenidos en esta factura y "en la salida" recibir un pronóstico: una lista de bienes que la contraparte Petrov B.S. también es probable que adquiera si se le ofrecen:

Se implementan varios tipos de análisis de datos en el motor de pronóstico y análisis de datos:

Tipos de análisis implementados

Estadísticas Generales

Es un mecanismo para recopilar información sobre los datos en la muestra de estudio. Este tipo de análisis está destinado a un estudio preliminar de la fuente de datos analizada.

El análisis muestra una serie de características de los campos numéricos y continuos. Cuando se envía un informe a un documento de hoja de cálculo, los gráficos circulares se rellenan para mostrar la composición de los campos.

Búsqueda de asociaciones

Este tipo de análisis busca grupos de objetos o valores característicos que ocurren con frecuencia, y también busca reglas de asociación. La búsqueda por asociación se puede utilizar, por ejemplo, para identificar bienes o servicios que se compran juntos con frecuencia:

Este tipo de análisis puede trabajar con datos jerárquicos, lo que permite, por ejemplo, encontrar reglas no solo para productos específicos, sino también para sus grupos. Una característica importante de este tipo de análisis es la capacidad de trabajar tanto con una fuente de datos de objetos, en la que cada columna contiene alguna característica del objeto, como con una fuente de eventos, donde las características del objeto se encuentran en una columna.

Para facilitar la percepción del resultado, se proporciona un mecanismo para cortar reglas redundantes.

Búsqueda de secuencia

El tipo de análisis de búsqueda de secuencias le permite identificar cadenas secuenciales de eventos en la fuente de datos. Por ejemplo, podría ser una cadena de bienes o servicios que los clientes suelen comprar en sucesión:

Este tipo de análisis le permite buscar a través de la jerarquía, lo que hace posible rastrear no solo las secuencias de eventos específicos, sino también las secuencias de los grupos principales.

Un conjunto de parámetros de análisis permite al especialista limitar las distancias de tiempo entre los elementos de las secuencias deseadas, así como ajustar la precisión de los resultados.

análisis de conglomerados

El análisis de conglomerados le permite dividir el conjunto inicial de objetos bajo estudio en grupos de objetos, de modo que cada objeto sea más similar a los objetos de su grupo que a los objetos de otros grupos. Al analizar en el futuro los grupos resultantes, llamados grupos, puede determinar qué caracteriza a un grupo en particular, tomar una decisión sobre los métodos de trabajo con objetos de diferentes grupos. Por ejemplo, utilizando el análisis de conglomerados, puede dividir a los clientes con los que trabaja la empresa en grupos para aplicar diferentes estrategias a la hora de trabajar con ellos:

Usando los parámetros del análisis de conglomerados, el analista puede configurar el algoritmo mediante el cual se realizará la partición y también puede cambiar dinámicamente la composición de las características que se tienen en cuenta en el análisis, configurar factores de ponderación para ellas.

El resultado de la agrupación se puede mostrar en un dendrograma, un objeto especial diseñado para mostrar relaciones secuenciales entre objetos.

árbol de decisión

El tipo de análisis de árbol de decisión le permite construir una estructura jerárquica de reglas de clasificación, presentadas en forma de árbol.

Para crear un árbol de decisiones, debe seleccionar el atributo de destino que se utilizará para crear el clasificador y una serie de atributos de entrada que se utilizarán para crear reglas. El atributo de destino puede contener, por ejemplo, información sobre si el cliente cambió a otro proveedor de servicios, si la transacción fue exitosa, si el trabajo se hizo bien, etc. Los atributos de entrada, por ejemplo, pueden ser la edad de un empleado, su experiencia laboral, la situación financiera del cliente, el número de empleados en la empresa, etc.

El resultado del análisis se representa como un árbol, cada nodo del cual contiene una determinada condición. Para decidir a qué clase asignar un determinado nuevo objeto, es necesario, al responder preguntas en los nodos, recorrer la cadena desde la raíz hasta la hoja del árbol, pasando a los nodos hijos en el caso de una respuesta afirmativa y al nodo vecino en el caso de una negativa una.

Un conjunto de parámetros de análisis le permite ajustar la precisión del árbol resultante:

Modelos de pronóstico

Los modelos de pronóstico creados por el motor son objetos especiales que se crean a partir del resultado del análisis de datos y le permiten realizar automáticamente un pronóstico para nuevos datos en el futuro.

Por ejemplo, un modelo de predicción de búsqueda de asociación integrado en el análisis de las compras de los clientes se puede utilizar cuando se trabaja con un cliente comprador para ofrecerle productos que comprará con cierto grado de probabilidad junto con los productos que ha elegido.

Uso del mecanismo de análisis de datos en soluciones aplicadas

Para familiarizar a los desarrolladores de soluciones aplicadas con el mecanismo de análisis de datos, se coloca una base de información de demostración en el disco "Información y soporte tecnológico" (ITS). Incluye el procesamiento universal "Consola de análisis de datos", que le permite realizar análisis de datos en cualquier solución de aplicación, sin modificar la configuración.

Una de las principales tendencias en el mercado de sistemas contables y de gestión es el constante aumento de la demanda por el uso de herramientas analíticas de procesamiento de datos que aseguren la toma de decisiones informadas. Es por eso que una de las direcciones estratégicas para el desarrollo del sistema de software 1C:Enterprise se ha convertido en la expansión constante de las capacidades de informes económicos y analíticos. Sin embargo, los clientes de hoy ya no están satisfechos con las herramientas tradicionales que les permiten generar una variedad de informes, tablas dinámicas y gráficos que se crean sobre la base de indicadores y relaciones predefinidos y que deben analizarse manualmente. Las empresas necesitan cada vez más herramientas cualitativamente diferentes que les permitan buscar automáticamente reglas no obvias e identificar patrones desconocidos (Fig. 1). Es así como se puede generar conocimiento cualitativamente nuevo a partir de la información acumulada por la empresa y en ocasiones tomar decisiones completamente no triviales para mejorar la eficiencia empresarial utilizando métodos de minería de datos (DIA).
Arroz. 1. La lógica del desarrollo de la "intelectualidad" de los problemas analíticos que se resuelven. Lanzamiento de verano de 2003 nueva versión plataforma tecnológica "1C:Enterprise 8.0" permitió ampliar significativamente las capacidades de inteligencia de negocios en el sistema (ver recuadro). Sin embargo, una observación importante debe hacerse aquí. El software de plataforma "1C" se desarrolla no solo en "pasos", de una versión a otra, sino que se mejora y amplía constantemente dentro de una versión y en dos direcciones: tecnológica y aplicada. Así, tras el primer anuncio del G8, ya se han lanzado más de una decena de lanzamientos de la plataforma, ultima versión (en enero de 2006) tiene el número 8.0.13, ¡y es bastante diferente de lo que era hace dos años y medio! Una de las direcciones de desarrollo de "1C:Enterprise 8.0" son precisamente los mecanismos de inteligencia empresarial; en particular, las herramientas IAD aparecieron en él solo en 2005. Es importante señalar que la mayoría de las funciones de análisis se implementan a nivel de la plataforma tecnológica y están disponibles para los usuarios solo después de que se incluyen en las nuevas versiones de las soluciones aplicadas. Por lo tanto, existe una brecha (a veces de varios meses) entre la aparición de nuevas funciones y su provisión a los usuarios. Teniendo en cuenta este problema, en septiembre de 2005, 1C lanzó una solución de aplicación especial "Subsistema de análisis de datos" (DAS), que se puede integrar en cualquier configuración de la plataforma "1C:Enterprise 8.0", para reducir la brecha. Además de una amplia gama de funciones básicas, el paquete incluye más de 30 modelos preconfigurados para una configuración típica de Trade Management. PAD incluye aquellas herramientas IAD cualitativamente nuevas que antes estaban ausentes en los programas 1C. Para el análisis directo y la previsión de estas habilidades y conocimientos específicos no se requiere. Se supone un buen dominio del área temática analizada y una comprensión de las principales relaciones de causa y efecto en ella. La preparación de fuentes de datos y modelos predictivos requiere la capacidad de usar un generador de consultas y el conocimiento de cómo colocar información en objetos de metadatos de configuración. Los algoritmos IAD incluidos en la nueva configuración (versión 1.0.5) forman modelos analíticos (plantillas) que describen patrones en los datos de origen. Estos modelos tienen un valor independiente (pueden reutilizarse) y también se utilizan para la generación automatizada de pronósticos, incluidos los de escenario, con indicadores previamente desconocidos (Fig. 2). El mecanismo IAD es un conjunto de objetos del lenguaje incorporado que interactúan entre sí, gracias al cual el desarrollador puede usar sus componentes en cualquier combinación en cualquier solución de aplicación. Los objetos incorporados facilitan la organización de la configuración interactiva de los parámetros de análisis por parte del usuario, así como la visualización del resultado del análisis en una forma conveniente para mostrar en un documento de hoja de cálculo. Al aplicar uno de los tipos de análisis a los datos de origen, puede obtener un resultado que será un determinado modelo de comportamiento de los datos. El resultado del análisis puede mostrarse en el documento final o guardarse para su uso posterior; en base a él, puede crear un modelo de pronóstico que le permita predecir el comportamiento de nuevos datos.
Arroz. 2. esquema general funcionamiento del mecanismo de minería de datos. La versión actual del subsistema implementa métodos que han recibido la mayor distribución comercial en la práctica mundial, a saber:

  • agrupamiento: implementa la agrupación de objetos, maximizando la similitud y las diferencias entre grupos;
  • árbol de decisión: proporciona la construcción de una jerarquía de causa y efecto de las condiciones que conducen a ciertas decisiones;
  • búsqueda de asociación: busca combinaciones estables de elementos en eventos u objetos.
A continuación, veremos más de cerca la esencia y las posibilidades. aplicación práctica estos métodos IAD.

Agrupación

El propósito del agrupamiento es la selección de un cierto número de grupos relativamente homogéneos (segmentos o conglomerados) de un conjunto de objetos de la misma naturaleza. Los objetos se distribuyen en grupos de tal manera que las diferencias intragrupales son mínimas y las diferencias intergrupales son máximas (Fig. 3). Los métodos de agrupamiento permiten pasar de la representación objeto por objeto a la representación grupal de un conjunto de objetos arbitrarios, lo que simplifica enormemente su manejo. A continuación se describen varios escenarios posibles para aplicar el agrupamiento en la práctica. Segmentación de clientes de acuerdo con un conjunto determinado de parámetros, permite distinguir entre ellos grupos estables con preferencias de compra, niveles de ventas y solvencia similares, lo que simplifica enormemente la gestión de la relación con el cliente. En clasificación de mercancías a menudo se utilizan principios de clasificación más bien condicionales. La selección de segmentos en base a un conjunto de criterios formales permite identificar grupos de bienes verdaderamente homogéneos. En el contexto de una gama de productos amplia y bastante heterogénea, la gestión de surtido a nivel de segmento, en comparación con la gestión a nivel de gama, aumenta significativamente la eficiencia de la promoción, la fijación de precios, la comercialización y la gestión de la cadena de suministro. Segmentación de gerentes permite planificar con mayor eficacia los cambios organizacionales, mejorar los esquemas motivacionales, ajustar los requerimientos del personal contratado, lo que en definitiva mejora la manejabilidad de la empresa y la estabilidad del negocio en su conjunto.
Arroz. 3. Análisis de datos por agrupamiento. La similitud y diferencia entre objetos está determinada por la "distancia" entre ellos en el espacio de factores. El método de medición de la distancia depende de la métrica, que indica el principio de determinación de la similitud/diferencia entre los objetos de la muestra. La implementación actual admite las siguientes métricas:
  • La "métrica euclidiana" es la distancia estándar entre dos puntos en el espacio de atributos euclidiano N-dimensional;
  • "Métrica euclidiana al cuadrado": mejora la influencia de la diferencia (distancia) en el resultado de la agrupación;
  • "city metric" - reduce el impacto de las emisiones;
  • "métrica de dominancia": define la diferencia entre los objetos de la muestra como la diferencia máxima existente entre los valores de sus atributos, por lo tanto, es útil para mejorar las diferencias entre los objetos en un atributo.
El método de formación de grupos basado en la información sobre la distancia entre los objetos agrupados está determinado por el método de agrupamiento. La versión actual de 1C:Enterprise 8.0 implementa los siguientes métodos de agrupación:
  • "comunicación cercana": el objeto se une al grupo para el cual la distancia al objeto más cercano es mínima;
  • "comunicación distante": el objeto se une al grupo para el cual la distancia al objeto más lejano es mínima;
  • "centro de gravedad": el objeto se une al grupo para el cual la distancia al centro del grupo es mínima;
  • Método "k-means": se seleccionan objetos arbitrarios, que se consideran los centros de los grupos, luego todos los objetos analizados se ordenan secuencialmente y se adjuntan al grupo más cercano a ellos. Después de adjuntar el objeto, se calcula nuevo centro clúster, que se calcula como el valor promedio de los atributos de todos los objetos incluidos en el clúster. El procedimiento se repite hasta que cambien los centros de las agrupaciones.
Cualquiera de los métodos de clustering implementados en la plataforma requiere una indicación explícita del número de clusters deseados. Puede ingresar pesos para los atributos de las características, lo que le permite priorizarlos. Como resultado del análisis mediante clustering, se obtienen los siguientes datos:
  • centros de conglomerados, que son un conjunto de valores promedio de las columnas de entrada en cada conglomerado;
  • una tabla de distancias intercluster (distancias entre centros de cluster) que determina el grado de diferencia entre ellos;
  • valores de columna predictivos para cada grupo;
  • una clasificación de factores y un árbol de condiciones que determinaron la distribución de objetos en grupos.
Los algoritmos de agrupamiento permiten no solo realizar análisis de conglomerados objetos en un conjunto de atributos dados, sino también para predecir el valor de uno o más de ellos para la muestra actual en función de la asignación de los objetos de esta muestra a un grupo particular.

Búsqueda de asociaciones

Este método está diseñado para identificar combinaciones estables de elementos en ciertos eventos u objetos. Los resultados del análisis se presentan como grupos de elementos asociados. Aquí, además de las combinaciones estables de elementos identificadas, se proporcionan análisis detallados de los elementos asociados (Fig. 4).
Arroz. 4. Presentación de los resultados del análisis por el método de "búsqueda de asociaciones" en forma de grupos de elementos asociados. El método se desarrolló originalmente para buscar combinaciones típicas de artículos en las compras, razón por la cual a veces se lo denomina análisis del carrito de compras. En relación con este escenario, por regla general, los grupos de productos o los productos individuales actúan como elementos asociados. Y un objeto de agrupación que combina elementos de muestras puede ser cualquier objeto de un sistema de información que identifique una transacción: por ejemplo, un pedido de un comprador, un acto de prestación de servicios o un recibo de caja. La información sobre patrones en las preferencias de productos de los clientes mejora la eficiencia de la gestión de las relaciones con los clientes (en términos de campañas publicitarias y campañas de marketing), la fijación de precios (formación de ofertas complejas y sistemas de descuento), la gestión de inventario y la comercialización (distribución de bienes en los pisos comerciales). Otro ejemplo del uso de este método es determinar las combinaciones de canales publicitarios preferidos por los clientes para eliminar su duplicación al realizar campañas publicitarias dirigidas. Esto le permite reducir significativamente los costos de tales eventos. El algoritmo de búsqueda de asociaciones implementado en la plataforma tiene controles bastante flexibles para la adecuación de los modelos de análisis o pronóstico. El parámetro "Porcentaje mínimo de casos" determina el "umbral" del algoritmo para una combinación particular de elementos en un evento u objeto, lo que le permite ignorar asociaciones débiles comunes. El parámetro "Confianza mínima" determina la estabilidad requerida de las asociaciones que está buscando, y el parámetro "Importancia mínima" le permite identificar las asociaciones de mayor prioridad. El parámetro "Tipo de corte de reglas", que puede tomar los valores "Cortar redundantes" y "Cortar los cubiertos por otras reglas", facilita enormemente la percepción de los resultados de análisis y pronóstico. Para la interpretación práctica de los resultados obtenidos con este algoritmo, es de vital importancia particionar el conjunto inicial de elementos asociados en grupos realmente homogéneos desde el punto de vista del análisis que se está realizando.

árbol de decisión

Como resultado de aplicar este método a los datos iniciales, se crea una estructura jerárquica (en forma de árbol) de reglas de la forma "si ... entonces ...", y el algoritmo de análisis asegura el aislamiento de las condiciones más significativas. y las transiciones entre ellos en cada etapa. Este algoritmo se usa más ampliamente para identificar relaciones de causa y efecto en los datos y describir modelos de comportamiento. Un área típica de aplicación de los árboles de decisión es la evaluación de diversos riesgos, por ejemplo, el cierre de un pedido por parte de un cliente o su transferencia a un competidor, la entrega tardía de bienes por parte de un proveedor o el retraso en el pago de una transacción. crédito (Fig. 5). Los factores de entrada típicos del modelo son el monto y la composición del pedido, el saldo actual de las liquidaciones mutuas, el límite de crédito, el porcentaje de pago anticipado, las condiciones de entrega y otros parámetros que caracterizan el objeto de pronóstico. Una adecuada evaluación de riesgos asegura que se tomen decisiones informadas para optimizar la relación rentabilidad/riesgo en las operaciones de la empresa, y también es útil para aumentar el realismo de varios presupuestos.

Arroz. 5. La aplicación del método del "árbol de decisión" permite, en base a los factores de entrada del modelo (a), obtener una evaluación de los riesgos de tomar ciertas las decisiones de gestión(B). Como ejemplo que ilustra la capacidad del algoritmo para identificar relaciones causales, podemos citar el problema de optimizar el trabajo del departamento de ventas. Para resolverlo, elegiremos el indicador de la efectividad de los gerentes de ventas como un valor predicho, por ejemplo, la rentabilidad específica por cliente, y como factores, un conjunto de datos que potencialmente afectan el resultado. El algoritmo determinará los factores que tienen el mayor impacto en el resultado, así como las combinaciones típicas de condiciones que conducen a un resultado particular. Además, el subsistema "Análisis de datos" permitirá estimar (predecir) los valores esperados objetivo basado en datos actuales, así como hacer un pronóstico "qué pasaría si ..." cambiando los indicadores suministrados a la entrada del modelo. Los resultados del análisis y la previsión mediante árboles de decisión pueden reducir significativamente el impacto de la incertidumbre del entorno empresarial sobre el estado de la empresa, así como decidir amplia gama tareas relacionadas con la identificación de relaciones de causa y efecto complejas y no obvias. El algoritmo del árbol de decisiones forma una jerarquía causal de condiciones que conducen a ciertas decisiones. Como resultado de aplicar este método a la muestra de entrenamiento, se crea una estructura jerárquica (similar a un árbol) de reglas de división de la forma "si... entonces...". El algoritmo de análisis (aprendizaje del modelo) se reduce a un proceso iterativo de aislamiento de las condiciones más significativas y transiciones entre ellas. Las condiciones pueden ser tanto cuantitativas como cualitativas y formar las "ramas" de este árbol abstracto. Su "hoja" está formada por los valores del atributo predicho (decisión), que, al igual que las condiciones de transición, permiten una interpretación tanto cualitativa como cuantitativa. La totalidad de estas condiciones impuestas a los factores y la estructura de transiciones entre ellos a la solución final forman el modelo de pronóstico. Este algoritmo se usa más ampliamente para evaluar los resultados de varias cadenas de eventos e identificar las relaciones de causa y efecto en las muestras. La importancia y confiabilidad del modelo de este algoritmo se controla mediante los parámetros "Tipo de simplificación", "Profundidad máxima del árbol" y "Número mínimo de elementos en un nodo". Los resultados del análisis de la muestra mediante el algoritmo "Decision Tree" son:

  • calificación de factores, que es una lista de factores que influyeron en la decisión, ordenados en orden descendente de importancia ("citas" en los nodos del árbol);
  • comparación de decisiones (valores de la columna predictiva) y las condiciones que las determinaron, es decir, el árbol “Consecuencia-Causa”;
  • Árbol de "Causa-Efecto", que es un conjunto de transiciones entre condiciones que determina una decisión particular (esencialmente, una representación visual del modelo de pronóstico).
Soluciones conjuntas "1C"

Además de las funciones implementadas directamente en el marco de la plataforma 1C:Enterprise 8.0, el arsenal de herramientas de inteligencia empresarial de 1C se repone con soluciones especializadas creadas, entre otras cosas, en el marco del proyecto 1C-Joint (http:// soluciones v8.1c.ru/) - con la participación de socios de la empresa y desarrolladores independientes (ver "Soluciones conjuntas de la empresa "1C" y sus socios", "BYTE / Russia" No 9 "2005). Aquí notamos dos productos relacionados con el uso de métodos inteligentes de análisis, - es "1C:Enterprise 8.0. 1C-VIP Anatech: ABIS. A B C. Contabilidad de gestión y costeo" (socio-desarrollador - consultoría"VIP Anatekh") y "1C-VIP Anatekh-VDGB: ABIS. BSC. Balanced Scorecard" (socios desarrolladores - empresas "VIP Anatekh" y VDGB).

Escenarios comerciales típicos para usar métodos IAD

La documentación del PAD tiene una sección sobre ejemplos típicos aplicación de minería de datos en relación con la configuración "1C: Trade Management 8.0.". Aquí presentamos varios de estos escenarios comerciales.

Gestión de la relación con el cliente

Planificación de escenarios campaña de publicidad" La planificación de una próxima campaña publicitaria se considera desde el punto de vista de optimizar la distribución del presupuesto asignado entre los canales publicitarios, con base en indicadores regionales, de producto, de cliente y otros del segmento objetivo, así como en la efectividad de los canales publicitarios en el secciones especificadas en algún período de planificación anterior. Algoritmo- "Análisis de conglomerados". Atributos predictivos- acciones de respuestas al canal de publicidad de segmentos condicionalmente homogéneos identificados por el algoritmo. Columnas calculadas- participación de los canales publicitarios en el presupuesto de una campaña publicitaria, teniendo en cuenta la participación probable de las respuestas y la eficacia (en términos de los ingresos resultantes) de cada canal publicitario. Ejemplo de patrón: Los clientes de clase A en la región P, que prefieren el grupo de productos P, son atraídos por el mismo canal publicitario que los clientes de la región H, que prefieren el grupo de productos Y.

Gestión de la cadena de suministro

Escenario "Optimización de la selección de proveedores por grupo de productos" Selección de proveedores dominantes de "primer nivel" para grupos de productos básicos es extremadamente importante para la estabilización del sistema logístico en particular y el sistema de gestión de la cadena de suministro en general, así como para reducir la duración promedio de las cadenas de suministro. Por otro lado, una integración más estrecha con los principales proveedores, por regla general, puede reducir significativamente el costo de los bienes. En este sentido, es de interés analizar combinaciones estables de proveedores en varios grupos de productos en comparación con análisis para proveedores asociados dentro de los grupos. Esto le permite identificar "intersecciones" de proveedores en diferentes grupos de productos y optimizar las relaciones con ellos. Algoritmo- "Buscar asociaciones". Atributos predictivos- combinaciones estables de proveedores. Factores principales- grupos de mercancías. Descifrado- análisis por proveedores (volumen de compras, ingresos, condiciones de entrega y pago, condiciones de cumplimiento de pedidos - pesimista, optimista, promedio). Ejemplo de patrón: una asociación estable de un proveedor A grande e impredecible y un proveedor promedio B predecible en una gran cantidad de grupos de productos. Es posible, al realizar pedidos para grupos de productos competitivos, posicionar al proveedor mediano como el principal, si el volumen del pedido al grande no supera un cierto umbral (lo que da una ganancia de escala significativa).

Gestión de personal

Escenario "Perfil de gerentes de ventas por indicadores clave de desempeño" Determinar la efectividad de los gerentes (retención, búsqueda de clientes, eficiencia en la comunicación, cobranza de créditos condicionales e incondicionales, indicadores de desempeño específicos por cliente, etc.) es de interés no solo desde el punto de vista de formar un sistema de incentivos financieros para los gerentes, pero también desde el punto de vista de los parámetros de racionamiento efectivo de su actividad. Algoritmo- Árboles de decisión. Atributos predictivos- indicadores clave de rendimiento del departamento de ventas (número de clientes clave, índices de abandono y adquisición, ingresos perdidos por mes, ingresos atraídos por mes, ingresos por mes por cliente, recibos totales de clientes, etc.). Factores principales- el número de clientes activos, los ingresos, los ingresos, los indicadores específicos por cliente, la eficiencia de la comunicación. Dependiendo de los atributos predictivos, la composición de los factores puede variar significativamente. Ejemplo de patrón: los gerentes que brindan los mejores indicadores de cobro de cuentas por cobrar (la relación entre los recibos de DS y los ingresos) tienen una tasa de retención> 0,8; tasa de atracción > 0,25; el número de transacciones abiertas simultáneamente no es más de 15, pero no menos de 10; la intensidad de los eventos por día no es más de 10, pero no menos de 3; el número de clientes activos en el período es de al menos 50, pero no más de 100.

Conclusión

Los negocios modernos son tan multifacéticos que los factores que potencialmente influyen en una decisión en particular pueden ser decenas. La competencia es cada día más fuerte ciclo vital las mercancías se acortan, las preferencias de los clientes cambian cada vez más rápido. Para desarrollar negocios, es necesario responder de la manera más dinámica posible al entorno empresarial que cambia rápidamente, teniendo en cuenta los patrones sutiles y, a veces, sutiles de los eventos. ¿Qué grupos de clientes responderán a la promoción y cuáles irán irrevocablemente a la competencia? ¿Abrir una nueva línea de negocio o esperar por ahora? ¿El comprador retrasará el pago y el proveedor el envío? ¿Cuáles son las oportunidades de crecimiento y dónde acechan las posibles amenazas? Estas son las preguntas que miles de gerentes se hacen a sí mismos y a sus colegas todos los días. El subsistema de análisis de datos implementado en la plataforma 1C:Enterprise 8.0 está diseñado para ayudar a los usuarios del sistema de información corporativa a encontrar respuestas a preguntas no triviales más rápido al proporcionar una transformación automatizada de los datos acumulados en sistema de informacion, en regularidades prácticas y bien interpretadas.

Informes económicos y analíticos en "1C:Enterprise 8.0"

La plataforma 1C:Enterprise 8.0 incluye una serie de mecanismos para generar informes económicos y analíticos que le permiten generar documentos interactivos (y no solo formularios de impresión) en el marco de determinadas soluciones aplicadas. Por lo tanto, el usuario puede trabajar con informes de la misma manera que con cualquier formulario de pantalla, incluso cambiando los parámetros del informe, reconstruyéndolo, usando "decodificación" (obteniendo informes adicionales basados ​​en elementos individuales de un informe ya generado), etc. varias herramientas de software universales que le permiten generar cualquier informe arbitrario, dependiendo de las tareas. Esto lo pueden hacer, entre otras cosas, los propios usuarios (bastante experimentados), que conocen bien la estructura de la solución aplicada utilizada. A continuación, repasaremos brevemente las principales herramientas de generación de informes en 1C:Enterprise 8.0. Peticiones- esta es una de las formas de acceder a los datos en 1C:Enterprise 8.0, que selecciona información de la base de datos de acuerdo con ciertas condiciones, generalmente en combinación con el procesamiento más simple de los datos recibidos: agrupar, ordenar, calcular. No es posible cambiar los datos mediante consultas, ya que originalmente están diseñadas para obtener información rápidamente de grandes cantidades de información. La base de datos se implementa como un conjunto de tablas interconectadas a las que se puede acceder tanto individualmente como varias tablas en interconexión. Para implementar sus propios algoritmos, un desarrollador puede usar un lenguaje de consulta basado en SQL y que contiene muchas extensiones que reflejan las especificaciones de las tareas financieras y económicas y reducen el esfuerzo dedicado a crear soluciones aplicadas. La plataforma incluye un generador de consultas que le permite redactar el texto de consulta correcto utilizando solo medios visuales (Fig. 6).

Arroz. 6. El generador de consultas (a) permite al desarrollador redactar el texto de la consulta (b) únicamente por medios visuales. documento de hoja de calculo es un mecanismo poderoso para visualizar y editar información, incluido el uso de la lectura dinámica de información de la base de datos. Un documento de hoja de cálculo se puede utilizar solo o como parte de cualquiera de los formularios utilizados en la aplicación. En esencia, se parece a las hojas de cálculo (consiste en filas y columnas en las que se colocan los datos), pero sus capacidades son mucho más amplias. Admite agrupación, descifrado, inclusión de notas. El documento puede utilizar diferentes tipos diseño de informes, incluidos cuadros gráficos. Un documento de hoja de cálculo puede contener tablas dinámicas, que en sí mismas son una herramienta eficaz para presentar datos multidimensionales de forma programática e interactiva. Constructor de formulario de salida ayuda al desarrollador a crear informes y presentar datos de informes en una forma tabular o gráfica conveniente. Incluye todas las funciones del generador de consultas, así como la creación y personalización de un formulario. Generador de informes- este es un objeto del lenguaje incorporado, que brinda la capacidad de crear dinámicamente un informe tanto de forma programática como interactiva (Fig. 7). El núcleo de su trabajo es una solicitud, mediante la cual el usuario tiene la oportunidad de configurar de forma interactiva todos los parámetros principales contenidos en el texto de la solicitud. Los resultados de esta consulta se muestran en un documento de hoja de cálculo, que también puede utilizar información de fuentes de datos arbitrarias. El desarrollador, utilizando los comandos del generador de informes, puede cambiar el conjunto de parámetros disponibles para el usuario para la configuración.
Arroz. 7. Esquema de trabajo del generador de informes. Esquemas geográficos te permiten visualizar información que tiene una referencia territorial: a países, regiones, ciudades. Los datos se pueden mostrar diferentes caminos: en forma de texto, histograma, color, imagen, círculos de varios diámetros y colores, gráficos circulares. Esto le permite mostrar, por ejemplo, los volúmenes de ventas por región en forma gráfica. El usuario puede cambiar la escala del diagrama mostrado, obtener transcripciones haciendo clic en los objetos del diagrama e incluso crear nuevos diagramas geográficos. Un mapa geográfico también se puede usar simplemente para mostrar ciertos datos geográficos, como indicaciones para llegar a una oficina o la ruta de un vehículo. Procesamiento de datos. Estos mecanismos permiten identificar patrones no evidentes que suelen estar ocultos tras grandes cantidades de información. Utiliza métodos complementarios de descubrimiento de conocimiento que han recibido la mayor distribución comercial en la práctica mundial: agrupamiento (agrupación de objetos relativamente similares), búsqueda de asociación (búsqueda de combinaciones estables de eventos y objetos) y árbol de decisión (construcción de una jerarquía causal de condiciones que conducen a ciertas situaciones). decisiones). Consola de consultas y Consola de informes. Ambas consolas no forman parte de la plataforma tecnológica, sino que son informes externos que se pueden ejecutar en cualquier solución de aplicación. Ayudan a un desarrollador o a un usuario experimentado, respectivamente, a redactar el texto de una consulta y analizar sus resultados o elaborar un informe arbitrario.

Motor de predicción y análisis de datos- este es uno de los mecanismos para la formación de informes económicos y analíticos. Brinda a los usuarios (economistas, analistas, etc.) la capacidad de buscar patrones no obvios en los datos acumulados en la base de información. Este mecanismo permite:

  • buscar patrones en los datos iniciales de la base de datos;
  • gestionar los parámetros del análisis que se está realizando tanto de forma programática como interactiva;
  • proporcionar acceso programático al resultado del análisis;
  • mostrar automáticamente el resultado del análisis en un documento de hoja de cálculo;
  • cree modelos de pronóstico que le permitan predecir automáticamente eventos posteriores o los valores de ciertas características de nuevos objetos.

El mecanismo de análisis de datos es un conjunto de objetos del lenguaje incorporado que interactúan entre sí, lo que permite al desarrollador utilizar sus partes constituyentes en cualquier combinación en cualquier solución de aplicación. Los objetos incorporados facilitan la organización de la configuración interactiva de los parámetros de análisis por parte del usuario y también le permiten mostrar el resultado del análisis en una forma conveniente para mostrar en un documento de hoja de cálculo.

El mecanismo permite trabajar tanto con datos recibidos de la infobase como con datos recibidos de una fuente externa, previamente cargados en una tabla de valores o en un documento de hoja de cálculo:

Aplicando uno de los tipos de análisis a los datos de origen, puede obtener el resultado del análisis. El resultado del análisis es un determinado modelo de comportamiento de los datos. El resultado del análisis puede mostrarse en el documento final o guardarse para su uso posterior.

El uso adicional del resultado del análisis es que, sobre su base, se puede crear un modelo de pronóstico que permita predecir el comportamiento de nuevos datos de acuerdo con el modelo existente.

Por ejemplo, puede analizar qué artículos se compran juntos (en la misma factura) y almacenar el resultado de este análisis en una base de datos. En el futuro, al crear la próxima factura, en función del resultado del análisis guardado, puede crear un modelo de pronóstico, enviarle los nuevos datos contenidos en esta factura como entrada y recibir un pronóstico en la salida: una lista de bienes que contraparte Petrov BS también es probable que adquiera si se le ofrecen:

Se implementan varios tipos de análisis de datos en el motor de pronóstico y análisis de datos:

Tipos de análisis implementados

Estadísticas Generales

Es un mecanismo para recopilar información sobre los datos en la muestra de estudio. Este tipo de análisis está destinado a un estudio preliminar de la fuente de datos analizada.

El análisis muestra una serie de características de los campos continuos y discretos. Los campos continuos contienen tipos como Número, fecha de. Para otros tipos, se utilizan campos discretos.Cuando se envía un informe a un documento de hoja de cálculo, se rellenan gráficos circulares para mostrar la composición de los campos.

Búsqueda de asociaciones

Este tipo de análisis busca grupos de objetos o valores característicos que ocurren con frecuencia, y también busca reglas de asociación. La búsqueda por asociación se puede utilizar, por ejemplo, para identificar bienes o servicios que se compran juntos con frecuencia:

Este tipo de análisis puede trabajar con datos jerárquicos, lo que permite, por ejemplo, encontrar reglas no solo para productos específicos, sino también para sus grupos. Una característica importante de este tipo de análisis es la capacidad de trabajar tanto con una fuente de datos de objetos, en la que cada columna contiene alguna característica del objeto, como con una fuente de eventos, donde las características del objeto se encuentran en una columna.

Para facilitar la percepción del resultado, se proporciona un mecanismo para cortar reglas redundantes.

Búsqueda de secuencia

El tipo de análisis de búsqueda de secuencias le permite identificar cadenas secuenciales de eventos en la fuente de datos. Por ejemplo, podría ser una cadena de bienes o servicios que los clientes suelen comprar en sucesión:

Este tipo de análisis le permite buscar a través de la jerarquía, lo que hace posible rastrear no solo las secuencias de eventos específicos, sino también las secuencias de los grupos principales.

Un conjunto de parámetros de análisis permite al especialista limitar las distancias de tiempo entre los elementos de las secuencias deseadas, así como ajustar la precisión de los resultados.

análisis de conglomerados

El análisis de conglomerados le permite dividir el conjunto inicial de objetos bajo estudio en grupos de objetos, de modo que cada objeto sea más similar a los objetos de su grupo que a los objetos de otros grupos. Al analizar en el futuro los grupos resultantes, llamados grupos, puede determinar qué caracteriza a un grupo en particular, tomar una decisión sobre los métodos de trabajo con objetos de diferentes grupos. Por ejemplo, utilizando el análisis de conglomerados, puede dividir a los clientes con los que trabaja la empresa en grupos para aplicar diferentes estrategias a la hora de trabajar con ellos:

Usando los parámetros del análisis de conglomerados, el analista puede configurar el algoritmo mediante el cual se realizará la partición y también puede cambiar dinámicamente la composición de las características que se tienen en cuenta en el análisis, configurar factores de ponderación para ellas.

El resultado de la agrupación se puede mostrar en un dendrograma, un objeto especial diseñado para mostrar relaciones secuenciales entre objetos.

árbol de decisión

El tipo de análisis de árbol de decisión le permite construir una estructura jerárquica de reglas de clasificación, presentadas en forma de árbol.

Para crear un árbol de decisiones, debe seleccionar el atributo de destino que se utilizará para crear el clasificador y una serie de atributos de entrada que se utilizarán para crear reglas. El atributo de destino puede contener, por ejemplo, información sobre si el cliente cambió a otro proveedor de servicios, si la transacción fue exitosa, si el trabajo se hizo bien, etc. Los atributos de entrada, por ejemplo, pueden ser la edad de un empleado, su experiencia laboral, la situación financiera del cliente, el número de empleados en la empresa, etc.

El resultado del análisis se representa como un árbol, cada nodo del cual contiene una determinada condición. Para decidir a qué clase debe asignarse un determinado objeto nuevo, es necesario, respondiendo las preguntas en los nodos, recorrer la cadena desde la raíz hasta la hoja del árbol, pasando a los nodos hijos en caso afirmativo respuesta y al nodo vecino en caso de negativa.

Un conjunto de parámetros de análisis le permite ajustar la precisión del árbol resultante:

Modelos de pronóstico

Los modelos de pronóstico creados por el motor son objetos especiales que se crean a partir del resultado del análisis de datos y le permiten realizar automáticamente un pronóstico para nuevos datos en el futuro.

Por ejemplo, un modelo de predicción de búsqueda de asociación integrado en el análisis de las compras de los clientes se puede utilizar cuando se trabaja con un cliente comprador para ofrecerle productos que comprará con cierto grado de probabilidad junto con los productos que ha elegido.

Modernas tecnologías de la información/3. Software

Doctor. Zhunusov K. M.

Universidad Estatal de Kostanay nombrada en honor a A. Baitursynov

Formación de mecanismos para el análisis de datos y pronósticos.

en la plataforma 1C: Empresa

La base del proceso de pronóstico es el desarrollo de un pronóstico económico. Es un juicio con base científica sobre los posibles estados del objeto en el futuro o sobre formas y términos alternativos para lograr estos estados. En otras palabras, es un intento de mirar hacia el futuro, de predecirlo, de prever el estado del objeto en estudio después de un cierto período de tiempo.

La previsión está íntimamente relacionada con la planificación. En los círculos científicos es bastante común el aforismo: "Un pronóstico sin plan es una empresa literaria, un plan sin pronóstico es una acción administrativa".

Los métodos comunes, tanto para la previsión como para la planificación, son los métodos analítico-computacional, estadístico-económico y el modelado matemático-económico.

Los mecanismos de análisis y pronóstico de datos como parte de 1C Enterprise brindan a los usuarios (economistas, analistas, etc.) la capacidad de buscar patrones no obvios en los datos acumulados en la base de información y le permite realizar las siguientes operaciones:

Busque patrones en los datos iniciales de la base de datos;

Gestión de los parámetros del análisis que se está realizando tanto de forma programática como interactiva;

Acceso programático al resultado del análisis;

Salida automática del resultado del análisis a un documento de hoja de cálculo;

Creación de modelos de previsión que permiten la previsión automática de eventos o valores posteriores de determinadas características de nuevos objetos.

Los mecanismos para el análisis y la previsión de datos son un conjunto de objetos del lenguaje integrado que interactúan entre sí, lo que permite al desarrollador utilizar sus componentes en cualquier combinación en cualquier solución de aplicación. Los objetos incorporados facilitan la organización de la configuración interactiva de los parámetros de análisis por parte del usuario, así como la visualización del resultado del análisis en una forma conveniente para mostrar en un documento de hoja de cálculo, de acuerdo con la Figura 1. También es importante que el mecanismo pueda trabajar con datos obtenidos tanto de la base de datos 1C como de fuentes externas (en este último caso, precargados en una tabla de valores o en un documento de hoja de cálculo).


Figura 1. El esquema general del funcionamiento del mecanismo de análisis de datos y predicción de minería de datos

Al aplicar uno de los tipos de análisis a los datos de origen, puede obtener un resultado que represente un determinado modelo de comportamiento de los datos. El resultado del análisis puede mostrarse en el documento final o guardarse para su uso posterior (sobre esta base, se puede crear un modelo de pronóstico que permita predecir el comportamiento de nuevos datos).

Una de las principales tendencias en el mercado de los sistemas contables y de gestión es el constante aumento de la demanda por el uso de herramientas analíticas de procesamiento de datos que aseguren la adopción de decisiones gerenciales acertadas. Sin embargo, los clientes de hoy ya no están satisfechos con el uso de herramientas tradicionales que le permiten crear una variedad de informes, tablas dinámicas y gráficos basados ​​en indicadores predefinidos y relaciones analizadas manualmente. Las empresas necesitan cada vez más herramientas cualitativamente diferentes que les permitan buscar automáticamente reglas no obvias e identificar patrones desconocidos, lo que hace posible recibirnuevos conocimientos basados ​​en la información acumulada por la empresa y, en ocasiones, tomar decisiones completamente no triviales para mejorar la eficiencia empresarial basadas en métodos de minería de datos.

Literatura:

1 Glushchenko V. V. Pronóstico. - M.: Libro universitario, 2005.

2 Dubrova T. A. Aspectos metodológicos de la previsión de producción los tipos mas importantes productos industriales // Cuestiones de estadística. -2004. -Nº 1.-S. 52-57.

3 Radchenko M.G., Khrustaleva E.Yu. Herramientas para crear aplicaciones 1C:Enterprise 8.2 replicadas. - M.: Editorial "1C-Publishing", 2011.