1c клъстерен анализ. Анализ на данни и прогнозиране. Използване на оформления на текстови документи

Механизмът е представен от набор от обекти на вградения език 1C:Enterprise. Диаграмата на взаимодействие на основните обекти на механизма е показана на фигурата. Настройка на колони за анализ на данни – набор от настройки за колони за анализ на входни данни. За всяка колона се посочва типът на съдържащите се в нея данни, ролята, изпълнявана от колоната, допълнителни настройки , в зависимост от вида на извършения анализ. Параметри за анализ на данни – набор от параметри за извършвания анализ на данни. Съставът на параметрите зависи от вида на анализа. Например, за клъстерен анализ се посочва броят на клъстерите, на които трябва да бъдат разделени оригиналните обекти, вида на измерване на разстоянието между обектите и т.н. Първоначалните данни са източник на данни за анализ. Източникът на данни може да бъде резултат от заявка, област от клетка на документ с електронна таблица или таблица със стойности. Анализаторът е обект, който директно извършва анализ на данни. На обекта се дава източник на данни и се задават параметри. Резултатът от работата на този обект е резултат от анализ на данни, чийто вид зависи от вида на анализа. Резултатът от анализа на данните е специален обект, съдържащ информация за резултата от анализа. Всеки вид анализ има свой собствен резултат. Например резултатът от анализа на данните - дърво на решенията - ще бъде обект от типа DataAnalysisResultDecisionTree. В бъдеще резултатът може да бъде показан в документ с електронна таблица с помощта на инструмента за създаване на отчети за анализ на данни, може да бъде показан чрез програмен достъп до неговото съдържание и може да се използва за създаване на прогнозен модел. Всеки резултат от анализ на данни може да бъде запазен за по-късна употреба. Прогнозният модел е специален обект, който ви позволява да направите прогноза въз основа на входни данни. Видът на модела зависи от вида на анализа на данните. Например, модел, създаден за анализ на данни - търсене на асоциации, ще има типа Модел на прогноза за търсене на асоциации. Източникът на данни за прогнозата се предава на входа на прогнозния модел. Резултатът е таблица със стойности, съдържаща прогнозирани стойности. Пример за прогноза е таблица със стойности, резултат от заявка или област от документ с електронна таблица, съдържащ информация, върху която да се изгради прогноза. Например, за прогнозен модел - търсене на асоциации, изборът може да съдържа списък с продукти в документ за продажба. Резултатът от работата на модела може да препоръча какви продукти все още могат да бъдат предложени на купувача. Настройването на примерни колони е набор от специални обекти, които показват съответствието между колоните на прогнозния модел и колоните на прогнозния пример. Настройка на колони с резултати - позволява ви да контролирате кои колони ще бъдат поставени в таблицата с резултати на прогнозния модел. Резултатът от модела е таблица със стойности, състояща се от колони, както е посочено в настройките на получените колони и съдържаща предвидените данни. Конкретното съдържание се определя от вида на анализа. Конструкторът на отчети за анализ на данни е обект, който ви позволява да показвате отчет за резултата от анализа на данни. В допълнение, конструкторът на отчети предоставя специални обекти за свързване с данни, за да позволи на потребителя интерактивно да управлява параметрите на анализа, да настройва колони за източник на данни, да настройва колони на прогнозен модел и т.н. Видове анализ Механизмът ви позволява да извършвате следните видове анализи:
  • обща статистика
  • Търсене на асоциации
  • Търсене на последователност
  • Дърво на решенията
  • Клъстерен анализ
Механизмът за анализ на данни в 1C 8.2 и 8.3 опростява работата на разработчика при идентифициране на модели въз основа на различни данни. Например, с помощта на този механизъм можете да показвате продукти, които най-често се купуват заедно. Друг пример е изграждането на прогноза за продажби въз основа на исторически данни. Това не е цялата гама от приложения на механизма за анализ на данни в 1C, нека се впуснем в неговите възможности по-подробно. Основни обекти на механизма за анализ на данни в 1C Този механизъм е представен в системата 1C Enterprise от 3 системни обекта:
  • Анализ на данни – обект, който извършва анализ на данни. За него е необходимо да посочите източника на данни и необходимите параметри за анализ.
  • Резултатът от анализа на данни е обект, който е резултат от работа по анализ на данни.
  • Прогнозен модел – създава се въз основа на резултат от анализ на данни. Обектът е последната връзка в механизма за анализ на 1C и генерира таблица със стойности, която съдържа прогнозирани стойности.
Видове анализ на данни 1C 8.3 Системата 1C Enterprise може да използва различни видове анализи, нека ги разгледаме по-подробно.
  1. Обща статистика – Този тип анализ е проста статистическа извадка от източник на данни. Пример за приложение е анализ на продажбите по позиции за период. Резултатът от анализа ще бъде информация за това колко от даден продукт е продаден. Системата ще изчисли и специфични полета - максимум, минимум, медиана, средна стойност, диапазон, стандартно отклонение, брой стойности, брой уникални стойности, режим.
  2. Търсене на асоциации – този тип анализ е предназначен за търсене на комбинации, които често се срещат заедно. Много добър за намиране на артикули, които често се купуват заедно. В резултат на анализа системата ще генерира следната информация: информация за обработваните данни, асоциативни групи, асоциативни правила, по които се сравняват групите.
  3. Търсене на последователности - анализ, който ви позволява да идентифицирате модели в анализираните данни и да предлагате допълнителни прогнози. В резултат на анализа системата ще покаже информация за възможността за настъпване на определени събития в процентно изражение.

Механизмът за анализ и прогнозиране на данни предоставя на потребителите (икономисти, анализатори и др.) възможност да търсят неочевидни модели в данните, натрупани в информационната база. Този механизъм позволява:

  • търсене на модели в изходните данни информационна база;
  • управлява параметрите на анализа, извършен както програмно, така и интерактивно;
  • осигуряват програмен достъп до резултата от анализа;
  • автоматично показва резултата от анализа в документ с електронна таблица;
  • създавайте прогнозни модели, които ви позволяват автоматично да прогнозирате последващи събития или стойностите на определени характеристики на нови обекти.

Механизмът за анализ на данни е набор от вградени езикови обекти, които взаимодействат помежду си, което позволява на разработчика да използва неговите компоненти във всяка комбинация във всяко приложно решение. Вградените обекти улесняват организирането интерактивна настройкапараметри на анализа от потребителя, а също така ви позволяват да покажете резултата от анализа във форма, удобна за показване в документ с електронна таблица.

Механизмът ви позволява да работите както с данни, получени от информационната база, така и с данни, получени от външен източник, предварително заредени в таблица със стойности или документ с електронна таблица:

Като приложите един от видовете анализ към изходните данни, можете да получите резултата от анализа. Резултатът от анализа представлява определен модел на поведение на данните. Резултатът от анализа може да бъде показан в крайния документ или запазен за бъдеща употреба.

По-нататъшното използване на резултата от анализа е, че на негова основа може да се създаде прогнозен модел, който позволява да се предвиди поведението на нови данни в съответствие със съществуващия модел.

Например, можете да анализирате кои продукти са закупени заедно (в една фактура) и да запазите този резултат от анализа в базата данни. По-късно, при създаване на следващата фактура:

Въз основа на запаметения резултат от анализа можете да изградите прогнозен модел, да го подадете „вход“ с новите данни, съдържащи се в тази фактура, и „изход“ да получите прогноза - списък на стоките, които контрагентът Б. С. Петров. Освен това най-вероятно ще ги придобие, ако му бъдат предложени:

Машината за анализ на данни и прогнозиране прилага няколко вида анализ на данни:

Внедрени типове анализи

обща статистика

Това е механизъм за събиране на информация за данните в изследваната проба. Този тип анализ е предназначен за предварително проучване на източника на данни, който се анализира.

Анализът разкрива редица характеристики на числови и непрекъснати полета. При извеждане на отчет в документ с електронна таблица кръговите диаграми се попълват, за да се покаже съставът на полетата.

Търсене на асоциации

Този тип анализ търси често срещани групи от обекти или характерни стойности заедно, а също така търси правила за асоцииране. Търсенето на асоциации може да се използва, например, за да се определят заедно често купуваните стоки или услуги:

Този тип анализ може да работи с йерархични данни, което позволява например да се намерят правила не само за конкретни продукти, но и за техните групи. Важна характеристика на този тип анализ е възможността за работа както с обектен източник на данни, в който всяка колона съдържа някаква характеристика на обекта, така и с източник на събитие, където характеристиките на обекта са разположени в една колона.

За по-лесно възприемане на резултата е предвиден механизъм за прекъсване на излишните правила.

Търсене на последователност

Типът анализ на търсене на последователност ви позволява да идентифицирате последователни вериги от събития в източник на данни. Например, това може да е верига от стоки или услуги, които клиентите често купуват последователно:

Този тип анализ позволява йерархично търсене, което прави възможно проследяването не само на последователностите от конкретни събития, но и на последователностите на родителските групи.

Набор от параметри за анализ позволява на специалиста да ограничи времевите разстояния между елементите на търсените последователности, както и да коригира точността на получените резултати.

Клъстерен анализ

Клъстерният анализ ви позволява да разделите оригиналния набор от изследвани обекти на групи от обекти, така че всеки обект да е по-сходен с обекти от своята група, отколкото с обекти от други групи. Чрез по-нататъшен анализ на получените групи, наречени клъстери, можете да определите как се характеризира тази или онази група и да изберете методи за работа с обекти от различни групи. Например, използвайки клъстерен анализ, можете да разделите клиентите, с които компанията работи, на групи, за да приложите различни стратегии при работа с тях:

Използвайки параметрите на клъстерния анализ, анализаторът може да конфигурира алгоритъма, чрез който ще се извърши разделянето, а също така може динамично да променя състава на характеристиките, взети предвид в анализа, и да конфигурира тегловни коефициенти за тях.

Резултатът от клъстерирането може да се покаже в дендрограма - специален обект, предназначен да показва последователни връзки между обекти.

Дърво на решенията

Типът анализ на дървото на решенията ви позволява да изградите йерархична структура от класифициращи правила, представени под формата на дърво.

За да изградите дърво на решенията, трябва да изберете целеви атрибут, върху който ще бъде изграден класификаторът, и редица входни атрибути, които ще се използват за създаване на правила. Целевият атрибут може да съдържа например информация дали клиентът е преминал към друг доставчик на услуги, дали транзакцията е била успешна, дали работата е свършена добре и т.н. Входни атрибути, например, могат да бъдат възрастта на служителя, неговият трудов стаж, финансовото състояние на клиента, броят на служителите в компанията и др.

Резултатът от анализа се представя под формата на дърво, всеки възел от което съдържа определено условие. Да реши към коя класа трябва да принадлежи даден човек нов обект, е необходимо, когато отговаряте на въпроси във възли, да преминете през верига от корена до лист на дървото, като се придвижвате към дъщерни възли в случай на утвърдителен отговор и към съседен възел в случай на отрицателен отговор.

Набор от параметри за анализ ви позволява да регулирате точността на полученото дърво:

Прогнозни модели

Прогнозните модели, създадени от механизма, са специални обекти, които се създават от резултата от анализ на данни и ви позволяват автоматично да извършвате прогноза за нови данни в бъдеще.

Например, прогнозен модел за търсене на асоциации, изграден чрез анализиране на покупките на клиенти, може да се използва, когато се работи с купувач, за да му се предложат стоки, които е вероятно да закупи заедно със стоките, които е избрал.

Използване на механизма за анализ на данни в приложни решения

За да запознаят разработчиците на приложни решения с механизма за анализ на данни, на диска „Информационна и технологична поддръжка“ (ITS) е поставена демонстрационна информационна база. Той включва универсална обработка „Конзола за анализ на данни“, която ви позволява да извършвате анализ на данни във всяко решение за приложение, без да променяте конфигурацията.

Една от основните тенденции на пазара на счетоводни и управленски системи е постоянното нарастване на търсенето на използване на инструменти за аналитична обработка на данни, които осигуряват вземане на информирани решения. Ето защо една от стратегическите насоки за развитие на софтуерната система 1C:Enterprise се превърна в постоянното разширяване на възможностите за икономическа и аналитична отчетност. Днешните клиенти обаче вече не са доволни от традиционните инструменти, които им позволяват да генерират различни отчети, обобщени таблици и диаграми, които се създават въз основа на предварително дефинирани индикатори и връзки и които трябва да бъдат анализирани ръчно. Предприятията все повече се нуждаят от качествено различни инструменти, които им позволяват автоматично да търсят неочевидни правила и да идентифицират неизвестни модели (фиг. 1). Ето как можете да генерирате качествено нови знания на базата на натрупаната от компанията информация и понякога да вземате напълно нетривиални решения за подобряване на бизнес ефективността, използвайки методите за извличане на данни (DAM).
Ориз. 1. Логиката на развитие на „интелигентността“ на решени аналитични проблеми. Издадена през лятото на 2003 г нова версияТехнологичната платформа "1C:Enterprise 8.0" направи възможно значително разширяване на възможностите на бизнес анализите в системата (виж страничната лента). Тук обаче трябва да се направи една важна забележка. Софтуерът на платформата 1C се развива не само на „стъпки“, от версия на версия, но непрекъснато се подобрява и разширява в рамките на една версия и в две посоки - технологична и приложна. И така, след първото обявяване на G8 вече бяха пуснати повече от дузина версии на платформата, последна версия (от януари 2006 г.) е с номер 8.0.13 и е доста по-различен от това, което беше преди две години и половина! Една от областите на развитие на "1C:Enterprise 8.0" са именно механизмите за бизнес анализи; по-специално IAD инструментите се появиха в него едва през 2005 г. Важно е да се отбележи, че повечето функции за анализ се изпълняват на ниво технологична платформа и стават достъпни за потребителите само след включване в нови версии на приложни решения. Следователно има известна празнина (понякога няколко месеца) между появата на нови функции и предоставянето им на потребителите. Имайки предвид този проблем, за да преодолее празнината, 1C пусна през септември 2005 г. специално решение за приложение „Data Analysis Subsystem“ (DAS), което може да бъде вградено във всяка конфигурация на платформата 1C:Enterprise 8.0. В допълнение към широк набор от основни функции, пакетът включва повече от 30 предварително конфигурирани модела за типична конфигурация за управление на търговията. PAD включва онези качествено нови IAD инструменти, които преди това отсъстваха от програмите 1C. За директен анализ и прогнозиране на данни не са необходими специфични умения и знания. Предполага се добро владеене на анализираната предметна област и разбиране на основните причинно-следствени връзки в нея. Подготовката на източници на данни и предсказуеми модели изисква способността да се използва конструкторът на заявки и знания как да се постави информация в обекти на метаданни за конфигурация. Алгоритмите на IAD, включени в новата конфигурация (версия 1.0.5), формират аналитични модели (шаблони), които описват модели в изходните данни. Тези модели са с независима стойност (могат да се използват многократно), а също така се използват за автоматизирано генериране на прогнози, включително сценарни, с предварително неизвестни показатели (фиг. 2). Механизмът IAD е набор от вградени езикови обекти, които взаимодействат помежду си, благодарение на което разработчикът може да използва неговите компоненти във всяка комбинация във всяко приложно решение. Вградените обекти улесняват организирането на интерактивна конфигурация на параметрите на анализа от потребителя, както и показване на резултата от анализа в лесна за показване форма в документ с електронна таблица. Като приложите един тип анализ към изходните данни, можете да получите резултат, който ще представлява определен модел на поведение на данните. Резултатът от анализа може да бъде показан в окончателния документ или запазен за по-късна употреба - въз основа на него можете да създадете прогнозен модел, който ви позволява да предвидите поведението на новите данни.
Ориз. 2. Обща схемафункционирането на механизма за извличане на данни. Текущата версия на подсистемата прилага методите, които са получили най-голямо търговско разпространение в световната практика, а именно:

  • клъстеризация - реализира групиране на обекти, максимизирайки вътрешногруповото сходство и междугруповите различия;
  • дърво на решенията - осигурява изграждането на причинно-следствена йерархия от условия, водещи до определени решения;
  • търсене на асоциации - търси устойчиви комбинации от елементи в събития или обекти.
По-долу ще разгледаме по-отблизо същността и възможностите практическо приложениетези IAD методи.

Клъстеризиране

Целта на клъстерирането е да се избере от набор от обекти от едно и също естество определен брой относително хомогенни групи (сегменти или клъстери). Обектите се разпределят в групи по такъв начин, че вътрешногруповите разлики да са минимални, а междугруповите да са максимални (фиг. 3). Методите за клъстериране позволяват да се премине от обект по обект към групово представяне на колекция от произволни обекти, което значително опростява тяхната работа. По-долу са описани няколко възможни сценария за използване на клъстеризиране на практика. Сегментиране на клиентитевъз основа на определен набор от параметри, той позволява да се идентифицират стабилни групи сред тях, които имат сходни предпочитания за покупка, нива на продажби и платежоспособност, което значително опростява управлението на взаимоотношенията с клиентите. При класификация на стокитеМного често се използват доста конвенционални принципи на класификация. Изолирането на сегменти въз основа на група от формални критерии дава възможност да се идентифицират наистина хомогенни групи стоки. В контекста на широка и доста разнородна продуктова гама, управлението на асортимента на ниво сегмент, в сравнение с управлението на ниво продукт, значително повишава ефективността на промоцията, ценообразуването, мърчандайзинга и управлението на веригата за доставки. Мениджърско сегментираневи позволява по-ефективно да планирате организационни промени, да подобрите мотивационните схеми, да коригирате изискванията за наетия персонал, което в крайна сметка ви позволява да увеличите управляемостта на компанията и стабилността на бизнеса като цяло.
Ориз. 3. Анализ на данни чрез клъстерен метод. Приликата и разликата между обектите се определя от "разстоянието" между тях в пространството на факторите. Методът за измерване на разстоянието зависи от метриката, която показва принципа за определяне на приликата/разликата между пробните обекти. Текущата реализация поддържа следните показатели:
  • „Евклидова метрика“ е стандартното разстояние между две точки в N-мерното евклидово атрибутно пространство;
  • “Евклидова метрика на квадрат” - засилва влиянието на разликата (разстоянието) върху резултата от групирането;
  • "city metric" - намалява влиянието на емисиите;
  • „метрика на доминиране“ - определя разликата между примерните обекти като максималната съществуваща разлика между стойностите на техните атрибути, следователно е полезно за подобряване на разликите между обектите за един атрибут.
Методът за формиране на клъстери въз основа на информация за разстоянието между клъстерираните обекти се определя от метода на клъстериране. Текущата версия на 1C:Enterprise 8.0 реализира следните методи за групиране:
  • „комуникация на къси разстояния“ - обектът се присъединява към групата, за която разстоянието до най-близкия обект е минимално;
  • „комуникация на дълги разстояния“ - обектът се присъединява към групата, за която разстоянието до най-отдалечения обект е минимално;
  • „център на тежестта“ - обектът се присъединява към групата, за която разстоянието до центъра на клъстера е минимално;
  • метод "k-средни" - избират се произволни обекти, които се считат за клъстерни центрове, след което всички анализирани обекти се сортират последователно и се присъединяват към най-близкия до тях клъстер. След закрепването на обекта се изчислява нов центърклъстер, който се изчислява като средната стойност на атрибутите на всички обекти, включени в клъстера. Процедурата се повтаря, докато центровете на клъстерите се сменят.
Всеки от методите за клъстериране, внедрен в платформата, изисква изрично посочване на броя на необходимите клъстери. Можете да въведете тегла за атрибутите на обекта, което ви позволява да ги приоритизирате. В резултат на анализ чрез клъстериране се получават следните данни:
  • клъстерни центрове, които са набор от осреднени стойности на входните колони във всеки клъстер;
  • таблица на междукластерните разстояния (разстояния между центровете на клъстерите), които определят степента на разлика между тях;
  • стойности на прогнозни колони за всеки клъстер;
  • рейтинг на факторите и дърво на условията, които определят разпределението на обектите в клъстери.
Алгоритмите за групиране позволяват не само клъстерен анализобекти на набор от дадени атрибути, но също така и за прогнозиране на стойността на един или повече от тях за текущата извадка въз основа на присвояването на обекти в тази извадка на определен клъстер.

Търсене на асоциации

Този метод е предназначен да идентифицира стабилни комбинации от елементи в определени събития или обекти. Резултатите от анализа се представят под формата на групи от свързани елементи. Тук, в допълнение към идентифицираните стабилни комбинации от елементи, са предоставени подробни анализи на свързаните елементи (фиг. 4).
Ориз. 4. Представяне на резултатите от анализа по метода „търсене на асоциации” под формата на групи от асоциирани елементи. Методът първоначално е разработен за намиране на типични комбинации от артикули при покупки, поради което понякога се нарича още анализ на пазарската кошница. В този сценарий свързаните елементи обикновено са продуктови групи или отделни продукти. А групиращият обект, който комбинира елементите на пробите, може да бъде всеки обект на информационната система, който идентифицира транзакцията: например поръчка на купувач, акт за предоставяне на услуги или касова бележка. Информацията за моделите в продуктовите предпочитания на клиентите повишава ефективността на управлението на взаимоотношенията с клиентите (по отношение на рекламни кампании и маркетингови промоции), ценообразуването (формиране на сложни оферти и системи за отстъпки), управление на запасите и мърчандайзинг (дистрибуция на стоки в търговските зони). Друг пример за използване на този метод е да се определят предпочитаните от клиентите комбинации от рекламни канали, за да се избегне дублирането при провеждане на целеви рекламни кампании. Това ви позволява значително да намалите разходите за такива събития. Алгоритъмът за търсене на асоциации, внедрен в платформата, има доста гъвкави средства за контрол на адекватността на моделите за анализ или прогноза. Параметърът „Минимален процент случаи“ определя „прага на задействане“ на алгоритъма за определена комбинация от елементи в събитие или обект, което ви позволява да игнорирате слабо общи асоциации. Параметърът "Минимална надеждност" определя необходимата стабилност на търсените асоциации, а параметърът "Минимална значимост" ви позволява да идентифицирате тези с най-висок приоритет. Параметърът „Тип прекъсване на правилата“ значително улеснява възприемането на резултатите от анализа и прогнозата, които могат да приемат стойностите „Прекъсване на излишните“ и „Прекъсване на тези, обхванати от други правила“. За практическата интерпретация на резултатите, получени с помощта на този алгоритъм, е изключително важно да се раздели първоначалният набор от свързани елементи на групи, които са наистина хомогенни от гледна точка на извършвания анализ.

Дърво на решенията

В резултат на прилагането на този метод към изходните данни се създава йерархична (дървовидна) структура от правила под формата „ако... тогава...“, а алгоритъмът за анализ осигурява идентифицирането на най-значимите условия и преходи между тях на всеки етап. Този алгоритъм се използва най-широко при идентифициране на причинно-следствени връзки в данните и описване на поведенчески модели. Типична област на приложение на дърветата на решенията е оценката на различни рискове, например затваряне на поръчка от клиент или нейното прехвърляне на конкурент, ненавременна доставка на стоки от доставчик или забавено плащане на търговски заем ( Фиг. 5). Типичните входни фактори на модела са сумата и съставът на поръчката, текущото салдо на взаимните разплащания, кредитен лимит, процент на предплащане, условия на доставка и други параметри, характеризиращи прогнозния обект. Адекватната оценка на риска гарантира вземането на информирани решения за оптимизиране на съотношението възвръщаемост/риск на дейностите на компанията и също така е полезна за повишаване на реализма на различни бюджети.

Ориз. 5. Използването на метода на „дървото на решенията” позволява въз основа на входните фактори на модела (а) да се получи оценка на рисковете от приемането на определени управленски решения(б). Пример, илюстриращ способността на алгоритъма да идентифицира причинно-следствените връзки, е задачата за оптимизиране на работата на отдела по продажбите. За да го решим, ще изберем индикатор за ефективността на мениджърите по продажбите, например специфична рентабилност на клиент, като прогнозирана стойност, а като фактори - набор от данни, които потенциално влияят на резултата. Алгоритъмът ще определи факторите, които имат най-голямо влияние върху резултата, както и типичните комбинации от условия, водещи до определен резултат. Освен това подсистемата „Анализ на данни“ ще ви позволи да оцените (предскажете) очакваните стойности мишенавъз основа на текущи данни, а също така да направи прогноза „какво ще стане, ако...“ чрез промяна на индикаторите, предоставени на входа на модела. Резултатите от анализа и прогнозата с помощта на дървета на решенията позволяват значително да се намали влиянието на несигурността на бизнес средата върху състоянието на компанията, както и да се вземе решение широк обхватзадачи, свързани с установяване на сложни и неочевидни причинно-следствени връзки. Алгоритъмът на дървото на решенията формира причинно-следствена йерархия от условия, водещи до определени решения. В резултат на прилагането на този метод към обучителната извадка се създава йерархична (дървовидна) структура от правила за разделяне от типа „ако... то...”. Алгоритъмът за анализ (обучение на модел) се свежда до итеративен процес на идентифициране на най-значимите условия и преходи между тях. Условията могат да бъдат както количествени, така и качествени по природа и да формират „клоните“ на това абстрактно дърво. Неговата „листина“ се формира от стойностите на прогнозирания атрибут (решение), които, подобно на условията на преход, позволяват както качествена, така и количествена интерпретация. Комбинацията от тези условия, наложени на факторите, и структурата на преходите между тях до окончателното решение формират прогнозния модел. Този алгоритъм е най-разпространен при оценката на резултатите от различни вериги от събития и идентифициране на причинно-следствени връзки в проби. Значимостта и надеждността на модела на този алгоритъм се контролира с помощта на параметрите „Тип опростяване“, „Максимална дълбочина на дървото“ и „Минимален брой елементи във възел“. Резултатите от анализа на пробите с помощта на алгоритъма „Дърво на решенията“ са:

  • рейтинг на факторите, който е списък с фактори, повлияли на решението, сортирани в низходящ ред по важност („цитати“ в дървовидни възли);
  • сравнение на решенията (стойностите на прогнозната колона) и условията, които ги определят, с други думи, дървото „Ефект-причина“;
  • Дърво „причина-следствие“, което е набор от преходи между условия, които определят конкретно решение (по същество визуално представяне на прогнозния модел).
Съвместни решения "1C"

В допълнение към функциите, внедрени директно в рамките на платформата 1C:Enterprise 8.0, арсеналът от инструменти за бизнес анализ на 1C се попълва със специализирани решения, създадени, наред с други неща, в рамките на проекта 1C-Joint (http:// v8.1c.ru/ решения) - с участието на партньори на компанията и независими разработчици (вижте "Съвместни решения на 1C и нейните партньори", "BYTE / Русия" № 9 "2005 г.) Тук отбелязваме два продукта, свързани с използването на интелигентни методи за анализ - Това е "1C:Enterprise 8.0. 1C-VIP Anatech: ABIS. ABC. Управленско счетоводство и изчисляване на разходите" (партньор разработчик - консултантска фирма"VIP Anatech") и "1C-VIP Anatech-VDGB: ABIS. BSC. Balanced Scorecard" (разработващи партньори - компании "VIP Anatech" и VDGB).

Типични бизнес сценарии за използване на IAD методи

Документацията на PAD има раздел, посветен на типични примериприложение на извличане на данни във връзка с конфигурацията "1C: Управление на търговията 8.0." Тук представяме няколко такива бизнес сценария.

Управление на взаимоотношенията с клиенти

Сценарий "Планиране" рекламна кампания" Планирането на предстоящата рекламна кампания се разглежда от гледна точка на оптимизиране на разпределението на заделения бюджет между рекламните канали, въз основа на регионални, продуктови, клиентски и други показатели на целевия сегмент, както и на ефективността на рекламните канали в определени участъци в някой предишен планиран период. Алгоритъм– „Клъстерен анализ”. Атрибути на прогнозата- делът на отговорите на рекламния канал на условно хомогенни сегменти, идентифицирани от алгоритъма. Изчислени колони- делът на рекламните канали в бюджета на рекламната кампания, като се вземе предвид вероятният дял от отговорите и ефективността (по отношение на получените приходи) на всеки рекламен канал. Пример за модел:Клиентите от клас А от регион P, които предпочитат продуктова група P, са привлечени от същия рекламен канал като клиентите от регион N, които предпочитат продуктова група Y.

Управление на веригата за доставки

Сценарий "Оптимизиране на избора на доставчик по продуктова група"Избор на доминиращи доставчици от първа линия за ключови продуктови групие изключително важно за стабилизиране на логистичната система в частност и цялостната система за управление на веригата за доставки като цяло, както и за намаляване на средната продължителност на веригите за доставки. От друга страна, по-тясната интеграция с основните доставчици обикновено позволява значително намаляване на цената на стоките. В тази връзка е интересно да се анализират стабилни комбинации от доставчици в различни продуктови групи в сравнение с анализи за доставчици, асоциирани в рамките на групите. Това ви позволява да идентифицирате „пресечните точки“ на доставчици в различни продуктови групи и да оптимизирате взаимоотношенията с тях. Алгоритъм- "Търсене на асоциации." Атрибути на прогнозата- устойчиви комбинации от доставчици. Основни фактори- продуктови групи. Декодиране- анализ на доставчиците (обем на покупките, приходи, условия на доставка и плащане, срокове за изпълнение на поръчките - песимистични, оптимистични, средни). Пример за модел:стабилна асоциация на голям и непредсказуем доставчик А и предвидим средно голям доставчик Б в голям брой продуктови групи. Когато се правят поръчки за конкурентни продуктови групи, е възможно да се позиционира среден доставчик като основен, ако обемът на поръчката за голям не надвишава определен праг (което дава значителна печалба в мащаба).

Управление на персонала

Сценарий: Профилиране на мениджърите по продажбите по ключови показатели за ефективностОпределянето на ефективността на мениджърите (задържане, търсене на клиенти, ефективност на комуникацията, събиране на условни и безусловни вземания, специфични показатели за изпълнение на клиент и др.) представлява интерес не само от гледна точка на създаване на система за материално стимулиране на мениджърите, но и от гледна точка на ефективни стандартизационни параметри на тяхната дейност. Алгоритъм- "Дървета на решенията". Атрибути на прогнозата- ключови показатели за ефективност на отдела за продажби (брой ключови клиенти, нива на отлив и придобиване, пропуснати приходи на месец, привлечени приходи на месец, приходи на месец на клиент, общи приходи от клиенти и др.). Основни фактори- брой активни клиенти, приходи, приходи, специфични показатели за клиент, комуникационна ефективност. В зависимост от предсказуемите атрибути съставът на факторите може да варира значително. Пример за модел:мениджъри, които осигуряват най-добри показатели за събиране на вземания (съотношение на приходите от DS към приходите), имат коефициент на задържане > 0,8; коефициент на привличане > 0,25; броят на едновременно отворените сделки е не повече от 15, но не по-малко от 10; интензивността на събитията на ден е не повече от 10, но не по-малко от 3; броят на активните клиенти за периода е минимум 50, но не повече от 100.

Заключение

Съвременният бизнес е толкова многостранен, че факторите, които потенциално могат да повлияят на дадено решение, могат да бъдат десетки. Конкуренцията нараства от ден на ден, жизнен цикълпродуктите стават по-кратки, предпочитанията на клиентите се променят все по-бързо и по-бързо. За да се развива бизнес, е необходимо да се реагира възможно най-динамично на бързо променящата се бизнес среда, като се вземат предвид фините и понякога неуловими модели на развитие. Кои групи клиенти ще отговорят на промоцията и кои безвъзвратно ще отидат при конкурентите? Трябва ли да отворя нова бизнес линия или да отложа засега? Ще закъснее ли купувачът с плащането или доставчикът с доставката? Какви са възможностите за растеж и къде са потенциалните заплахи? Хиляди мениджъри всеки ден си задават тези въпроси на себе си и на своите колеги. Подсистемата за анализ на данни, внедрена в платформата 1C:Enterprise 8.0, е предназначена да помогне на потребителите на корпоративната информационна система бързо да намерят отговори на нетривиални въпроси, осигурявайки автоматизирана трансформация на данни, натрупани в информационна система, в практични и добре интерпретируеми модели.

Икономическа и аналитична отчетност в "1C:Enterprise 8.0"

Платформата 1C:Enterprise 8.0 включва редица механизми за генериране на икономически и аналитични отчети, които ви позволяват да генерирате интерактивни документи (и не само печатни форми) в рамките на определени приложни решения. По този начин потребителят може да работи с отчети по същия начин, както с всяка екранна форма, включително промяна на параметрите на отчета, повторно изграждане, използване на „декодиране“ (получаване на допълнителни отчети въз основа на отделни елементи от вече генериран отчет) и т.н. В допълнение, има няколко универсални софтуерни инструмента, които ви позволяват да генерирате произволни отчети в зависимост от задачите. Това може да бъде направено и от самите потребители (с достатъчно опит), които са добре запознати със структурата на използваното приложно решение. По-долу ще разгледаме накратко основните инструменти за отчитане в 1C:Enterprise 8.0. Заявки- това е един от начините за достъп до данни в "1C:Enterprise 8.0", с помощта на който информацията се извлича от базата данни според определени условия, обикновено в комбинация с най-простата обработка на получените данни: група, сортиране, изчисли. Промяната на данни с помощта на заявки е невъзможна, тъй като те първоначално са били предназначени за бързо получаване на информация от големи количества информация. Базата данни е реализирана като набор от взаимосвързани таблици, които могат да бъдат достъпни поотделно или няколко таблици заедно. За да реализира собствените си алгоритми, разработчикът може да използва език за заявки, базиран на SQL и съдържащ много разширения, които отразяват спецификата на финансовите и икономически проблеми и намаляват усилията, изразходвани за създаване на приложни решения. Платформата включва дизайнер на заявки, който ви позволява да съставите правилния текст на заявката, като използвате само визуални инструменти (фиг. 6).

Ориз. 6. Създателят на заявки (a) позволява на разработчика да състави текста на заявката (b) изключително чрез визуални средства. документ с електронна таблицае мощен механизъм за визуализиране и редактиране на информация, включително използване на динамично четене на информация от база данни. Документ с електронна таблица може да се използва самостоятелно или да бъде част от който и да е от формулярите, използвани в приложното решение. В основата си той прилича на електронна таблица (състои се от редове и колони, в които се съхраняват данни), но възможностите му са много по-широки. Поддържа операции за групиране, декриптиране и анотиране. В документ, който можете да използвате различни видоведизайн на отчет, включително графични диаграми. Един табличен документ може да съдържа обобщени таблици, които сами по себе си служат като ефективен инструмент за програмно и интерактивно представяне на многоизмерни данни. Конструктор на изходна формапомага на разработчика да създава отчети и да представя отчетните данни в удобна таблична или графична форма. Той включва всички функции на дизайнера на заявки, както и създаване и персонализиране на формуляри. Създател на отчетие обект на вградения език, който предоставя възможност за динамично създаване на отчет както програмно, така и интерактивно (фиг. 7). Работата му се основава на заявка, чрез която на потребителя се дава възможност интерактивно да конфигурира всички основни параметри, съдържащи се в текста на заявката. Резултатите от тази заявка се извеждат в документ с електронна таблица, който също може да използва информация от произволни източници на данни. Разработчикът, използвайки командите за създаване на отчети, може да промени параметрите, достъпни за потребителя за конфигуриране.
Ориз. 7. Схема на конструктора на отчети. Географски схемиви позволяват визуално да представяте информация, която има териториална препратка: към държави, региони, градове. На тях могат да се показват данни различни начини: под формата на текст, хистограма, цвят, картина, кръгове с различни диаметри и цветове, кръгови диаграми. Това ви позволява да показвате например обемите на продажбите по региони в графична форма. Потребителят може да променя мащаба на показаната диаграма, да получава преписи, когато щрака върху обектите на диаграмата и дори да създава нови географски диаграми. Географската диаграма може да се използва и просто за показване на конкретни географски данни, като упътвания за шофиране до офис или маршрут на превозно средство. Извличане на данни.Тези механизми позволяват да се идентифицират неочевидни модели, които обикновено са скрити зад големи количества информация. Тук използваме допълващи се методи за откриване на знания, които са получили най-голямо комерсиално разпространение в световната практика: групиране (групиране на относително подобни обекти), търсене на асоциации (търсене на стабилни комбинации от събития и обекти) и дърво на решенията (изграждане на причина-и -ефект йерархия от условия водещи до определени решения). Конзола за заявки и конзола за отчети.И двете конзоли не са част от технологичната платформа, а са външни отчети, които могат да се изпълняват във всяко приложно решение. Те помагат на програмист или опитен потребител да състави текст на заявка и да анализира нейните резултати или да генерира персонализиран отчет.

Механизъм за анализ на данни и прогнозиране- това е един от механизмите за генериране на икономическа и аналитична отчетност. Той предоставя на потребителите (икономисти, анализатори и др.) възможност да търсят неочевидни модели в данните, натрупани в информационната база. Този механизъм позволява:

  • търсене на закономерности в изходните данни на информационната база;
  • управлява параметрите на анализа, извършен както програмно, така и интерактивно;
  • осигуряват програмен достъп до резултата от анализа;
  • автоматично показва резултата от анализа в документ с електронна таблица;
  • създавайте прогнозни модели, които ви позволяват автоматично да прогнозирате последващи събития или стойностите на определени характеристики на нови обекти.

Механизмът за анализ на данни е набор от вградени езикови обекти, които взаимодействат помежду си, което позволява на разработчика да използва неговите компоненти във всяка комбинация във всяко приложно решение. Вградените обекти улесняват организирането на интерактивна конфигурация на параметрите на анализа от потребителя и също така ви позволяват да покажете резултата от анализа във форма, удобна за показване в документ с електронна таблица.

Механизмът ви позволява да работите както с данни, получени от информационната база, така и с данни, получени от външен източник, предварително заредени в таблица със стойности или документ с електронна таблица:

Като приложите един от видовете анализ към изходните данни, можете да получите резултата от анализа. Резултатът от анализа представлява определен модел на поведение на данните. Резултатът от анализа може да бъде показан в крайния документ или запазен за бъдеща употреба.

По-нататъшното използване на резултата от анализа е, че на негова основа може да се създаде прогнозен модел, който позволява да се предвиди поведението на нови данни в съответствие със съществуващия модел.

Например, можете да анализирате кои продукти са закупени заедно (в една фактура) и да запазите този резултат от анализа в базата данни. В бъдеще, когато създавате следващата фактура въз основа на запаметения резултат от анализа, можете да изградите прогнозен модел, да го подадете на „вход“ с нови данни, съдържащи се в тази фактура, и на „изход“ да получите прогноза - списък със стоки, които контрагент Петров Б.С. Освен това най-вероятно ще ги придобие, ако му бъдат предложени:

Машината за анализ на данни и прогнозиране прилага няколко вида анализ на данни:

Внедрени типове анализи

обща статистика

Това е механизъм за събиране на информация за данните в изследваната проба. Този тип анализ е предназначен за предварително проучване на източника на данни, който се анализира.

Анализът показва редица характеристики на непрекъснати и дискретни полета. Непрекъснатите полета съдържат типове като Номер, дата. За други типове се използват дискретни полета.При извеждане на отчет в документ с електронна таблица се попълват кръгови диаграми, за да се покаже съставът на полетата.

Търсене на асоциации

Този тип анализ търси често срещани групи от обекти или характерни стойности заедно, а също така търси правила за асоцииране. Търсенето на асоциации може да се използва, например, за да се определят заедно често купуваните стоки или услуги:

Този тип анализ може да работи с йерархични данни, което позволява например да се намерят правила не само за конкретни продукти, но и за техните групи. Важна характеристика на този тип анализ е възможността за работа както с обектен източник на данни, в който всяка колона съдържа някаква характеристика на обекта, така и с източник на събитие, където характеристиките на обекта са разположени в една колона.

За по-лесно възприемане на резултата е предвиден механизъм за прекъсване на излишните правила.

Търсене на последователност

Типът анализ на търсене на последователност ви позволява да идентифицирате последователни вериги от събития в източник на данни. Например, това може да е верига от стоки или услуги, които клиентите често купуват последователно:

Този тип анализ позволява йерархично търсене, което прави възможно проследяването не само на последователностите от конкретни събития, но и на последователностите на родителските групи.

Набор от параметри за анализ позволява на специалиста да ограничи времевите разстояния между елементите на търсените последователности, както и да коригира точността на получените резултати.

Клъстерен анализ

Клъстерният анализ ви позволява да разделите оригиналния набор от изследвани обекти на групи от обекти, така че всеки обект да е по-сходен с обекти от своята група, отколкото с обекти от други групи. Чрез по-нататъшен анализ на получените групи, наречени клъстери, можете да определите как се характеризира тази или онази група и да изберете методи за работа с обекти от различни групи. Например, използвайки клъстерен анализ, можете да разделите клиентите, с които компанията работи, на групи, за да приложите различни стратегии при работа с тях:

Използвайки параметрите на клъстерния анализ, анализаторът може да конфигурира алгоритъма, чрез който ще се извърши разделянето, а също така може динамично да променя състава на характеристиките, взети предвид в анализа, и да конфигурира тегловни коефициенти за тях.

Резултатът от клъстерирането може да се покаже в дендрограма - специален обект, предназначен да показва последователни връзки между обекти.

Дърво на решенията

Типът анализ на дървото на решенията ви позволява да изградите йерархична структура от класифициращи правила, представени под формата на дърво.

За да изградите дърво на решенията, трябва да изберете целеви атрибут, върху който ще бъде изграден класификаторът, и редица входни атрибути, които ще се използват за създаване на правила. Целевият атрибут може да съдържа например информация дали клиентът е преминал към друг доставчик на услуги, дали транзакцията е била успешна, дали работата е свършена добре и т.н. Входни атрибути, например, могат да бъдат възрастта на служителя, неговият трудов стаж, финансовото състояние на клиента, броят на служителите в компанията и др.

Резултатът от анализа се представя под формата на дърво, всеки възел от което съдържа определено условие. За да решите към кой клас трябва да бъде присвоен нов обект, е необходимо, отговаряйки на въпроси във възлите, да преминете през веригата от корена до листа на дървото, преминавайки към дъщерните възли в случай на утвърдителен отговор и към съседния възел в случай на отрицателен отговор.

Набор от параметри за анализ ви позволява да регулирате точността на полученото дърво:

Прогнозни модели

Прогнозните модели, създадени от механизма, са специални обекти, които се създават от резултата от анализ на данни и ви позволяват автоматично да извършвате прогноза за нови данни в бъдеще.

Например, прогнозен модел за търсене на асоциации, изграден чрез анализиране на покупките на клиенти, може да се използва, когато се работи с купувач, за да му се предложат стоки, които е вероятно да закупи заедно със стоките, които е избрал.

Съвременни информационни технологии/3. Софтуер

Доцент доктор. Жунусов К. М.

Костанайски държавен университет на името на А. Байтурсинов

Формиране на механизми за анализ и прогнозиране на данни

на платформата 1C: Enterprise

В основата на процеса на прогнозиране е разработването на икономическа прогноза. Той представлява научно обоснована преценка за възможните състояния на даден обект в бъдеще или за алтернативни начини и време за постигане на тези състояния. С други думи, това е опит да се погледне в бъдещето, да се предвиди, да се предвиди състоянието на изучавания обект след определен период от време.

Прогнозирането е тясно свързано с планирането. В научните кръгове има доста често срещан афоризъм: „Прогноза без план е литературно начинание, план без прогноза е административно действие“.

Разпространени методи както за прогнозиране, така и за планиране са изчислително-аналитичните, икономико-статистическите методи и икономико-математическото моделиране.

Механизмите за анализ на данни и прогнозиране като част от 1C Enterprise предоставят на потребителите (икономисти, анализатори и др.) Възможност за търсене на неочевидни модели в данните, натрупани в информационната база, и им позволяват да извършват следните операции:

Търсене на закономерности в изходните данни на информационната база;

Управлявайте параметрите на анализа, извършен както програмно, така и интерактивно;

Софтуерен достъп до резултата от анализа;

Автоматично извеждане на резултатите от анализа в документ с електронна таблица;

Създаване на прогнозни модели, които ви позволяват автоматично да прогнозирате последващи събития или стойностите на определени характеристики на нови обекти.

Механизмите за анализ на данни и прогнозиране са набор от вградени езикови обекти, които взаимодействат помежду си, което позволява на разработчика да използва неговите компоненти във всяка комбинация във всяко приложно решение. Вградените обекти улесняват организирането на интерактивна конфигурация на параметрите на анализа от потребителя, както и показване на резултата от анализа във форма, удобна за показване в документ с електронна таблица, в съответствие с Фигура 1. Важно е също така, че механизмът може да работа с данни, получени както от информационната база 1C, така и от външни източници (в последния случай, предварително заредени в таблица със стойности или документ с електронна таблица).


Фигура 1. Обща диаграма на функционирането на механизма за извличане на данни и прогнозиране

Като приложите един от видовете анализ към изходните данни, можете да получите резултат, който представлява определен модел на поведение на данните. Резултатът от анализа може да бъде показан в крайния документ или запазен за по-късна употреба (въз основа на него може да се създаде прогнозен модел, който ви позволява да предвидите поведението на нови данни).

Една от основните тенденции на пазара на системи за счетоводство и управление е постоянното нарастване на търсенето на използване на инструменти за аналитична обработка на данни, които осигуряват информирани управленски решения. Днешните клиенти обаче вече не са доволни от използването на традиционни инструменти, които им позволяват да създават различни отчети, обобщени таблици и диаграми въз основа на предварително дефинирани показатели и връзки, анализирани ръчно. Предприятията все повече се нуждаят от качествено различни инструменти, които им позволяват автоматично да търсят неочевидни правила и да идентифицират непознати модели, което прави възможно получаванетонови знания въз основа на информацията, натрупана от компанията, и понякога вземат напълно нетривиални решения за подобряване на ефективността на бизнеса въз основа на методите за извличане на данни.

Литература:

1 Глушченко В. В. Прогнозиране. - М.: Университетска книга, 2005.

2 Дуброва Т. А. Методически въпроси на прогнозирането на производството най-важните видовепромишлени продукти // Въпроси на статистиката. -2004. -No 1.-S. 52-57.

3 Радченко М.Г., Хрусталева Е.Ю. Инструменти за създаване на репликирани приложения "1C:Enterprise 8.2". - М .: Издателство "1C-Publishing", 2011 г.