| | Проблемы современной экономики, N 1 (33), 2010 | | ЭКОНОМИКА, УПРАВЛЕНИЕ И УЧЕТ НА ПРЕДПРИЯТИИ | | Брусакова И. А. заведующий кафедрой информационных систем в экономике Санкт-Петербургского государственного инженерно-экономического университета,
доктор технических наук Сербин А. А. преподаватель кафедры информационных систем в экономике Санкт-Петербургского государственного инженерно-экономического университета,
кандидат экономических наук
| |
| | В статье с помощью метода Монте-Карло показано влияние структурно-ориентированной аккумуляции корпоративных знаний на оперативность принятия управленческих решений. Предлагается теоретико-множественная формализация понятия «корпоративные знания» и уточняется состав этого понятия с точки зрения процессного подхода | Ключевые слова: знание, корпоративные знания, формализованное знание, управленческое решение, информационное обеспечение, метод Монте-Карло | В условиях высокого уровня конкуренции оперативность принятия решений является важнейшим фактором повышения конкурентоспособности предприятия. Информационные ресурсы анализа деятельности предприятия аккумулируются в информационно технологической инфраструктуре с помощью применения корпоративных информационных систем, которые обеспечивают их информационную взаимосвязанность. В то же время, информационные ресурсы бизнес-анализа — формализованные корпоративные знания — представлены разрозненными информационными объектами: документами, схемами, таблицами. Вследствие этого, глубокий анализ функционирования бизнес-процессов предприятия с целью их адаптации к меняющимся условиям конкурентной среды, а также решения внутренних проблем предприятия, становится трудоемкой задачей.
Современные информационные технологии позволяют аккумулировать любую информацию, представленную в цифровом виде. Однако возможности поиска и отбора релевантной информации, определяющие удобство и быстроту ее восприятия пользователем, тем шире, чем лучше структурирована информация, т.е. чем точнее определены сущности и информационные связи между ними. В связи с этим, вопросы улучшения информационного обеспечения бизнес-анализа целесообразно решать с применением структурно-ориентированной аккумуляции корпоративных знаний.
В контексте данной работы целесообразно уточнить определение знаний, на основе которого можно строить дальнейшие рассуждения. Так под знанием будем понимать результат отражения полезной человеку информации его сознанием.
Под корпоративными знаниями понимаются необходимые знания для описания конкретного множества реализаций основных, вспомогательных, сквозных, внутренних бизнес-процессов корпорации на множестве реализаций внешних бизнес-процессов корпорации и множестве моделей условий проведения мониторинга показателей эффективности [6].
Представим составляющие корпоративных знаний (КЗ) в виде сцепленного иерархически упорядоченного номинального признака [1], полученного, например, с использованием онтологического подхода и интерпретирующего составляющие корпоративных знаний в виде
КЗ = КЗвнутр_БП ∈ КЗвнешн_БП & КЗсквозн_БП & КЗМусл &
& КЗбизнес-функции & КЗМетод_оценки_эфф , (1)
где КЗвнутр_БП — корпоративные знания о внутренних безнес-процессах; КЗвнешн_БП — корпоративные знания о внешних бизнес-процессах; КЗсквозн_БП — корпоративные знания об особенностях организации сквозных бизнес-процессов (изменения последовательности выполнения функций, появление новых и устранение старых функций, реорганизации отдельных подразделений); КЗбизнес-функции — корпоративные знания об особенностях бизнес-функций (возможные изменения в документообороте корпорации — типовые и ранее не используемые документы компании, изменения реквизитов состава документов, изменение места хранения документов; возможные изменения в ответственных за выполнение функций, изменения владельцев бизнес-процессов, изменения хода выполнения функций); КЗМусл — корпоративные знания об изменении моделей условий реализации деятельности корпорации (выбор другой SOA-архитектуры, других сервисов, другого банка, другого виртуального ядра, изменение конфигурации коммуникационных сетей, переориентация на другого заказчика и потребителя, другой производимый продукт, другую технологию производства и т.п.); КЗМетод_оценки_эфф — корпоративные знания о традиционно используемых и привлечении новых метрик эффективности бизнеса (системы сбалансированных показателей, KPI, BSC и т.д.) [2–4].
Любое понятие (объект) КЗ можно структурировать с помощью высказывания типа | | | Очевидно, что формализованное знание (то есть закодированное знание) не отображается сознанием других людей, пока они его не воспримут и не поймут. Таким образом, формализованное знание отвлечено от сознания человека и представляет собой всего лишь зашифрованное информационное сообщение, предназначенное для передачи знаний. Под информационным сообщением конечной протяженности, имеющим ценность, понимается такое, которое модифицирует некоторые особенности взаимодействия системы со средой.
Передача большого количества информационных сообщений, формализуемых в разное время разными обладателями знаний большому количеству адресатов, связана с процессами их аккумуляции, которые будем называть процессами аккумуляции знаний. Причем, подчеркнем, что процессы аккумуляции знаний необходимо различать от процессов аккумуляции информационных сообщений в силу того, что несколько информационных сообщений могут пересекаться по своему содержанию. Соответственно накопленное информационное сообщение будет, во-первых, заведомо избыточно, а во-вторых, его содержание будет отличаться от любого включенного в него информационного сообщения. Аккумулировать можно только формализованные знания (так как неформализованные знания можно аккумулировать только в человеческом сознании). Аккумуляция знаний связана с их сохранением. Если для непосредственной передачи знаний их можно формализовать лишь вербально (произнести вслух, чтобы адресат услышал), то для накопления их необходимо записать на информационный носитель. Поэтому под аккумуляцией знаний следует понимать процесс накопления формализованных знаний на информационных носителях. Информационный носитель — это физический предмет, на который можно в прямом смысле записать информационное сообщение, а затем через некоторое время его воспроизвести. Запись и воспроизведение информационного сообщения производится способом, характерным для вида информационного носителя: механический (бумага), электромагнитный (магнитофонная лента, дискеты), оптико-химический (фотопленка), лазерный (лазерные диски) и т.д.
Структурно-ориентированная аккумуляция корпоративных знаний заключается в организации процессов аккумуляции корпоративных знаний согласно выражению (1).
Повышение эффективности работы с любыми формализованными знаниями достигается при использовании информационных технологий, основанных на информационно-коммуникационном взаимодействии программно-аппаратных составляющих вычислительной техники. Понятие «данные» связано в первую очередь с технологиями машинной обработки информации. Определить данные можно как структурные составляющие информационного сообщения, с которыми информационно-вычислительная техника может производить определенные операции. При этом, данные и единицы кода языка (например, буквы или слова) — это не одно и то же.
Компьютер может производить некоторые действия с совокупностью значений, хранимых в ячейках памяти. Смысл информации, хранящейся в этих ячейках компьютеру не доступен. Такая совокупность ячеек памяти может быть любого размера. Однако атомарность этой совокупности вынуждает при разработке алгоритма для компьютерного решения задачи структурировать необходимую информацию в виде набора элементов различных типов. В каждой системе программирования предусмотрено использование некоторых примитивных типов данных (как правило, это — булевский, целый, вещественный и символьный) и средств, с помощью которых можно группировать их в более сложные структуры. Вообще, под типом данных понимают произвольное множество, называемое множеством значений, и набор операций над значениями.
Структуры, детализирующие абстрактные типы данных [7] и описывающие их взаимосвязи представляются в виде так называемых инфологических моделей данных, на основе которых строятся компьютерные хранилища данных — базы данных.
Основой базы данных является структура или модель данных. Математически структура представляет собой совокупность {D, R, A},
где D — заданное множество (носитель структуры);
R — конечный набор отношений, в которых находятся элементы множества (типовая характеристика структуры);
А — ограничительные условия, накладываемые на отношения (аксиомы структуры).
Под отношением понимается заданная совокупность упорядоченных пар элементов множества D. В контексте баз данных элементы математической структуры можно интерпретировать следующим образом. Абстрактному множеству D соответствует некоторое реальное конечное множество элементов данных, которыми представлены объекты предметной области. Более определенно — это заданная совокупность типов данных. Элемент данных — это элемент абстрактного типа данных.
Отношениями R могут быть отображены некоторые из взаимосвязей между объектами в форме отношений между записями данных об этих объектах. Записью в контексте баз данных вне зависимости от структуры данных принято называть минимальную уникально идентифицируемую единицу независимого хранения данных в системе баз данных.
Аксиомам А удобно сопоставить условия корректности (целостности, правильности), наложенные на базу данных.
Элементы D, К и А модели при более детальном рассмотрении также имеют некоторую внутреннюю структуру:
{D, Cr(D)}, {R, Cr(R)}, {A, Ru(A)},
где Cr(D) — критерий принадлежности элементов d множеству D (такой критерий всегда явно или по умолчанию имеется в виду в теории множеств при задании любого множества);
Cr(R) — критерий принадлежности отношений r множеству R;
Ru(A) — совокупность правил вывода новых формул из аксиом и правил преобразования этих формул [8].
Таким образом, структурирование информации можно определить как представление совокупности информационных сообщений в виде элементов вышеописанной математической модели.
Предметная область базы данных считается определенной, если известны существующие в ней объекты, их свойства и отношения. Идея установления соответствия между состоянием предметной области, его восприятием и представлением в базе данных лежит в основе так называемого инфологического подхода к проектированию информационных систем. Согласно этому подходу, при проектировании необходимо различать явления реального мира, информацию об этих явлениях и ее представление посредством данных. Соответственно в инфологическом подходе выделяют следующие три сферы: реальный мир или объективную систему, информационную и датологическую сферы [9]. Основными составляющими объективной системы являются: объект (индивид, реалия, сущность); свойство (атрибут, реквизит); связь (объектное отношение); время. Объект — это то, о чем в информационной системе должна накапливаться информация. Информация об объекте — это параметры его состояния в конкретный момент времени [8, 9].
Таким образом, данные можно определить как атомарные элементы описания предметной области, классифицированные в соответствии с некоторой структурой, каждый класс которой представляет реальный объект предметной области. Последний характеризуется определенным набором свойств и связей с другими объектами, по которым машина может по алгоритму составить информационное сообщение из последовательности атомарных элементов, а человек — определить смысл такого сообщения. Уточнить взаимосвязь понятий «данные» и «знания» можно следующим образом: данные — это формализованные знания, структурированные с целью их аккумуляции, передачи и алгоритмической обработки с помощью вычислительной техники. Тогда под структуризацией знаний следует понимать преобразование формализованных знаний в данные с целью ускорения поиска и восприятия человеком этих знаний при использовании компьютерных технологий хранения и обработки информации.
Одной из основных задач управления промышленным предприятием является принятие управленческих решений, направленных на повышение эффективности его деятельности. Управленческое решение — это выбор наиболее приемлемой альтернативы из возможного многообразия вариантов (альтернатив, планов, стратегий). Этот выбор производит лицо, принимающее решение. В его роли выступает человек (или группа), обладающий правами принятия решения, возможностями его реализации и несущий ответственность за его последствия [10].
Эффективность процесса принятия управленческого решения в условиях конкурентной среды характеризуется двумя факторами:
1) оперативностью его принятия, определяющейся временем, прошедшим с момента возникновения проблемной ситуации до момента полного завершения реализации принятого решения (характеристика связана с потерями, которые продолжает нести предприятие, пока решение не принято);
2) качеством решения, определяющимся тем, насколько, за какой срок и какой ценой улучшились значения «проблемных» показателей после принятия решения, в соизмерении с ухудшением значений остальных показателей.
Очевидно, что качество анализа проблемной ситуации, а значит и альтернатив, определяется осведомленностью аналитиков о природе показателей, характеризующих возникшую проблему, об области деятельности предприятия, в которой возникла проблема, о взаимосвязи показателей данной области с другими показателями деятельности. Здесь-то и встает вопрос об информационном обеспечении процесса принятия решений, которое характеризуется полнотой, релевантностью, доступностью и другими качествами корпоративных знаний.
Полнота и актуальность корпоративных знаний, аккумулированных в организации, влияют на качество решения, а скорость изучения и анализа корпоративных знаний влияет на оперативность принятия решения. Если полнота и актуальность в большей степени зависят от организации процессов формализации и аккумуляции корпоративных знаний, то эффективность их изучения и анализа определяется способами и технологиями аккумуляции знаний.
При рассмотрении проблемной ситуации очень сложно сократить время изучения информации за счет увеличения количества трудовых ресурсов. Несколько аналитиков, изучив информацию из разных источников, должны обменяться ею, или передать эту информацию «старшему» аналитику, который ее обобщает. Так, затрачивается дополнительное время на обмен информацией между аналитиками, что снижает оперативность анализа в целом.
Повышение оперативности принятия управленческих решений может быть достигнуто за счет снижения времени, затрачиваемом аналитиками на уточнение неструктурированных источников формализованных корпоративных знаний. Уточнение неструктурированного информационного источника, по сути, является его неформализованной структуризацией. Аналитик, прочитав текст, выделяет для себя объекты и связанные с ними параметры. Очевидно, что формализованная целенаправленная структуризация может оказаться даже сложнее, чем неформализованная. Поэтому трудозатраты на структуризацию корпоративных знаний из процесса анализа проблемной ситуации целесообразно рассматривать обособленно.
Для того, чтобы оценить повышение оперативности принятия управленческих решений при структурно-ориентированной аккумуляции корпоративных знаний, целесообразно оценить изменение среднего времени выполнения анализа проблемной ситуации | | | В рассматриваемой задаче требуется моделирование одного процесса для нахождения среднего интервала времени между 2-мя событиями: a0 — появление заявки на обработку на входе исследуемого процесса; a1 — выдача процессом обработанной заявки, что означает ее автоматическое появление на входе следующего процесса. При имитационном моделировании процессов любую заявку на обслуживание обычно называют транзактом.
Рассматриваемый процесс является случайным (зависит от множества неопределенных факторов см. [11]), поэтому для построения его логико-математической модели целесообразно воспользоваться вероятностным подходом. Моделируемый процесс и искомые величины не имеют сложных логических зависимостей от других процессов, поэтому за основу имитационного моделирования целесообразно взять метод Монте-Карло.
Статистические испытания по методу Монте-Карло представляют собой простейшее имитационное моделирование при полном отсутствии каких-либо правил поведения. Получение выборок по методу Монте-Карло — основной принцип компьютерного моделирования систем, содержащих стохастические или вероятностные элементы [12].
С помощью метода Монте-Карло, проведя незначительное количество реальных наблюдений, можно провести достаточное количество имитационных экспериментов, чтобы установить форму распределения искомых случайных величин, что позволит уточнить их средние значения и ширину доверительных интервалов.
В основе вычислений по методу Монте-Карло лежит случайный выбор чисел из заданного вероятностного распределения. При практических вычислениях эти числа берут из таблиц или получают путем некоторых операций, результатами которых являются псевдослучайные числа с теми же свойствами, что и числа, получаемые путем случайной выборки [12].
Как было сказано выше, получить реальные данные о времени, затрачиваемом на анализ проблемной ситуации и формирование альтернатив решения, практически невозможно. Поэтому для адекватности оценки выделим те составляющие искомых величин, по которым можно получить минимально необходимый набор данных.
В общем случае время выполнения анализа i-й проблемной ситуации (Ti ) можно представить как сумму временных интервалов: | | | где tfi — время необходимое для выполнения основных функций анализа i-й проблемной ситуации (анализ причин, формирование альтернатив, разработка критериев и т.д.);
Мi — количество неструктурированных информационных источников, использовавшихся при анализе i-й проблемной ситуации;
Ni — количество структурированных информационных сообщений, полученных по запросам к базам данных в ходе анализа i-й проблемной ситуации;
tuim — время, затрачиваемое на уточнение m-го информационного источника для анализа i-й проблемной ситуации;
toin — время, затрачиваемое на осмысление n-го информационного сообщения для анализа i-й проблемной ситуации.
Другими словами, tuim — это время, требующееся для выявления и осмысления требующейся информации из неструктурированного информационного источника, а toin — это время, требующееся для восприятия аналитиком информационной строки, представляющей собой совокупность данных, то есть для превращения данных, выведенных компьютером в знания человека.
Можно предположить, что повышение степени структурированности знаний не повлияет на время tfi. В то же время изменится отношение величин Mi и Ni (Мi ) уменьшится в каждом случае i до 0, а Ni в каждом случае i увеличится). Тогда искомую величину ΔT можно представить как разность средних величин: | | | — это время, затраченное на получение знаний из структурированных и неструктурированных источников при отсутствии базы структурированных корпоративных знаний; | | | — это время, затраченное на получение знаний из структурированных источников при наличии базы структурированных корпоративных знаний.
Из приведенных рассуждений видно, что искомыми случайными величинами будут T0’ и T1’ , формулы которых и представляют собой логическую основу имитационной модели. Для изучения их форм распределения и описательных характеристик целесообразно использовать составляющие их случайные величины: Мi, Ni, tuim, toin. Количества источников и сообщений (Мi и Ni) в каждом случае уникально. Кроме того, источники формализованных корпоративных знаний различаются по размеру и сложности изложения. Например, приказы — редко бывают больше 3-х страниц, в то время как стандарты не бывают менее 20. Однако необходимое количество этих значений получить не трудно: для этого достаточно опросить нескольких аналитиков, сколько им требуется времени для уточнения того или иного источника информации, понимания табличного отчета или продукционного правила, а также определить, каким количеством неструктурированных источников и структурированных информационных сообщений приходиться пользоваться при анализе проблемных ситуаций.
На основе полученных статистических данных для случайных величин Мi, tuim, N0i, to0in, N1i, to1in были подобраны формы распределения и проведены серии соответствующих имитационных экспериментов. Анализ исходных данных произведен с помощью функции «Подгонка распределений» инструментального средства «Statistica 6.0» [13]. Работа функции основана на расчете критерия «хи-квадрат» и уровня значимости P, показывающего, насколько хорошо данные согласуются с гипотезой о выбранном законе распределения, На рис. 1–6 приведены гистограммы, полученные в пакете «Statistica», иллюстрирующие «подгонку» теоретических законов к распределению вероятностей генерируемых исходных случайных величин.
Случайные величины, описывающие количество источников информации и информационных сообщений (соответственно Мi, N0i, N1i,) являются дискретными: они могут принимать только фиксированные значения. Результат «подгонки» (рис. 1–3) показал, что ближе всего любой из них подходит геометрическое распределение (название связано с геометрической прогрессией [13]), функция которого имеет вид: | | | где p — вероятность успеха, x = 1, 2, 3 ...
Параметры p для распределений величин Мi, N0i, N1i, и показатели, характеризующие данные случайные величины, полученные по результатам анализа исходных данных, приведены в табл. 1. | | | Рис. 1. Геометрическое распределение вероятностей количества уточняемых источников корпоративных знаний при анализе проблемной ситуации (Mi). | | | Рис. 2. Геометрическое распределение вероятностей количества информационных сообщений, обрабатываемых аналитиком при анализе проблемной ситуации в случае неструктурированных источников корпоративных знаний (N0i). | | | Рис. 3. Геометрическое распределение вероятностей количества информационных сообщений, обрабатываемых аналитиком при анализе проблемной ситуации в случае использования структурированных источников корпоративных знаний (N1i). | | Таблица 1
Описательные характеристики случайных величин Мi, N0i, N1i, и параметр p, характеризующий их геометрическое распределение | | Случайные величины, описывающие время обработки аналитиком одного информационного сообщения или источника информации (соответственно tuim, to0in, to1in) являются непрерывными. Данные величины по сути являются случайным временем обработки транзакта, где транзактом является информационное сообщение или неструктурированный источник информации. При таком рассмотрении наиболее вероятно предположение об экспоненциальном распределении данных случайных величин, так как процесс обработки каждого элементарного транзакта является простейшим [11]. Результаты «подгонки» (рис. 4–6) с применением функционала «Statistica» подтвердили данное предположение. Функция плотности вероятностей P(x) имеет вид: | | | и показатели, характеризующие данные случайные величины, полученные по результатам анализа исходных данных, приведены в табл. 2. | | Таблица 2
Описательные характеристики случайных величин tuim, to0in, to1in, и параметр λ, характеризующий их экспоненциальное распределение | | В соответствии с подобранными параметрами теоретических законов распределения вероятностей случайных величин, были разработаны генераторы случайных чисел. Например, функция, возвращающее число, распределенное по экспоненциальному закону, на языке программирования «Visual Basic 6.0» выглядит следующим образом:
Function exp(m As Double) As Double
Dim r As Double
r = Log(Rnd())
exp = m * r * (-1)
End Function,
где Log — это стандартная функция Visual Basic, возвращающая натуральный логарифм своего аргумента;
Rnd — это стандартная функция Visual Basic, возвращающая случайное число, равномерно распределенное на интервале [0 ; 1];
аргумент m — это математическое ожидание генерируемой случайной величины. | | | Рис. 4. Экспоненциальное распределение вероятностей времени уточнения информации в неструктурированных источниках корпоративных знаний (tuim). | | | Рис. 5. Экспоненциальное распределение вероятностей времени восприятия данных отчетов КИС (to0in) | | | Рис. 6. Экспоненциальное распределение вероятностей времени восприятия структурированных данных, включающих структурированную информацию из источников корпоративных знаний (to1in) | С помощью генераторов были получены случайные последовательности значений Mi, N0i, N1i (max(i) =1000). Для каждого из полученных значений была сгенерирована совокупность значений времени (соответственно tuim, to0in, to1in). Суммы значений времени сформировали последовательность искомых случайных величин T’0i и T’1i.
Для исследования средних величин T’0i и T’1i был произведен подбор законов распределения их вероятностей и определены 95%-ные доверительные интервалы. Гистограммы, иллюстрирующие «подгонку» теоретических законов к распределению вероятностей T’0i и T’1i приведены на рис. 7–8.
С помощью функций пакета «Statistica» на основании расчета статистики «хи-квадрат» определено, что распределение T’0i ближе всего к гамма-распределению с параметром с = 1,76. Это подтверждает соответствие сгенерированных данных реальным, т.к. теоретическое распределение T’0i должно описываться законом распределения Эрланга 2-го порядка (с = 2): T’0i — это длительность процесса, «состоящая» из длительностей двух простых процессов, распределенных по экспоненциальному закону. Функция гамма-распределения плотности вероятностей имеет вид: | | | где Γ — это функция Эйлера, b > 0 — это параметр масштаба, а c > 0 — так называемый параметр формы [2].
Средняя величина времени, затрачиваемого аналитиком на работу с информацией при использовании неструктурированных источников корпоративных знаний (T’0) составила 14,2 час. (или 14 часов 12 минут) с доверительным интервалом 95% равным ±0,7 час. (42 мин.).
Аналогично определено, что форма распределения случайной величины T’1i ближе всего к экспоненциальной с параметром λ = 0,32 (рис. 8). Это подтверждает соответствие сгенерированных данных реальным, так как в данном случае процесс является простейшим и плотность вероятностей его длительности должна описываться экспоненциальным законом. | | | Рис.7. Гамма-распределение вероятностей количества времени, затрачиваемого аналитиком на обработку информации при использовании неструктурированных источников корпоративных знаний (T’0i) | Средняя величина времени, затрачиваемого аналитиком на работу с информацией при использовании неструктурированных источников корпоративных знаний (T1’ ) составила 3,1 час. (или 3 часа 6 минут) с доверительным интервалом 95% равным ±0,17 час. (10 мин.).
Таким образом, искомая величина ∆T составляет:
ΔT = T0’ – T1’ =14,2 час. — 3,1 час. = 11,1 час.
(или 11 часов 6 минут).
Это означает, что среднее время анализа проблемной ситуации сокращается примерно на 11 рабочих часов при использовании структурно-ориентированной аккумуляции корпоративных знаний, что составляет примерно 1,5 рабочего дня. Такая эффективность достигается за счет более полного структурированного информационного обеспечения процесса принятия решения. Таким образом, результаты эксперимента, проведенного с помощью разработанной транзактной имитационной модели подтвердили, что структурно-ориентированная аккумуляция корпоративных знаний обеспечивает повышение оперативности анализа проблемных ситуаций, и, как следствие, оперативности принятия управленческих решений. | | | Рис. 8. Экспоненциальное распределение вероятностей количества общего времени, затрачиваемого аналитиком на обработку информации при использовании структурированных источников корпоративных знаний (T’1i) |
| |
|
|