Статья

Название статьи ОСНОВНЫЕ ПОДХОДЫ К ПОСТРОЕНИЮ ИНФОРМАЦИОННОЙ СИСТЕМЫ ДЛЯ МОДЕЛИРОВАНИЯ ОТТОКА КЛИЕНТОВ УСЛУГ СВЯЗИ
Автор С.С. Алхасов, А.Н. Целых
Рубрика РАЗДЕЛ II. ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА И ИНФОРМАТИКА
Месяц, год 02, 2015
Индекс УДК 004.89
DOI
Аннотация Кратко рассмотрены важнейшие функциональные модули информационной системы прогнозирования оттока клиентов телекоммуникационного предприятия. Определены основные подходы к предварительной обработке архивных данных и моделированию оттока клиентов. Заданы базовые требования для практической реализации прогностической системы. Отдельное внимание обращено на преодолении сильной коррелированности между переменными в массиве входных данных. Предложено использовать метод главных компонент, предполагающий декомпозицию входного массива на вектора счетов и нагрузок. Рассмотренный алгоритм NIPALS имеет итеративный характер. Вектор счетов, вычисленный на некоторой итерации, является соответствующей главной компонентой. Определение главных компонент дальних порядков, как правило, лишено смысла, поскольку их значения обусловлены наличием некоторой погрешности во входных данных. Указаны основные критерии для определения эффективного числа главных компонент: объясненная дисперсия и нормированное собственное значение вектора счетов. В качестве примера сформирован экспериментальный массив входных данных размера 9х2000, в который специально подобраны разнородные переменные (технология подключения, тип населенного пункта, скорость подключения, стоимость услуги, трафик в 1-ом месяце, трафик во 2-м месяце, трафик в 3-м месяце и др.). Отмечено, что данная методика позволяет преодолеть разнородность входной информации и сильную коррелированность переменных, а также снижает размерность входного массива. Графически показано, как число используемых главных компонент влияет на объясненную дисперсию и величину нормированного собственного значения. Все эти аспекты свидетельствуют, что данный подход перспективен для применения в прогностической системе, содержащей кластеризирующие и нейросетевые модули.

Скачать в PDF

Ключевые слова Прогнозирование; отток клиентов; Интернет; метод главных компонент; снижение размерности; кластеризация.
Библиографический список 1. Алхасов С.С., Целых А.Н. Принципы построения прогностической системы для моделирования оттока клиентов услуг Интернета // Материалы Всероссийской научной конференции «Системы и модели в информационную эпоху». Ч. 1. – Таганрог: Изд-во ТТИ ЮФУ, 2014. – С. 4-6.
2. Guazzelli A. Predicting the future. Part 2: Predictive modeling techniques [Электронный ресурс]. – Режим доступа: http://www.ibm.com/developerworks/library/ba-predictive-
analytics2/index.html, свободный. – Загл. с тит. экр. (дата обращения: 24.11.2014).
3. Ефимов А. Удержание клиента – не искусство, а прикладная наука! [Электронный ресурс]. – Режим доступа: http://library.croc.ru/download/ 11342/930706a746182066f55bfe8f5800b735.pd , свободный. – Загл. с тит. экр. (дата обращения: 22.11.2014).
4. Фарахутдинов Ш.Ф., Бушуев А.С. Обработка и анализ данных социологических исследований в пакете P 17.0. – Тюмень: ТюмГНГУ, 2011. – 220 с.
5. Guazzelli A. Predicting the future. Part 3: Create a predictive solution [Электронный ресурс]. – Режим доступа: http://www.ibm.com/developerworks/library/ba-predictive-analytics3/index.html, свободный. – Загл. с тит. экр. (дата обращения: 26.11.2014).
6. Баранов С.В., Скуфьина Т.П. Новые методики и результаты исследования межрегиональной дифференциации на основе метода главных компонент // Вестник Мурманского государственного технического университета. – 2008. – Т. 11, № 2. – С. 201-210.
7. Мокеев В.В., Томилов С.В. Об эффективности анализа и распознавания изображений методом главных компонент и линейным дискриминантным анализом // Вестник Южно-Уральского государственного университета. Серия: Компьютерные технологии, управление, радиоэлектроника. – 2013. – Т. 13, № 3. – С. 61-70.
8. Ким Дж.-О., Мьюллер Ч.У., Клекка У.Р. и др. Факторный, дискриминантный и кластерный анализ: Пер. с англ. / Под ред. И.С. Енюкова. – М.: Финансы и статистика, 1989. – 215 с.
9. Воронцов К.В. Регрессионный анализ и метод главных компонентов: Лекция [Электронный ресурс]. – Режим доступа: http://shad.yandex.ru/lectures/machine_learning_9.xml, свободный. – Загл. с тит. экр. (дата обращения: 10.12.2014).
10. Родионова О.Е. Интеллектуальный метод обработки результатов многоканальных экспериментов: Дис. … д-ра физ.-мат. наук. – М., 2008. – 272 с.
11. Эсбенсен К. Анализ многомерных данных. Избранные главы: Пер. с англ. / Под ред. О.Е. Родионовой. – Черноголовка: Изд-во ИПХФ РАН, 2005. – 160 с.
12. Jolliffe I.T. Principal Component Analysis. – 2nd edition. – NY; Berlin; Heidelberg: Springer Verlag, 2002. – 518 p.
13. Овсянников В.П., Фефелов В.В. Определение количества главных компонент для данных, характеризующих работу угольного предприятия, на основании анализа полной и объясненной дисперсии остатков // Современные проблемы управления производством:
тезисы докладов V Международной научно-практической конференции (г. Донецк, 14–15 октября 2010 г.). – Донецк: ГВУЗ «ДонНТУ», 2010. – С. 161-163.
14. Померанцев А. Метод главных компонент (P A) [Электронный ресурс]. – Режим доступа: http://www.chemometrics.ru/materials/textbooks/pca.htm, свободный. – Загл. с тит. экр. (дата обращения: 09.12.2014).
15. Айвазян С.А., Бухштабер В.М., Енюков И.С., Мешалкин Л.Д. Прикладная статистика: Классификация и снижение размерности: Справ. изд. / Под ред. С.А. Айвазяна. – М.: Финансы и статистика, 1989. – 607 с.
16. Реализация метода главных компонент на # [Электронный ресурс]. – Режим доступа: http://habrahabr.ru/post/146236/, свободный. – Загл. с тит. экр. (дата обращения: 04.12.2014).
17. Барсегян А.А., Куприянов М.С., Степаненко В.В., Холод И.И. Технологии анализа данных: Data Mining, Visual Mining, Text Mining, OLAP. – 2-е изд., перераб. и доп. – СПб.: БХВ-Петербург, 2007. – 384 с.
18. Медведев В.С., Потемкин В.Г. Нейронные сети. MATLAB 6. – М.: ДИАЛОГ-МИФИ, 2002. – 496 с.
19. Воронцов К.В. Нелинейная регрессия. Многослойные нейронные сети: Лекция [Электронный ресурс]. – Режим доступа: http://shad.yandex.ru/lectures/machine_learning_10.xml, свободный.
– Загл. с тит. экр. (дата обращения: 24.11.2014).
20. Нейронные сети. STATISTICA Neural Networks: Методология и технологии современного анализа данных / Под ред. В.П. Боровикова. – 2-е изд., перераб. и доп. – М.: Горячая линия – Телеком, 2008. – 392 с.

Comments are closed.