[摘要] 本文从数据仓库和数据挖掘的角度探讨了零售业在现代化的市场进行信息收集和分析的必要性和发展趋势。提出了零售业基于数据挖掘的数据仓库设计与构造和利用数据挖掘技术进行的各种有效分析,阐明了基于数据挖掘技术的信息高效利用是商家竞争的有效手段。
[关键词] 零售业 数据仓库 数据挖掘
零售业是任何一个处于从事由生产者到消费者的产品营销活动的个人或公司,他们从批发商、中间商或者制造商处购买商品,并直接销售给消费者。当代的零售业早已不再是传统的“整买零卖,贱进贵出”的简单商业行为。它是行业间科学管理和高科技应用的竞争。沃尔玛前CEO David Glass 曾经说过这样一句话:“沃尔玛是一家科技信息公司”。乍一听,这句话很难理解:沃尔玛不是世界上最大的零售商吗?细细品味,Glass 这句话可以说是一语道出了沃尔玛低成本、高效益的真谛。
众所周知,现代化的市场信息收集和分析本身就是高科技的体现。消费者的心理、行为、生活习惯,以及收入甚至婚姻状况无不成为商家的决策必需,由此,新的系统、软件应运而生。高科技在产品开发、商品策划、销售预测、货源采购和精确定价等各个环节的应用已经成为经营者们不可缺少的决策依据。而支持众多决策的是其中的数据仓库和挖掘技术。
一、构建数据仓库与数据挖掘技术的必要性
简单讲数据仓库是一种多个异种数据源在单个站点以统一的模式组织存储,以支持管理决策。数据挖掘是从存放在数据库、数据仓库或其他信息库中的大量数据中挖掘有用知识的过程。
数据的丰富带来了对强有力的数据分析工具的需求,大量的数据被描述为“数据丰富”,但“信息贫乏”。快速增长的海量数据收集、存放在大型和大量数据库中,没有强有力的工具,理解它们已经远远超出了人的能力。结果,收集在大型数据库中的数据变成了“数据坟墓”——难得再访问的数据档案。这样,重要的决定常常不是基于数据库中的信息丰富的数据,而是基于决策者的直觉,因为决策者缺乏从海量数据中提取有价值知识的工具。此外,考虑当前的专家系统技术,通常,这种系统依赖用户或领域专家人工地将知识输入知识库。不幸的是,这一过程常常有偏差和错误,并且耗时、费用高。数据挖掘工具进行数据分析,可以发现重要的数据模式,对商务决策、知识库、科学和医学研究做出了巨大贡献。数据和信息之间的鸿沟要求系统地开发数据挖掘工具,将数据坟墓转换成知识“金块”。简单讲数据挖掘是从大量数据中提取或“挖掘”知识。
数据仓库中不是存放每个销售事物的细节,而是存放每个部门每类商品的汇总数据,或对较高层次的汇总数据。OLAP(联机分析处理)提供数据仓库中汇总数据的多视图和动态视图能力,为成功的数据挖掘奠定了坚实的基础。数据挖掘可以帮助商界经理们找到合适的客户,也能获得对商务的洞察,帮助提高市场份额和增加利润。此外,数据挖掘能够帮助经理们了解客户的群体特点,并据此制定价格策略;不是根据知觉,而是根据客户的购买模式导出的实际商品组的排放;在降低推销商品开销的同时,提高总体推销的纯效益。
二、零售业中的数据仓库与数据挖掘
零售业是数据挖掘的主要应用领域,这是因为零售业积累了大量的销售数据,顾客购买历史记录,货物进出,消费与服务记录,等等。其数据量在不断地迅速膨胀,特别是由于日益发展的Web或电子商务商的商业方式的方便和流行。今天,许多商店都有自己的Web站点、顾客可以方便地在线购买商品。一些企业,如Amazon.com,只有在线方式,没有砖瓦构成的(物理的)商场。零售数据为数据挖掘提供了丰富的资源。
零售数据挖掘可有助于识别顾客购买行为,发现顾客购买模式和趋势,改进服务质量,取得更好的顾客保持力和满意程度,提高货品销售比率,涉及更好的货品运输与分销策略,减少商业成本。
零售业中的数据挖掘可从以下几个方面具体实施:
1.基于数据挖掘的数据仓库设计与构造
由于零售数据覆盖面广(包括销售、顾客、职员、货品运输、销量和服务),所以有许多设计数据仓库的方式。所包含的细节级别可以变化很大。由于数据仓库的主要用途是支持数据分析和数据挖掘,预先的一些数据挖掘例子的结果可作为设计和开发数据仓库结构的参考依据。这些设计要决定哪些维护什么级别,以及为保证高质量和有效的数据挖掘应进行哪些预处理。建议以递增、进化的方式(如图1)实现数据仓库。
图1 数据仓库开发的方法
2.销售、顾客、产品、时间和地区的多维分析
考虑到顾客的需求,产品的销售,趋势和时尚,以及日用品的质量、价格、利润和服务,零售业需要的是实时的信息。因此提供强有力的多维分析和可视化工具是是十分重要的一件事,这包括提供根据数据分析的需要构成复杂的数据立方体如图2所示。基本方体包含所有的维city,item和year,它可以返回这三维的任意组合。顶点方体表示分组为空的情况,它包含所有销售的总合。特征数据立方体,在零售数据分析中是一种有用的数据结构,因为它方便了带有复杂条件的聚集上的分析。
图2 三维数据立方体
3.促销活动的有效分析
零售业经常通过广告、优惠券和各种折扣和让利的方式搞促销活动,以达到促销产品,吸引顾客的目的。认真分析促销活动的有效性,有助于提高企业利润。多维分析可满足这方面分析的要求,方法是通过比较促销期间的销售量和交易数量与促销活动前后的有关情况。此外,关联分析可以找出哪些商品可能遂将假商品一同被购买,特别是与促销活动前后的销售向比,它广泛应用于购物车或事物数据分析。
4.顾客保持力——顾客忠诚分析
通过顾客荣誉卡信息,可以记录下一个顾客的够买序列。顾客的忠诚和购买趋势可以按系统的方式加以分析。由同一顾客在不同时期购买的商品可以分组为序列。序列模式挖掘可用于分析顾客的消费或忠诚的变化,据此对价格和商品的花样加以调整,以便留住老客户,吸引新顾客。
5.购买推荐和商品参照
通过从销售记录中挖掘关联信息,可以发现买某一品牌香水的顾客很可能够买其他一些商品。这类信息可用于形成一定的购买推荐,购买推荐可在Web、每周传单或收据上宣传,以便改进服务,帮助顾客选择商品,增加销售额。同样,诸如“本周热点商品”之类的信息或有吸引力的买卖也可以和相关信息一同发布,以达到促销的目的。
总之,与其他行业一样,零售业的竞争是信息获取和有效利用的竞争。数据挖据可以帮助商界经理们找到更合适的客户,也能获得对商务的洞察,帮助提高市场份额和增加利润。此外,数据挖掘能够帮助经理们了解顾客的群体特点,并据此制定价格策略;不是根据直觉,而是根据顾客的购买模式导出的实际商品组来修正商品排放;在降低推销商品开销的同时,提高总体推销的纯效益。
注:本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文。