数据挖掘的主要方法包括基本统计分析、相关分析、回归分析、时间序列分析、人工神经网络方法等。不同的分析方法和挖掘工具有其独特的特征和使用范围。
1.基本统计分析方法:统计学研究的对象是客观事物的数量关系和数量特征。统计方法广泛地运用于各个领域,供各个部门做出决策、执行计划、检查监督和宏观调控。尤其在物流管理领域,基本统计方法起着信息咨询、监督、辅助决策的作用。
统计分析方法从总体中抽取一定数量的样本并测出有关的数据以及利用数据所提供的关于总体的信息来推断关于总体的结论。目前企业内部的相关海量数据或分散存储,或是异构数据,无法利用基本的统计方法进行归纳推理。
2.相关分析:相关分析法是测定经济现象之间相关关系的规律性,并据以进行预测和控制的分析方法。物流管理中的各个要素间存在着大量的相互联系、相互依赖、相互制约的关系,一类是函数关系,它反映着要素之间严格的依存关系;另一类为相关关系,就是说变量之间存在看不确定、不严格的依存关系。
物流管理中的相关分析要解决以下问题:
(1)确定物流各个要素之间有无相关关系以及相关关系的类型:正相关关系或负相关关系;直线关系还是曲线相关;一元相关还是多元相关。
(2)确定各个要素之间相关关系的密切程度,通常是计算相关系数。
(3)拟合回归方程,如果要素间相关关系密切,就根据其关系的类型,建立数学模型用相应回归方程来反映这种数量关系。
(4)判断回归分析的可靠性,只有通过检验的回归方程才能用于预测和控制。
(5)根据回归方程进行预测和控制。如果变量数量比较多并且变量之间无法用线性关系来表示,那么相关分析就不能很好的反映出各变量之间的关系。
3.回归分析:考察变量之间的数量变化规律,确定自变量和因变量之间的数学关系式,建立回归方程,对回归方程进行各种统计检验,并能进行预测。回归分析按照涉及的自变量的多少,可分为一元回归分析和多元回归分析;按照自变量和因变里之间的关系类型,可分为线性回归分析和非线性回归分析。
在物流管理中回归分析应用的主要内容为:
(1)从一组数据出发确定某些变量之间的定量关系式,并估计其中的未知参数。估计参数的常用方法是最小二乘法。
(2)对这些关系式的可信度进行检验。
(3)在多自变量共同影响一个因变量的关系中,判断并将影响显著的自变量选入模型中,而剔除影响不显著的变量,通常用逐步回归、向前回归和向后回归等方法。
回归分析仅考虑到变量之间的数量变化规律,没有考虑到变里之间由于时间等因素产生的不确定关系,这使得回归分析,特别是线性分析,对于时间不敏感变量的检验结果是可信的,对于时间敏感的变量的变化规律不能很好的表示。
4.时间序列分析:对按时间顺序的一组数字序列应用数理统计方法加以处理,以预测未来事物的发展。
时间序列分析是定量预测方法之一,它的基本原理:一是承认事物发展的延续性,根据过去的变化趋势预测未来的发展,前提是假定过去会同样延续到未来;二是突出了时间因素在预测中的作用,因而存在预测误差。当外界发生较大变化,预测往往会有较大偏差,为此要利用加权平均法对历史数据进行处理。
时间序列预测法简单易行,便于掌握,中短期预测比长期预测的效果好。
5.人工神经网络:人工神经网络(Artificial Neural Network.ANN)是一个由很多节点通过方向性连接组成的一个网络结构,是基于模仿人的大脑的神经网络的结构和功能而建立的一种具有学习能力的信息处理系统。ANN通过从过去的知识中学习、概括和抽取解决问题的经验知识,可以将这些知识进行运用。
ANN的优点是:并行处理;非线性映射;自学习功能;高速寻找优化解的能力。由于具有这些优点,ANN具有高度的非线性和极强的模糊推理能力,这是传统数学分析方法无法比拟的。物流过程涉及的因素比较多,若仅用推理和建立数学模型的方法来解决物流管理中出现的问题是不够的,还需依靠经验和某些难以用公式表达的知识,因此,ANN比较适合于解决复杂的物流管理问题。