
《数据包络分析》由会员分享,可在线阅读,更多相关《数据包络分析(122页珍藏版)》请在文档大全上搜索。
1、 数据包络分析(DEA) Data Envelopment Analysis数据包络分析是一种对具有相同类型决策单元(decision making unit, DMU)进行绩效评价的方法所谓相同类型是指这类决策单元具有相同性质的投入和产出。而不必不同单位比较需要价值量衡量一个单位的绩效,通常用投入产出比当所有投入和产出指标均分别可折算成同一单位时,根据投入产出比对要评定的决策单元进行绩效排序。A.Charnes等人提出的DEA方法具有多个投入和多个产出的同类型决策单元的绩效评定提供了工具方法。通过明确地考虑多种投入(即资源)的运用和多种产出(即服务)的产生,能够用来比较提供相似服务的多个服务
2、单位之间的效率,这项技术被称为数据包络线分析(DEA)。它避开了计算每项服务的标准成本,它可以把多种投入和多种产出转化为效率比率的分子和分母,而不需要转换成相同的货币单位。用DEA衡量效率可以清晰地说明投入和产出的组合,比一套经营比率或利润指标更具有综合性并且更值得信赖。 一、基本概念一、基本概念例子:有4个银行储蓄所,每月均完成10000笔人民币的存款、取款业务,但其投入情况不同,试分析这4个储蓄所的绩效。各储蓄所完成10000笔存取款的投入储蓄所B1B2B3B4职员数63107营业面积100120507036912306090120B2DB1B4B3职员数营业面积由虚线和B2B4B3折线右
3、上方所有点组成的集合为生产可行集。由虚线和B2B4B3形成的数据包络线称为生产前沿面处于包络线(或生产前沿生产面)上的决策单元称为DEA有效。 DEA是也可以看成一个线形规划模型,表示产出对投入的比率。通过对一个特定单位的效率和一组提供相同服务的类似单位的绩效的比较,使服务单位的效率最大化。获得100%效率的一些单位被称为相对有效率单位,而另外的效率评分低于100%的单位本称为无效率单位。 规模有效设某一单输入、单输出的生产函数曲线Y=f(x)具有下图所示的形状A生产函数曲线上的点均为技术有效,但它们的规模收益却不同。在A点的横坐标x1的左边,边际效益与平均效益之比大于1,即规模收益递增;而在
4、A点的右边,小于1,即规模报酬递减。XX1对于某一决策单元的生产活动(x0,y0),若它处于规模递增的生产函数曲线范围内,则说明该决策单元在投入x0的基础上,适当增加投入量,可望获得相对更高比例的产出增量。当x小于x0,规模报酬递增;当x”大于x0,规模报酬递减;Xo处于规模报酬不变或规模有效 二、评价决策单元二、评价决策单元DEADEA有效性的有效性的CRCR模型模型DEA有效性的评价是对已有决策单元绩效的比较评价,属相对评价。设有n个决策单元(j=1,n)每个决策单元有相同的m项投入(i=1,n) 相同的s项产出(r=1,s)。用xij表示第j单元的第i项投入量,yrj表示第j单元的第r项
5、产出量。X11 x12 x1nX21 x22 x2n : : :Xm1 xm2 xmn 决 策 单 元 1 2 n 123m投入Y11 y12 y1nY21 y22 y2n : : : :ys1 ys2 : ysn:12:s产出若用vi表第i项投入的权值,ur表第r项产出的权值,则第j决策单元的投入产出比hj的表达式为srrjr1jmiiji1j0srrj0r1j0miij0i1u yh( j1, n )v xh1,ju ym axhv x有则 对 第个 决 策 单 元 的绩 效 评 价 可 归 结 为 如 下 优 化 模 型 :-公式1) s , 1r ( 0u),m, 1i ( 0v) n
6、, 1j ( 1xvyuriijm1iis1rrjrrriim1iijitu,tvw,xv1t通过下式,转化为一个等价的线性规划问题-公式2-公式3-公式4) s , 1r (0m),1,0(iw1xwn),1,0(jyrjxwyyutmaxhriij0m1iis1rrm1iijis1rrj0rrj0s1rrj0-公式5-公式6-公式7-公式8若令公式6的对偶变量为(-),公式7的对偶变量为,则上述模型的对偶问题可写为:)n,1j(0)s,1r(yy)m,1i(xxminjn1jrj0ijjijijn1jj公式9公式10投入产出对偶问题的经济意义:为了评价j0决策单元的绩效,可用一个假想的组合
7、决策单元与其比较,公式9和公式10的左端项分别是这个组合决策的投入和产出。上述模型的含意为,如果的最优值小于1,则表明可以找到这样一个假想的决策单元,它可以用比评价决策单元更少的投入,获得不少于被评价决策单元的产出,从而表明被评价的决策单元为非DEA有效,只有=1时,才表明被评价的决策单元DEA有效。1、单一投入产出投入产出比(Total Factor Productivity, TFP )TFP(i)=Yi/Xi i = 1,nYi 代表第i家厂商的产出Xi 代表第i家厂商的投入例某公司有A,B,C等3个部门产出(Yi)为某年度i部门的办理的业务数投入(Xi)为某年度i部门的员工数 部门 A
8、 B C Y 70 80 90 X 10 20 10 TFP(A)=70/10=7TFP(B)=80/20=4TFP(C)=90/10=9三、实例解读三、实例解读技术效率(Technical Efficiency, TE)TE(i)=TFP(i)/TFP* TFP*为所有厂商中最高的TFP,本例中以部门C的TFP最高所以TE(A)=TFP(A)/TFP(C)=7/9=0.7778TE(B)=TFP(B)/TFP(C)=4/9=0.4444TE(C)=TFP(C)/TFP(C)=9/9=1人员(X1)与设备(X2)两种投入业务(Y1)与业务(Y2)两种产出一般的绩效评估方式:加权计分(主主观观的
9、的给予给予各投入产出权数) u1Y1i+u2Y2i TE(i)= - v1X1i+v2X2iU1为Y1的权数,u2为Y2的权数V1为X1的权数,v2为X2的权数如果我们无法确定地给予主观权数时,咋办?只能采用数据包络 u1Y1i+u2Y2i Max TE(i)= - u,v v1X1i+v2X2i u1Y1n+u2Y2n S.t. - 1 (n=1,2,3) v1X1n+v2X2n u 0, v 0目的在于为第i个部门找寻可使其TE达到最大的u与v隐含透过DEA 所找出來的权数为该部门最有利的权数将上式加入限制式与线性化之后获得 Max TE(i)=E= u1Y1i+u2Y2i u,v 约束条
10、件 v1X1i+v2X2i = 1 u1Y1n+u2Y2n v1X1n+v2X2n (n=1,2,3) u 0, v 0 将上式更一般化可获得 Max TE(i)=Ei= u1Y1i+u2Y2i+ umYmi u,v Subject to v1X1i+v2X2i + vkXki = 1 u1Y1n+u2Y2n+ umYmn v1X1n+v2X2n + vkXkn (n=1,2,N) u 0, v 0 此式为1978年由Charnes, Cooper and Rhode所发展,又称为CCR模式,或称乘数形式 (Multiplier form)或原始形式(Primal form)的DEA模式 案例
11、 7个部门,1个产出(Y1),2个投入 (X1,X2)部门 A B C D E F G Y1 1 1 1 1 1 1 1 X1 2 1 3 2 4 4 5 X2 4 4 3 2 2 1 1 就部门 A 而言:Max EA=u11s.t v12+v24=1 u11 v12+v24 u11 v11+v24 u11 v13+v23 u11 v12+v22 u11 v14+v22 u11 v14+v21 u11 v15+v21 u1, v1, v20部门 A B C D E F G Y1 1 1 1 1 1 1 1 X1 2 1 3 2 4 4 5 X2 4 4 3 2 2 1 1 Max TE(i)
12、=Ei= u1Y1i+u2Y2i+ umYmi u,v s.t v1X1i+v2X2i + vkXki = 1 u1Y1n+u2Y2n+ umYmn v1X1n+v2X2n + vkXkn (n=1,2,N) u 0, v 0 四四、两种模式、两种模式1、对偶(包络)模式投入导向:产出固定投入最小被称为投入导向模式Min S.t 1Ym1+ 2Ym2+ nYmn Ymi, m=1,2,M 1Xk1+ 2Xk2+ nXkn Xki, k=1,2,K1, 2,3, N 0ADBECEX1X2D=DB/ODOE=EE/OE投入导向模式2、产出导向:投入固定产出最大Max S.t 1Ym1+ 2Ym2
13、+ nYmn Ymi, m=1,2,M 1Xk1+ 2Xk2+ nXkn Xki, k=1,2,K1, 2,3, N 0ADBECEY1Y2B=DB/ODOE=EE/OE产出导向模式3 3、样本与指标关系、样本与指标关系关于服务单位的样本数量问题是由在分析中比较所挑选的投入和产出变量的数量所决定的。下列关系式把分析中所使用的服务单位数量n和所考虑的投入种类数m与产出种类数s联系出来,它是基于实证发现和DEA实践的经验: 2()nms 五、软件操作实例五、软件操作实例1、投入导向模式的规模回报,1个产出2个投入2、投入导向模式,1个产出1个投入3、价格效率的规模回报4、产出导向模式,曼奎斯特分析
14、,1个投入1个产出3个年度5、投入导向模式的规模回报,2个产出2个投入1、投入导向模式的不变规模回报 1个产出2个投入需要有三个基本文件命令文件应用程序稳定显示产出投入新建数据文件文本文件,用记事本建数据文件产出文件公司名称时间数目产出数目投入数目规模效率技术效率双击DEAP.EXE文件,输入eg1-ins.txt,点回车键产生结果文件技术效率值以firm1为例其技术效率值为0.5由于生产技术为投入导向表示该厂商的投入还有减少50%的空间各厂商的效率改善参考厂商:以firm 1 为例:它的参考厂商为firm 2以firm 2 为例:它的参考场商为他自己以firm 3 为例:它的參考厂商firm
15、5和2参考权数:以firm1为例:它的参考厂商firm2参考权数为0.5目标产出:达完全效率的情況下应获得的产出目标投入:达完全效率的情況下的最佳投入2、投入导向模式可变规模 1个产出1个投入vrste:纯技术效率 scale:规模效率(drs:规模报酬递减;-:规模报酬不变;irs:规模报酬递增) crste=vrstescale技术效率,也叫综合效率如果样本单元的纯技术效率(vrste)为1,而规模效率(scale)小于1时,说明样本单元本身的综合效率没有投入需要减少、没有产出需要增加;样本单元的综合效率(crste)没有达到有效(即1),是因为其规模和投入、产出不相匹配,需要增加规模或减
16、少规模。效率包括两部分: 技术效率和配置效率( Farre l,l 1957)。前者是指现有资源最优利用的能力, 即在给定各种投入要素的条件下实现最大产出, 或者给定产出水平下投入最小化的能力( Love l,l 1993); 后者则是在一定的要素价格条件下实现投入(产出)最优组合的能力。在完全竞争的市场中, 各要素的产出弹性等于投入要素所占总成本的比重, 此时配置有效率, 也就是不存在配置无效或者配置效率的损耗。3、价格效率的规模回报分别是第一投入、第二投入要素的价格SUMMARY OF COST MINIMISING INPUT QUANTITIES: firm input: 1 2 1
17、3.000 1.000 2 6.000 2.000 3 9.000 3.000 4 3.000 1.000 5 6.000 2.0004、产出回报模式 (Malmqusit Index)曼奎斯特指数分析1个投入1个产出3个年度 Malmquist指数首先由瑞典经济学家和统计学家Malmquist于1953年提出,用来分析不同时期的消费变化。 1982年,Caves等人首度将它用来作为生产率指数使用。此后与Charnes等建立的DEA理论相结合 ,逐渐演化出基于成本、规模效率和不变规模收益的Malmquist指数模型,在生产率测算中的应用日益广泛。在实证分析中,研究者普遍采Fare等构建的基于D
18、EA 的Malmquist 指数Malmquist指数是利用距离函数(Distance Function)的比率来计算生产率指数的。利用线性优化方法给出每个决策单元的边界生产函数的估算.对效率变化和技术进步进行测算,Malmquist生产率指数变动值即为全要素生产率( TFP)变动值。Malmquist 指数方法有这样三个优点:(1)不需要相关的价格信息,这对实证分析特别重要,一般情况下,相关投入和产出的数量数据比较容易得到,而要素价格等信息的获取通常比较困难(2)适用于多个地区跨时期的样本分析(3)可以进一步分解为技术效率变化指数和技术进步指数。可用(2) 式和(3) 式两个Malmquis
19、t 生产率指数的几何平均值来衡量从时期t 到t + 1 生产率变化的Malmquist 指数。用几何算术平均数求的当M()1表示生产率水平提高;M()=1表示生产率水平不变;M()1表示技术进步;TC=1表示技术不变;TC1表示DMU在t+l期与t+l期前沿面的距离相对于在t期与t期的前沿面的距离较近,相对技术效率提高;EC=1表示技术效率不变;EC 0 ,厂商就处于生产前沿下方,处于非技术效率状态也为待估参数,表示随机扰动项中技术无效率所占的比率。当接近于1 时,说明模型中的误差主要来源于技术非效率uit ,即此时实际产出与前沿产出之间的差距主要来源于技术非效率所引起的损失; 当 接近于0时
20、,这说明实际产出与前沿产出之间的差距主要来自统计误差等外部影响因素在统计检验中,若= 0 这一原假设被接受,说明所有测算的生产点均位于生产前沿曲线上,此时则无须使用SFA 技术来分析,直接运用OLS 方法即可。 是待估计的参数, 当 0 时,exp -(t -T) 将以递增的速率下降,即技术效率随着时间的推移会以递增的速率降低; 当 0时,exp -(t -T) 将以递增的速率增加,即技术效率随着时间的推移会以递增的速率增大;当= 0时,exp -(t -T) 将维持不变FRONTIER Version 4.1准备以下几个文件1) FRONTIER41.EXE2) FRONT 41.0003)
21、 A data file (TEST.DTA)4) instruction file (TEST.INS)5) output file (TEST.OUT)1、柯布道格拉斯生产函数前沿利用截面数据和假定半正态分布012ln()ln()ln()()iiiiiQKLVU运算结果2总体方差2=u2+2是生产波动幅度的反映,受到随机因素和无效率的影响,其值小于1,表明误差项和无效率项波动幅度均不大方差比 代表误差项的方差中技术无效率方差所占的比重,即=u2 /(u2+2 ),其值越大,表明技术无效率对生产的波动越具有解释力,同时也表明随机前沿模型比决定性模型更适合2、超越对数生产函数(简称Transl
22、og 函数)其中0,1,2,3,4和5为待估计参数。22012345lnlnln(ln )(ln )ln lnfKLKLKLTranslog 函数本质是生产函数f(1nK,1nL)在(0,0)点的近似二阶泰勒展开,当3=4=5=0 时,就退化为CD 函数。在SFA 中,选择CD 函数的主要优点是其形式简洁,参数有直接的经济学含义(1和2表示资本和劳动的产出弹性);选择Translog 函数的主要优点是考虑了资本和劳动相互作用对于产出的影响,克服了CD 函数替代弹性固定为1 的缺点。需要注意的是,虽然CD 函数是Translog 函数的特殊形式, 但不意味着选择Translog 函数就一定比CD
23、 函数效果好我们首先选择Translog 函数,在参数估计后做3=4=5=0 是否为0 的似然比检验。若不能拒绝3=4=5=0 的原假设, 则选择CD 函数; 反之则选择Translog 函数。其检验统计量LR=-21nL(H0)/L(H1)近似服从x 的分布,自由度为待检验参数的个数(自由度=3)。还可再根据参数估计的结果是否符合常理及相应的t 值做出综合判断。单侧LR 检验的原假设:模型为决定性模型,也就是说不存在生产的无效率项,即2=0,LR 值近似服从自由度为3 的卡方分布。具有4个年份,15个单位,分析MU值可以进行OLS随机前沿分析与数据包络分析 方法的评析与比较在经济学中,技术效
24、率是指在既定的在经济学中,技术效率是指在既定的投入下产出可增加的能力或在既定的投入下产出可增加的能力或在既定的产出下投入可减少的能力。产出下投入可减少的能力。常用度量技术效率的方法是生产前沿分析方法。所谓生产前沿是指在一定的技术水平下,各种比例投入所对应的最大产出集合。生产前沿通常用生产函数表示。前沿分析方法根据是否已知生产函数的具体的形式分为参数方法和非参数方法前者以随机前沿分析(Stochastic Frontier Analysis,下文简称SFA)为代表后者以数据包络分析(Data Envelope Analysis,下文简称DEA)为代表。1、SFA 模型SFA 是前沿分析中参数方法
25、的典型代表,即需要确定生产前沿的具体形式。与非参数方法相比,它的最大优点是考虑了随机因素对于产出的影响。SFA 要解决的问题是要度量n 个决策单元T 期的技术效率(TE),每个决策单元都是m 种投入和一种产出面板数据问题,SFA 最常用的模型基本组成如下和向量 是待估计参数。在上述模型中,yit为第i 个决策单元第期的实际产出;xit为第i 个决策单元第t 期的投入向量;f(xit,)为某种生产函数;vit为随机扰动项, 表示诸如天气等随机因素对于产出的影响,由于该随机因素可使产出增加或减少常假设it=vit-it为合成误差项,由于it的期望是小于0,因此不能直接用最小二乘法估计参数, 而是在
26、求出it的密度函数后用极大似然估计的方法估计出各个参数,然后通过 的条件分布| 求出条件期望E(exp-it|it)作为技术效率TEit的估计值通过? 的取值,可以判断本批数据是否有必要用SFA 模型。已知? (0,1),当? 0 时,表明v 支配 , 几乎没起作用, 此时用最小二乘法就可分析; 当1时,表明 支配,v 几乎没起作用,此时没有必要用SFA,用确定型的前沿分析就可分析。因此对 做是否为0 的极大似然比检验是必要的,它的检验统计量渐进服从于混合x 分布正确的做法应根据客观的统计检验来决定选择使用哪种生产函数。首先选择Translog 函数,在参数估计后做3=4=5=0 是否为0 的
27、似然比检验。若不能拒绝3=4=5=0 的原假设, 则选择CD 函数; 反之则选择Translog 函数。其检验统计量LR=-21nL(H0)/L(H1)近似服从x 的分布,自由度为待检验参数的个数 SFASFA与与DEA DEA 的共同点的共同点SFA 与DEA 都是前沿度量方法,它们的共同基础是距离函数SFA与DEA都是在通过构造生产前沿的基础上度量技术效率。它们度量出的技术效率是相对效率,其效率值在样本内部具有很强的可比性,但在不同样本间计算出的效率值可比性不强。 SFA 与DEA 的不同点(1)SFA 与DEA 模型基本假设和模型扩展的复杂程度不同。 SFA 的模型基本假设较为复杂,需要
28、考虑生产函数、技术无效率项分布的具体形式,这直接导致模型很难做进一步扩展。 DEA 的主要优点是不需要考虑生产前沿的具体形式,仅需要投入产出数据,模型容易做其他形式的扩展,目前已有数十种DEA 模型。(2)SFA 与DEA 对实际产出的解释和处理方法不同 SFA 最主要的优点是考虑了随机因素对于产出的影响,它实质上将实际产出分为生产函数、随机因素和技术无效率三部分。 DEA 的最大缺点是把实际产出小于前沿产出的原因全部归结于技术效率原因, 忽略了随机因素对于产出的影响, 它实质上将实际产出分为生产前沿和技术无效率两部分。(3)SFA 与DEA 构造生产前沿的方法不同。 SFA 的基本思想是利用
29、生产函数和随机扰动项构造出随机生产前沿 DEA 是根据个决策单元的投入产出数据,选出一个或几个决策单元作为技术有效点,进而构造出生产前沿。SFA 是通过极大似然法估计出各个参数值,然后用技术无效率项的条件期望作为技术效率值,其结果一般不会有效率值为1 的决策单元DEA 是通过线性规划计算出效率,其结果至少有一个效率值为1 的决策单元SFA 可对结果做相应的统计检验或者求相应的置信区间,而DEA 则不可作(5)SFA 与DEA 可获得的相关经济信息不同。就本文所总结的模型而言, 除了能够计算技术效率外,SFA 还可通过参数值求出投入的产出弹性和规模报酬情况。而在DEA 的模型中,可求出规模效率和规模报酬情况。(6)SFA 与DEA 分析影响效率因素的方法不同。通常在计算出技术效率后会进一步分析影响效率的因素。 对于SFA, 只需将技术无效率项表示成影响因素的线性形式后在原有模型中即可完成对影响因素各个参数的估计。 对于对于DEA,通常需要分为两阶段。第一,通常需要分为两阶段。第一阶段是计算其技术效率,第二阶段是以技术效阶段是计算其技术效率,第二阶段是以技术效率为因变量以影响因素为自变量通过二元离散率为因变量以影响因素为自变量通过二元离散选择模型进行分析。选择模型进行分析。在分析影响效率因素上,SFA 更为方便。