数据分析方式浅谈
发布时间:2016-05-23 16:45:43
目前,审计机关的计算机审计应用方向主要是数据分析和系统分析,相比较而言,数据分析在审计中的应用更为成熟广泛,占据着计算机审计的主要地位,系统分析限于技术能力,开展的该不够广泛。所谓审计数据分析,是指审计人员通过对被审计单位电子数据的采集、整理,形成自身所需的审计中间表,在此基础上运用查询、验证、挖掘等分析方式进行数据的观察和分析,从而达到把握总体、突出重点、精确延伸的审计目标。
一、审计数据分析的步骤
我们在实施计算机审计数据分析的过程中,一般都要经历三个步骤,即数据采集、数据整理和数据分析(参见图1)。其中,数据采集阶段负责采集被审计单位信息系统的财务数据和业务数据,如通过SQL Server软件的DTS工具进行数据的转换导入,或者通过AO等专用审计软件进行数据的转换导入等;数据整理阶段负责将采集到的电子数据进行清理和净化,如对空值的替换、错误值的检测和改正、字段类型的调整等,形成审计人员易看、易懂、易操作的审计中间表;数据分析阶段则是在审计中间表的基础上,对数据进行多层次、多角度的观察和分析,推断重点,发现疑点,形成计算机审计结论。
二、审计数据分析的分类
数据分析按其类型可划分为:查询型分析、验证型分析和挖掘型分析。三者之间相互联系又相互区别,应用的层次各有不同。
查询型分析:这是目前应用最为普遍的一种数据分析类型,指审计人员利用SQL技术访问和查询数据记录,进行筛选、查找、排序、计算等操作性分析。例如在计算机审计中级班学习中学到的在企业财务审计中,通过对销售收入、销售成本等参数的公式计算,将所有产品按照其销售毛利率由高到低顺序排列,结合销售数量等因素,可以很容易地把握各种产品的边际盈利情况和总体盈利情况。类似的例子还有对车辆保险违规无赔款优待情况的审计,审计人员可以在车辆出险赔付表中检索出所有出险的车辆记录,再通过车辆发动机号作为关键字与车辆有效保单表进行连接,从中分析出上一保险期出险而第二年继续享受保费优惠的车辆记录。
验证型分析:审计人员首先提出自己的假设,然后利用数据分析方法来验证或否定自己的假设,从数据中确定审计事实。验证型分析的关键,是要能提出合理相关的假设,而这一点则与审计人员的职业判断和经验积累息息相关。例如,在对大型国有烟厂销售情况真实性的审计中,审计人员发现,烟厂对香烟的包装有一定的标准,一般是每大件装5箱,每箱装50条盒,每盒装10包,即1件=5箱=250条=2500包。可以根据这一情况,审计人员就可以提出假设,如果香烟的包装标准或工艺没有比较明显的变化,那么各个期间内香烟的产成品数量与消耗的包装物数量应该成比例关系,再通过这一合理假设来验证烟厂销售收入的真实性。
挖掘型分析:这是一种以海量数据为基础的深层次数据分析方式,它支持审计人员从不同的角度,灵活快捷地对被审计单位的电子数据进行挖掘,并以直观易懂的形式展示分析结果。相较于传统的SQL查询,挖掘性分析所使用的多维概念和表现模式更符合人的思维习惯,更适宜于高效地聚合、检索、观察和分析数据。关于挖掘性分析,非常典型的实例就是审计署广州办开展的商业银行计算机审计。该办金融审计处在导入银行的电子数据后,利用构建的商业银行风险审计模型,从贷款主体、贷款项目、资金流向等角度进行挖掘分析,推断银行整体信贷情况和经营风险,挖掘审计疑点,明确重点机构、重点环节和重点企业。在后来的多次审计中,审计人员利用这个模型共查出违法违规金额300多亿元,并发现了诸多金融大案。
三、审计数据分析的方式
计算机审计中的数据分析往往内容多样,审计人员可以根据实际工作情况,灵活地加以选择或搭配使用。常见的数据分析内容有:
筛选:将数据表中符合审计人员设定条件的所有记录查找出来。如对教育储蓄合规性进行审查,审计人员可以筛选储蓄人身份有效证明不规范、本金超过2万元限额、储户本人年龄明显与在校学生合理年龄不符等数据记录。再如金融审计中通过对贷款期限、展期期限、还款金额的条件筛选,查找商业银行贷款业务中展期不合规的记录等。
排序:将所有数据记录按升序或降序排列。一般而言,相同性质的数据,金额大的应加以更多关注。典型的如税收审计中通过对纳税人全年入库税额进行排序,从而确定重点税源户以便下一步进行审计延伸。
重算:对数据按照与被审计单位相同或相似的处理方法重新计算,常用于验证被审计单位提供资料的真实性和正确性。如金融审计中的表外息计算、税收审计中的税款滞纳金计算、社保审计中的养老保险个人账户余额的计算等。
检查:对数据或处理流程进行审核,目的是检查被审计单位执行相关政策、法规或制度的情况。如检查医院门诊、病区的收费是否严格按照物价部门核定的项目和标准来执行。
核对:将具有内在联系的数据,按其勾稽关系进行核对与排查。如财务审计中总账与明细账之间的核对,海关审计中出口申报货物重量与码头过磅货物重量之间的核对,城建税、教育费附加是否成比例关系等。
抽样:将审计人员关注的或具有代表性的一部分数据挑选出来,缩小审计范围,降低审计风险。通过计算机进行数据抽样不仅效率高,而且能很大程度地减少手工抽样中难以避免的主观因素。
统计:对数据记录进行分组求和、求平均值、求最大值、求最小值、求标准差等操作。如在金融审计中,对商业银行贷款按其方向进行分组统计,看其是否存在信贷集中风险,是否将贷款投放在了少数几个行业或企业上。
分类:先在主观上设定不同的类别,再根据数据的属性将其分派到相应的类别中,以便能够预测未知数据的归属。如将社会保障基金记录按缴费情况分为正常、少缴、未缴等几类,帮助审计人员更有效地把握社保费缴纳的分类特征。
聚类:将相似性高、离散度小的数据分组,观察各组客观上所具有的不同特征。聚类分析与分类分析明显不同之处在于,后者所使用的数据是已知类别归属,而前者的类别归属是要审计人员自己从数据的分布中归纳出来的。
演化:基于数据的类似性和规律性,对数据记录随时间变化的发展趋势进行推断。比如根据参保人正常的退休年龄和以往养老金的发放标准,推断今后若干年内养老保险基金的支付规模,借以评估未来的社会保障支出负担以及可能存在的资金缺口。
异常:找出明显与其他数据偏差较大的“噪声”记录。如预算收入真实性审计中,审计人员在各月的数据中找出收入数明显大于或小于其他会计期间的记录,以便有重点地核查是否存在虚增、虚减预算收入的情况。再如,在税收审计中将营业税各月入库总数比较,查看是否有明显大于或小于的月份,防止人为调整的情况。
参考文献
[1] 苏运法,袁小勇,王海洪.计算机审计[M ]. 北京:首都经济贸易大学出版社, 2005
[2] 董大胜主编. 审计技术和方法[M].中国审计出版社, 2001
[3] 刘绪文. 关于计算机审计中导入数据的几点认识〔J〕.审计与理财,2005(10)
[4] 以上例举的案例来自审计署中级班教学试题及部分现实案例。
上一篇: 政府投资项目审计法治化建设路径探讨
下一篇: 没有了