学位论文中,方法的说明是不可缺少的部分。一份科学研究成果要符合重复性的要求,经得起检验,他人按照论文所设计的论证方法再去做一遍,也能得出同样的结果。所以论证方法的内容要按可重复性的要求来描述。论证方法这节一般包含研究对象的描述,以及数据资料收集方法的说明。
一、研究对象描述
学位论文的研究对象可归结为以下几类:个人,如企业高层管理者、工人、工程师、政府官员;群体,如按年龄或学历、工种划分的员工群;组织,如企业、学校、医院;社会产品,包括有形产品,如汽车家电产品,以及无形产品,如管理渠道、商誉。研究工作中,出现频率高的要算个人和组织。
描述内容要说明研究对象的总体特征,如研究对象为个人,须交代如年龄、学历等与因变量有关的人口学特征。如对象为企业,要交代所属产业类型、规模、所有制等。描述总体特征的目的,是让从事类似研究的读者,能够判断出该研究结果的适用范围,如都是研究薪酬制度问题,国有大型企业行之有效的薪酬制度,显然不能照搬到民营中小企业。
对象描述中还包括从总体中抽取样本的方法,是随机抽样还是非随机抽样,样本的规模多大等。
吴量福在《公共组织与私营组织中信息系统的异同点》一文中,用下面这段文字,把研究对象总体特征和带有该研究问题特色的抽取样本方法,描述得很清楚,可供参照。
抽样的总体目标是所有在此地区的九个县管辖的市政府,以及所有私有企业。市政机构的选择是根据“政府机构人名地址大全”,私营组织的抽样是根据当年的“工商企业录”进行的。问卷是集中在那些职工人数在50 ~ 500的组织机构。控制组织规模是因为有文献证明,规模大小影响到计算机应用的水平,组织越大,对计算机的依赖程度越高。如果抽样时,对组织规模不加控制,就无法在“组织性质”和“组织规模”之间确认哪个因素在起作用。除了人数外,对政府机构没有其他限制,全部抽样。对私营组织,仅选择了“服务型”公司,因为市政府实质上是个服务机构,这两类组织机构有较高的可比性,如将生产型企业也包括进来,那些用计算机控制生产流水线的公司,对计算机应用程度较高,这显然又引进了一个影响因变量的因素。按“服务型”公司清单,先采用随机采样的方法,然后再根据职工人数筛选。
有的论文写道:“本调研问卷的被试者有210个样本”,接着按性别学历、所属企业类型等,对样本作了统计描述。这样的说明是不够的,要说清样本设计过程,是如何抽样的,为什么这样取样。如吴量福的描述中,介绍了取样的特点,选择“职工人数在50 ~500的组织”“服务型公司”等,并解释了这样取样符合研究意图。
任意选取一些样本,不说明取样的依据,即使出示样本的构成,也难以让读者相信样本具有代表性,能够体现总体的特征。有的论文研究对象总体是企业高层管理者,调查对象却是学校的学生;有的论文研究对象只笼统说是企业,总体就没界定清楚,而样本则局限于某类企业;有些冠以实验研究的论文,却没有介绍研究对象是如何划分成实验组和控制组,以及两组成员是如何挑选的。这些都令人对调查结果产生怀疑。
二、数据收集方法
数据收集的内容包括变量设计,以及数据收集工具及步骤的说明。
1.变量设计。
论点树的构造从主论点开始,层层转换到操作论点时,便可进入论证工作。操作论点的实证论证,实际上是从操作论点所含变量的数据收集着手。讨论数据收集方法,要视变量的性质而定。操作论点所涉及的变量,不一定可直接测量,有个从名义变量转换到操作变量的变量设计过程。
研究生学位论文有时会用到线性结构方程,其中就有潜变量和显变量之分。
不能直接观测的潜变量要转化成可观可测的显变量,这其实就是变量设计的内容。
有的论文,只是罗列出这些变量,没有说明转换成这几个显变量的依据和逻辑推理过程,这就有“不够严谨”之嫌。
还是用《公共组织与私营组织中信息系统的异同点》一文来说明变量操作化的过程。该文待实证的操作假设为:“私营组织较之公共组织,对信息系统应用的重视程度要高”和“私营组织较之公共组织,对信息系统的投资更多”。这两个假设,自变量为组织类型(属性为私营,公共),因变量第一个为重视度( perceivedimportance) ,第二个为投资额。
这些变量中,组织类型是定性数据,根据政府或工商资料可作出判断,重视度这个名义变量却须转换成操作变量,才能收集量化数据。该文作者将重视度转换为两类变量,一类属于实际数据的硬指标,一类属于认识性数据的软指标。
硬指标包括:组织中从事计算机技术工作岗位的人数占总人数的比例;按人均计的计算机技术投资额;计算机技术的培训费用;培训过计算机技术的人员占总人数的比例,等等。这些可以从企业和公共组织披露的现有统计数据中得到。
软指标包括:计算机技术在决策过程中的重要性;计算机技术在终端用户培训中的重要性;计算机技术培训的重要性,等等。这些指标通过问卷,向计算机技术专业人员和高层管理人员调查,得出所需的定量数据。
从该文的变量设计可以看出,能用硬指标实际数据的,尽量用硬指标,实在找不出合适的硬指标,再去设置软指标。如该文用到的“重视度”,照理说,这是个主观判断的软指标,作者还是用“从事计算机技术工作岗位的人数占总人数的比例”等硬指标来测量,附加以软指标。有的学位论文作者,为了图方便,把硬指标也当成软指标一样来操作。如论证某个因素对企业绩效的影响,“企业绩效”这个变量,本来可用财务报表的实际数据来测度,却要设计问卷,让人主观判断企业绩效如何,这犹如有磅秤不用而让人去目测估计体重。
从该文的软指标设计还可看出,尽量不涉及被调查者个人的利益和感情偏好,如“计算机技术在终端用户培训中的重要性”这种问项,答案不至于受到个人利益和感情偏好的影响。有的论文设计一些与主观偏好密切相关的问项,如为了调查某企业高层管理者的创新意识,就直接向高层管理者发问卷,问“你认为自己的创新意识如何”,答案分五级,这种数据不可能准确。犹如智商测试,不会去直接问当事人“你的智商属于哪一级”,而是通过不涉及主观偏好的间接问项来判断智商。
变量设计中还有个问题应该交代清楚,就是名义变量转换成操作变量的根据,就像该文的“重视度”,为什么用这么多硬软指标来测量它,论文中要有说明,应能让人读后认可这些指标的效度。
2.数据收集工具和步骤。
操作变量的性质决定了数据收集是用实验法、问卷法、访谈法还是现有统计数据法,无论用何种方法,都须对该法的要点作出说明。如实验法,须说明实验组和控制组成员是如何分配的,以及观测手段、实验流程等,同时描述实验过程对于各种误差的控制方法。问卷法则须说明问卷的研发过程,问卷精度和有效性,事前测试和事后问卷修改情况,计分办法等,同时描述问卷散发和回收的状况。现有统计数据法要说明数据来源以及与本研究的关联程度。
吴量福在(《政治学研究方法与论文撰写》(2007)一书中,介绍了一个面向市民的民意调查,其目的是了解居民对市政府服务的满意度。书中描述了问卷设计的过程:
问卷设计采用了一种自下而上的方法。先是由市政府各部门(警察局,市政工程局等)根据自己提供的服务,将有关问题提交到市长办公室。然后,项目小组将各类问项分为四大部分:公共安全;市政建设;市政工作人员的服务质量;对年度发展的建议。共列出105个问项。此外,问卷还包括一些涉及回复者本人情况的问题,,如性别、年龄、家庭收入、教育水平等。
问卷还包括一个能帮助识别抽样误差的问题,即回复者住宅的地址。项目小组在问卷中附上一张地图,将市的各社区分成东南、西南、东北、西北四个地区,便于回复者直观地回答问题。
绝大部分问项是询问居民对各类服务的满意度。采用适合这类问项的“李克特量表”。要求回复者从6个答案中选择一个:很不满意;不满意;满意;好;很好;没有看法。
《公共组织与私营组织中信息系统的异同点》一文对于问卷回收情况中出现的问题作了说明。该问卷的回复率,私营企业和公共组织分别为41%和74%,显现的问题是,公共组织远高于私营企业的回复率。这一个差距意味着公共组织比较愿意回复,而私营企业可能视计算机系统为经营机密,不大愿意参加这项问卷调查。这造成“选择性缺陷”,影响内部有效性。这个问题不是用抽样设计能解决的,所以在发送问卷时,应该附上一封信函,解释问卷目的并保证所采得信息的使用范围,以提高回复率。