在项目研究过程中,经常会遇到对文本数据的处理与分析,特别是随着行业的发展,对文本数据的处理需求会越来越大。
通常对文本数据处理方法有两种:
1、对于样本量较大项目,则对文本数据进行编码,使文本数据量化;
2、对于样本量较小的项目,研究员对文本数据进行归纳,得出归纳性的结论。这里要介绍的第三种方法,暂且叫关键字法,是在文本数据中寻找关键字,对关键字出现的频率进行统计分析,其基本思想和编码法类似,但它可以利用计算机技术对文本数据进行处理,从而大大减少处理时间、提高工作效率。
下面将简单介绍一下关键字法。
基本思路:
1、将所有文本数据录入计算机,为计算机处理做准备。
2、随机抽取一定比例样本,人工对文本数据进行提取关键字(关键词),关键字为出现频率较高的字词,并且这些关键字对于研究对象是有意义的。比如在对服务人员“语调”方面的评价中,可以提取“僵硬 ”、“傲慢”、“软弱无力”等 词语。对关键字提取的准确性直接影响到数据处理的准确性。
3、计算关键字出现的频数。根据关键字,利用计算机技术相关软件对文本数据进行处理。这里可以用Excel、SQL等相关软件,利用软件提供的查找函数或相应程序语句对文本中出现的关键字频率进行计数或统计。需注意,对同一样本同一开放题中出现的重复同一关键字做不重复计数,这样才能反映关键字在所有样本中出现的频率。
4、对关键字计算出现的频率。在对所有样本计算出出现的频数后,将频数除以样本量,得到关键字频率。如:对服务厅的服务人员进行神秘顾客暗访,样本量为1000。在对服务人员“语调”方面的评价的文本数据中,关键字“僵硬”单个样本不重复计数值为105,则关键字“僵硬”出现的频率为10.5%。
5、研究员对关键字及其出现频率的运用。10.5%的服务人员在提供服务过程中出现语调僵硬,这种频率是高还是低?如何改进服务语调?此时研究员可尽情发挥。
对关键字法的质量把关:
1、关键字法对开放题设计有较高细分要求,开放题的问题分得越细,被访者回答的范围则越小,关键字的提取及计算机处理就越准确。
2、提取关键字所随机抽取的样本数量会影响到关键字的质量,抽取的样本量越大,关键字的数量和的准确性就越高。
3、关键字的提取需要丰富经验的人员进行处理。他们需要了解关键字法的操作流程,掌握开放题的设计技巧,熟悉被访者对开放题的回答思维与语言表述。
对关键字法的评价:
关键字法相对于编码法,可大大缩短项目执行时间与降低QC的工作强度,提高工作效率。样本量越大,这个优点越明显。
关键字法的缺点是对关键字的提取数量和质量直接影响到数据的质量。
在未来的研究实践中,关键字法将会的到改进与完善,使之发挥更大的效率。
|