硕士论文网第2020-09-07期,本期硕士论文写作指导老师为大家分享一篇
毕业论文文章《基于在线评论数据挖掘的用户需求研究》,供大家在写论文时进行参考。
采用实证研究的方法:选取京东平台华为品牌 3 种不同型号的智能手机在线评论数据作为研究对象,在 python 环境下运用 LDA 模型对在线评论进行主题聚类,识别其中用户需求要素,总结出用户产品特征关注的指标,并分析不同产品的需求差异。
第1 章 绪论
在本章中,笔者首先介绍研究的背景,引出本文研究问题,重点关注并分析国内外研究现状,提出研究目的及意义;最后梳理论文的研究思路及整体框架,并介绍在写作过程中将运用的研究方法。
1.1 研究背景及问题提出
目前,“用户至上”的经营理念已被众多企业广泛认可。“用户至上”强调企业在设计产品、提供服务的过程中始终以用户为中心,以能够让用户感到满意成为生产和经营的核心追求。在实践过程中,用户的重要性也不断被加以印证。随着用户的消费观念和消费行为不断变化,用户需求逐渐变得更加多样化和个性化。从早期主要着眼于产品的基本功能,到目前用户已经开始给予更多的精力关注产品附加功能、服务情况等全方位要素。此外,在瞬息万变的市场中,用户需求常常处于动态变化的过程中,因此,在这样的背景下,市场无疑对企业提出了更高的要求。为了在众多激烈竞争的企业中赢得宝贵的市场份额、持续生存和发展,企业必须能够精准地把握用户需求,并且需要在市场环境的变化中识别用户需求变化,及时调整产品及服务的竞争战略。借助互联网平台的匿名性、交互性、个性化等特点,越来越多的用户愿意在网络社区或电子商务网站上浏览和发布评论,以达到产品信息交流和购物体验分享的目的,在线评论在这种环境下应运而生。在线评论是产品口碑的信息披露重要形式,冲破了传统口碑在时间和空间上的限制和传播的壁垒,对企业和消费者来说都存在潜在价值。用户导向的在线评论代替传统产品口碑,直接影响消费者的购买决策;同时,因在线评论中蕴藏着有关产品和服务质量、用户情感态度等丰富的信息,目前成为网络环境下用户需求获取的重要来源,逐渐成为企业和电子商务平台所关注的焦点。目前,伴随互联网技术和社会信息化水平不断提升以及网络通信基础设施日益完备,我国移动互联网飞速发展并呈现逐步深化的趋势,移动互联网可以使人们不受时间和地点约束就能获得服务,逐渐渗透到人们工作和生活中的各个角落。而智能手机作为移动互联网的终端之一,因其方便快捷、功能完备等特性,逐渐成为人们社会生活中必不可少的通信设备。目前,我国智能手机用户数量庞大,已形成一定市场规模,且用户的消费热情持续高涨,智能手机的更新换代十分迅速,因此激发着众多企业不断地开发出新产品以满足更多消费者的需求从而获得更大利益。
1.2 国内外研究综述
在线评论作为消费者购后重要的信息披露渠道之一,其内容中包含了大量的用户情感和购买体验。针对在线用户评论信息行为的基础研究主要从三个方面进行开展:在线评论有用性的影响因素、在线评论对消费购买行为的影响、用户发布在线评论的动机。其中在线评论有用性是指用户对电子商务平台中在线评论有用价值的感知。现有文献主要围绕在线评论信息质量和信息来源可信性分析影响用户感知评论有用性的因素;此外,还有一些学者关注负面评论有用性的影响因素和商品类型对有用性的调节作用。一般来说,有用性强的在线评论能够促进消费者发生购买行为。因此,一些学者基于在线评论信息采纳的过程,进一步探究消费者购买意愿及行为的影响因素:李宗伟等(2017)基于顾客感知价值视角,通过淘宝网的大样本评论数据,证实在线评论长度、产品销量、卖家等级及服务评分和店铺运营时长积极影响消费者的在线购买行为;王阳等(2018)究指出在线评论的负向情感、时效性和感知风险对潜在消费者的购买意愿构成显著影响,其中负面情感倾向影响程度最大。挖掘用户发生评论行为的动机也引发了一些学者的兴趣:葛继红等(2017)从评论者自身、在线平台和商品卖家 3 个维度提炼用户在线评论的动因,通过实证研究得出用户发布在线评论的显著动因依次为获取奖励、提升形象、情感交流、支持平台发展和改进产品或服务;Hussain S 等(2018)基于信息采纳模型,从线上食品购买的角度探讨了在线评论用户群体行为动机,研究表明消费者对社会互动,经济激励和自我价值强化的需求是参与在线评论的主要动力;彭丽徽等(2019)基于网络口碑动机理论、消费者满意度模型和 TAM 模型,从消费者感知视角出发,从感知质量、感知期望、感知价值和感知情感 4 个方面测度影响消费者网络口碑发布行为的因素。总体来说,以上三方面的研究在在线评论研究领域关注广泛,且研究方法比较多样。前人对于在线评论的内容特征能够积极影响评论有用性的观点达成一致。因此,再进一步研究中,挖掘在线评论文本以便从大量非结构化的原始评论数据中获得更多的在线评论知识发现,引起了众多学者浓厚的研究兴趣。目前,众多国外学者通过数据挖掘技术手段有效从用户生成的评论内容中提取可量化数据进行主题分析:Kang 和 Zhou(2017)提出了一种基于规则的无监督学习方法 Rub E,并利用其从在线用户评论中提取搜索型产品的主、客观特征;Wong 和 Qi(2017)使用文本挖掘技术调查 2005 年至 2013 年期间 Trip Advisor平台上有关澳门的在线评论的演变,并将用户生成的在线内容的演变与官方平台预测进行了比较,二者呈现出相似趋势;Ren 和 Hong(2019)从亚马逊平台在线评论中提取离散情感,并研究了三种离散情感(愤怒,恐惧,悲伤)对感知评论有用性的不同影响,解释了负面情绪在评价的感知中的重要作用。本文利用文本挖掘技术识别在线评论中所包含的用户需求要素,讨论在时间序列上用户需求的演变情况。本文写作目的主要集中于以下四个方面:(1)从在线产品评论数据中获得并分析目前华为品牌智能手机产品的用户关注度情况,分析定位不同的产品用户群体的主要关注点差异性。 (2)通过对真实在线评论数据进行分析,筛选出用户需求要素,结合传统用户需求分析模型——Kano 模型,以期改进用户需求分析方法。(3)分析在线评论时间序列上用户关注主题的演变情况,揭示不同主题词之间共现关系。(4)为企业在海量数据资源中迅速反应、有效挖掘用户需求提供重要参考,以便企业能够在未来开发出更加符合用户需求的产品。
第 2 章 相关概念及理论基础
本章是研究的理论基础,笔者对本研究中主要涉及的在线评论、用户需求、文本数据挖掘等内容进行详细介绍,同时对 LDA 模型、Kano 模型和用户满意度指数的概念进行梳理,为后续研究提供重要的理论支持。
2.1 在线评论
由于在线评论的定义尚未形成统一,本节将对前人研究中关于在线评论的定义进行解释和梳理,并进一步理解在线评论的内涵和特征,接下来对在线评论行为的构成要素进行说明,最后关注在线评论的时间特征,解释时间序列的涵义并阐述在线评论的时间序列数据的特征。 在线评论的概念由国外学者 Chatteijee 于 2001 年首次提出,一经提出便引起了学术界和企业界的广泛关注,但是在线评论的涵义在学术界始终未得到统一,
表 2.1 显示了后续的学者在研究中基于不同的研究角度和思路对在线评论提出的新的定义:
通过对前人提供的在线评论定义的综合理解,笔者认为在线评论是用户通过Web2.0 技术与他人在网络平台上以文字、图片、视频等形式来交流、分享他们对于在线销售的产品或服务的观点、体验和情感态度。提供用户进行在线评论的场所可能是电子商务网站、网络社区或其他线上评论平台,主要作用是用户的主观意见抒发和情感表达。在线评论中蕴含着丰富的信息,其特征主要为信息传播范围广、信息量可测量以及具有一定真实度和可信度。因此,在线评论详细地反馈了消费者产品和服务购买体验的信息,对生产厂商、电子商务平台和消费者均具有重要的潜在价值。目前受到多学科领域研究人员和生产企业的广泛关注。
2.2 用户需求
本节首先通过解释用户需求的内涵说明其对于企业发展的重要意义,接下来提出用户需求的主要特征,最后梳理目前用户需求识别的主要方法,介绍每种方法的实现过程并对不同方法的特点进行分析和对比。用户需求可以简单理解为“用户想从产品中获得什么”。因此,产品的存在源于用户需求,以用户需求为核心的产品设计和营销策略,能够帮助企业在竞争中获得优势。满足用户需求是企业在进行生产产品、提供服务时的最初动力,产品或服务设计的成功与否主要衡量该产品或服务是否可以持续地满足市场上大多数用户的需求。目前,企业处于竞争激烈的多元化细分市场,产品和服务种类和形式越来越丰富多样,同时用户的要求越来越高,在基本需求得到满足时追求个性化需求,若想在这种环境下占领可观的市场份额,必须抓住更多用户的真实需求。但再优质的产品也难以满足所有用户,所以企业要识别出最能影响用户满意度的需求或能大幅度提高用户满意度的需求,并对这些需求所映射的产品特征进行定制和不断改进,而用户在使用过程中感知无用的功能,则可以适当弱化甚至省略。基于Web2.0 的通信平台上进行的有关产品和服务的在线讨论是商家获取用户需求的宝贵知识来源。根据用户需求的内涵,可以总结出用户需求具有以下 4 个方面特征: (1)复杂性。由于每个用户都是独立的个体,因此他们对于产品的关注点不同,例如一个用户专注于产品某项功能的实现,而其他用户却不以为然,即使面对同一项功能,不同的用户具有不同的想法和喜好。此外,他们对于需求表达的形式也存在一定差异。在互联网产品和服务不断丰富形成的激烈竞争市场环境中,消费者的选择范围更广,用户需求逐渐变得更加多元化、复杂化,因此企业通过不断地改进自身产品和服务的质量以满足用户需求。 (2)动态性。用户需求往往不是一成不变的,会受到时间、空间或其他外界因素地影响而发生改变。例如在产品的需求池中,有些需求在目前实现困难是用户的边缘需求,但在时机成熟时,该需求又将成为关键需求,给用户带来惊喜的使用体验。因此,在通常情况下,用户需求是动态变化的。产品和服务价值在于能够持续地满足用户需求,企业需要在用户需求转变时能够快速反应并持续利用先进的技术手段为消费者提供更加智能的服务,从而提高企业在激烈市场竞争环境下的生命力。 (3)隐藏性。用户有时候并不是直接进行需求表达,而是将自己的态度和意见融入到其他信息中。尤其在互联网环境下,庞大的信息量让用户需求常常隐藏在某些无效的信息中;此外,还存在一些用户虽有想法但未直接提出或不能清楚描述的隐性需求。 (4)模糊性。用户需求的表达有时候是不清晰的,消费者对产品和服务认知有时并不充分。因此,用户的需求在某些情况下是模棱两可的、很难清楚地描述他们的实际需求,甚至他们并不清楚自己真正需要的是什么。用户需求挖掘指的是在海量的数据中识别用户显性和隐性需求的过程。目前,用户需求分析研究主要通过两种形式展开——用户心理调查法和数据挖掘法。调查法是直接获取有效信息的途径,是研究人员分析用户需求时最常使用的方法。研究者通常是从用户心理学的角度,以用户访谈、专家咨询或问卷调查等形式,透过被调查者的口头叙述及书面语言,发现用户深层次的需求;而数据挖掘法主要利用在线数据的分类、聚类、关联规则等算法,对用户在网络中留下的历史数据进行系统性地分析,识别出隐含在海量数据中的潜在有用的信息和知识。总体来讲,目前缺乏科学统一的用户需求分析框架,深层次定量分析在线用户需求的研究较少,基础理论研究仍需要进一步充实。
第 3 章 基于 LDA 模型的在线评论主题识别及用户需求分析
3.1 数据来源及实验环境
3.2 数据采集及数据处理
3.3 基于 LDA 的在线评论主题识别
3.4 基于主题聚类的用户需求分析
第 4 章 基于 Kano 模型的在线评论用户需求分类
4.1 用户需求要素标准化
4.2 数据分析
4.3 Kano 模型的用户需求分析
第 5 章 基于在线评论时间序列分析的用户需求演变分析
5.1 时间序列分析法
5.2 在线评论时间序列主题词及共现关系
5.3 基于在线评论时间序列分析的用户需求演变态势
第 6 章 基于在线评论数据挖掘的用户需求管理策略
第7 章 结论
本文基于在线评论文本挖掘进行用户需求分析并进一步讨论了时间序列上需求的演变情况,形成了完整的用户需求挖掘研究理论框架并取得了丰富的研究成果。在对现有研究理论进行梳理和总结的基础之上,本文完成 3 项实证研究:首先,利用 LDA 模型进行华为手机在线评论的主题挖掘,在主题聚类的结果中识别出用户需求、建立了用户需求要素体系。然后参照 Kano 模型的基本理论设置需求调查问卷,结合用户满意指数和精细化 Kano 模型,分析各服务要素对用户满意度的影响并对用户需求进行归类,确定各类用户需求重要度和供给优先级顺序。对在线评论进行时间片段划分,挖掘时间序列数据的关键主题词,对选取代表性区间进行主题词共现分析,借助 Gephi
工具对主题共现网络进行绘制及可视化呈现,分析时间序列上用户需求的演变情况。
7.1 研究结论
本文的第三章、第四章和第五章为研究的主体章节,主要的研究成果可总结为以下几个方面:第一、针对在线产品评论的主题识别研究,本文利用 LDA 主题模型对选取华为畅享 9、P30、Mate30 5G 的 3 种产品进行评论文本主题聚类,总结出每种产品在线评论 Top6 的主题和对应出现频率 Top8 的主题词,呈现出相似的主题生成结果。在此基础上,整理用户在线评论中所提及的主要产品特征,得出在不同产品的在线评论内容中,用户在产品关注度上存在相同和相异的结果。相同之处在于,对主题聚类结果出现的主题词进行统计和分类时,发现有关于“系统”、“性能”、“硬件”、“机身外观”、“服务”、“品牌”、“附加产品”和“价格”方面的描述在 种产品评论中均有所体现。在用户总体的关注程度上,其中“系统”、“性能”、“硬件”和“机身外观”作为智能手机产品的自身属性方面的特征,在 3 种产品评论中都获得用户较多次数的讨论,是用户在产品购买和评论中主要关注和体现的需求;此外,因所选 3 种产品均来自华为,关于“品牌”这一主题讨论的情况呈现出相似的热度,而“服务”、“附加产品”和“价格”在评论中用户整体的讨论热度较低。与此同时,不同产品评论中用户对具体主题的关注程度存在一定差异。根据产品的定位不同,用户主要需求略有差异:Mate30 5G 手机评论中用户对 5G 系统的信息交流和分享热度很高;畅享 9 手机评论中的“系统”和“外观”关注度较低、但“性价比”出现的概率高于其他产品。第二、针对在线评论用户需求分类的研究,本文依据 Kano 模型的分类标准,借助问卷调查的形式获得数据。问卷的量表设计来源于在线评论主题识别的结果,提取用户在真实的评论行为中关注的产品功能和服务要素,收集消费者对这些要素提供与否的态度和重要度评价,来判断用户需求所属的具体类别,在此基础上融入用户满意度指数,对分类结果进行进一步精细化区分。研究结果发现:智能手机产品的魅力型需求居多,高魅力型 6 种分别为电池、待机时间、颜色、拍摄效果、像素、运行速度;低魅力型 8 种分别为操作系统、外观、耳机配件、5g 系统、赠品、指纹功能、性价比、发货速度。此外,分类结果中具有 3 种高期望型用户需求包含充电速度、品牌信任度和客服态度;5种必备型需求,其中高必备型 3 种——网络、内存、音量音效,低必备型 2 种——快递包装、屏幕尺寸,2 种无差异型需求——手感和品牌属地,调查结果中无反向型需求。结合 better-worse 值的四象限分布图,根据每个象限中各项需求的特征,对品牌的管理方提供有效的建议:位于第一象限和第四象限的要素涉及高期望、高魅力、低魅力需求,它们对提升用户满意度有明显的作用,因此企业在管理上应投入充足的技术和时间精力来提升这些产品和服务的质量,在条件有限时,优先满足和改进第一象限需求,因其同时对消除用户不满产生影响。位于第二象限的要素涉及全部必备型需求,它们作为基础性需求对提升用户满意度的效果不大,企业可以给予一定精力维持其原有的服务水平。位于第三象限的要素涉及到低魅力和无关需求,它们对提升用户满意和降低用户不满均不构成明显的效果,因此企业可有选择地提供适度的精力和成本,但应对其中低魅力需求给予关注,部分要素存在随时间转变成高魅力需求的可能性。第三、针对时间序列上用户需求演变的研究,本文选取了华为商城 Mate30 5G 产品的评论数据作为研究对象。在对时间序列的高频主题词进行统计时,发现大多数关键词重复出现在每个时间片段中,是用户关注的基本内容,仍存在一些仅属于少数的特定时间段的特殊关键词,结合所在时间段的情境对高频词进行分析,同时发现在线评论内容有时并非只包含一个主题,而是以多个主题交叉呈现。因此,构建在线评论主题词的共现关系,利用 Louvain 算法原理进行社区划分,其中代表性区间的主题共现结果中发现,“华为”、“速度”、“物流”、“功能”这些主题容易与其他主题产生共现关系,在网络中较为重要。此外,在产品刚上市前 10 天之内,由于较高的产品销售量,用户评论数量最多且内容最为丰富,所选取主题词两两之间均具备共现关系;双十二活动期间,用户在评论中更关注服务和赠品的需求;春节期间,用户对物流情况和节日礼物话题具有更高热度的讨论,同时用户在评论中表达对疫情事件的关注,他们关心在疫情期间快递是否受到影响。此外,本文发现高频次出现的主题词中有一部分可能属于同一话题。因此,对各时间片段在线评论话题构成进行分析,同时根据各时间片段话题出现频率的总体分布情况,来探究时间序列上话题的动态更新过程。在此基础上,对用户的品牌需求、产品功能需求、服务需求、附加产品需求、价格需求的构成和演变进行分析,提出针对性的企业管理策略。
7.2 研究创新点
本研究的创新点主要体现在以下几个方面:第一、选取真实且合适的平台及产品数据进行实证研究。本文的研究对象选取的是京东和华为商城 2 个平台中的真实数据,它们作为国内的华为品牌智能手机网络零售的重要渠道,其中有大量用户进行在线信息交流和分享,因此,评论数据来源相对来说更加真实可靠且评论数据充足;在研究在线评论的用户需求主题聚类过程中,本研究所选产品不是单一的,而是选取了华为品牌中产品定位有一定区分但在市场中均具备高销售量的 3 种手机型号,因此,消费者关注的内容将有所差异,可以通过对比观察评论文本主题聚类结果的差异性。第二、提供在线评论用户需求挖掘及分析的研究新视角。本文在讨论对实际的在线评论识别用户关注的主题时,不仅仅满足于完成评论主题的聚类过程,而是在此基础之上另外使用了问卷调查的方式,将数据挖掘技术和基于心理学建模两种主流的需求识别方法进行有效的结合,能够形成具备更强支撑力的研究结果。对数据挖掘过程中获得的评论进行聚类后析出的主题和关键词,能够为调查问卷提供反映用户真实产品特征关注的量表,问卷收集了用户对产品各项功能要素提供与否的态度和要素重要度的判断,引入了著名的 Kano 模型,根据其服务要素的划分原理进行在线评论用户需求的分类,同时结合了用户满意度指数,判断出产品的各项用户需求供给的重点和优先顺序,需求分类的结果帮助企业的管理者如何在有限的条件下做出更优决策提供了一系列重要的意见和建议。第三、融合时间序列和社区发现的多方法用户需求分析。本文不仅将用户的意见作为一个整体去关注用户讨论产品的主题,还考虑了时间因素、按照评论发布时间将在线评论划分为一定时间间隔。此外,考虑到社会网络分析方法可以用来识别各种话题之间的关系、观察用户社区的特征,本文融合了社会网络分析的思路,构建了在线评论的主题词共现网络,研究主题随时间演变的情况并通过各区间的纵向比较分析了用户对产品主题关注热度发生变化的原因。因此,本文在研究在线评论文本主题识别时,完成了不同型号产品的用户需求识别和同一型号产品在时间序列上的用户话题更新的识别两个过程。
7.3 研究局限性及未来展望
本文在研究在线产品评论的主题识别、用户需求分类及优先级的确定和时间序列上评论话题热度演变情况等方面取得了一些具有创新性和重要意义的研究成果,但仍然存在一定的局限性,具体体现在以下几个方面:第一、本文所选取的研究对象是京东和华为商城中的智能手机的在线评论数据,两个平台均为国内的网络零售平台,且产品选取的品类单一,因此本文的研究结论在其他性质平台和其他类型产品的应用上可能存在一定程度的差异性。第二、本文运用问卷调查的形式进行智能手机用户需求分类的研究,虽设置规则对无效问卷予以剔除,但调查结果不可避免地具有一定主观性。此外,此次实验问卷的发布周期较短且样本数量有一定局限。第三、本文对于时间序列数据的讨论有一定局限性,虽然本文考虑了时间维度进行在线评论内容的动态主题发现,但只在宏观层面上关注整个用户群体的信息行为特征,没有度量每一个发布在线评论用户的个体特征方面的差异对研究结果可能造成的影响。此外,由于本文采集的评论数的据时间范围在 3 个月左右,没有关注更长时间序列上的评论内容动态更新的过程。针对上述研究中存在的不足之处,后续研究可以从以下方面进行改进和深化:第一、接下来的研究可以考察其他在线零售平台、网络社区和社交媒体上的用户群体,在着眼于国内平台的同时也可以更多关注国外的情况,如亚马逊、Twitter 等平台上都具有大量的用户和社群并发表丰富的观点。而在产品的选取上,可以关注其他类型如体验型产品。这方面研究的扩展可以提供关于不同用户群体如何看待网上零售服务的横向比较结果,从比较分析得出的结果可以帮助网上零售商改进对于现有产品和服务的质量,服务于更广泛的消费者群体。 第二、在研究用户需求分类时,可以针对需求划分定义的过程和每一类需求特点,从实际的评论中选取指标结合表征用户满意度的情感词利用数学建模等方法来形成用户需求分类的依据,从评论大数据中提取相关指标进行评价可能具有更高的可信程度,结果更接近真实情况。第三、后续的研究可以利用更专业的技术进一步对时间序列数据进行深入的讨论和分析,在时间数据的选择上可以有年、月、日甚至小时的划分维度,形成在时间序列上的用户信息行为的变化规律,可以用来预测用户在接下来的时间段将讨论什么内容。此外,对用户行为层面的分析可以跟踪到消费者个体,研究等级、性别等特征不同的用户在评论中体现的需求的差异,也可以考虑用户群体中每一个个体在时间表征上的信息行为差异。此外,整合其他方法来改进在线产品评论数据的分析也很有价值。最后,未来的研究可能会扩展到其他行业和学科。
以上论文内容是由
硕士论文网为您提供的关于《基于在线评论数据挖掘的用户需求研究》的内容,如需查看更多硕士毕业论文范文,查找硕士论文、博士论文、研究生论文参考资料,欢迎访问硕士论文网毕业论文栏目。