罗杏逢 何芳丽
摘 要:基于网络爬虫技术获取广西南宁、桂林、北海三地区经典景点的网络购后评论数据为样本,通过描述性统计分析和方差分析,研究了广西旅游满意度在各项目之间以及各地区之间的差异。结果表明:(1)游客对广西旅游整体满意度较好;(2)满意程度在各项目之间存在显著差异,交通、景点、住宿的满意程度均值较高,而餐饮、娱乐项目的满意程度均值相对较低;(3)满意程度在各地区之间存在显著差异,南宁的满意程度最高,北海的满意程度居中,桂林的满意程度最低。该文的研究结果对改善广西旅游服务、增强广西旅游的竞争力具有重要意义。
关键词:旅游满意度 调查分析 爬虫技术 方差分析
中图分类号:F59 文献标识码:A 文章编号:1672-3791(2020)01(c)-0218-02
在“互联网+”的概念提出之后,旅游业发生了翻天覆地的变革,愈来愈多的游客喜欢通过相关旅游网站或移动终端来获得旅游信息、购买旅游产品,并通过发布对旅游目的地的评价,表达旅游后的实际体验情况[1]。丰富的旅游评论信息不仅为游客的决策提供了有价值参考,同时也为广大学者研究旅游消费者行为和旅游目的地发展提供了重要参考意见。线上购买—线下消费—线上分享游后实际体验这种新型旅游模式,满意度评价对潜在游客的游前决策和游后体验有潜移默化的影响,游客满意度成了行业中关注的热点[2]。
根据广西新闻网消息,2017年广西接待国内外游客5.05亿人次。其中南宁、桂林、北海的接待旅游数位居前三,旅游接待数分别为:1.106亿人次、8232.79万人及3069.8万人次。由于影响各目的地满意度的因素不同,游客对不同的目的地满意状况存在差异,为此该文基于广西旅游的3个重点城市数据考察广西旅游满意度情况,并作旅游满意度在各项目之间以及各地区之间的差异性分析,其研究结果对改善广西旅游服务、增强广西旅游的竞争力具有重要意义。
1 样本的选取与处理
利用“八爪鱼”软件在线爬取“去哪网”和“美团网”2017年1月至2018年12月,广西桂林的4个景点(漓江、象鼻山、阳朔、两江四湖),南宁的2个景点(龙门水都、青秀山),北海的2个景点(银滩、涠洲岛)的网络购后评论作为研究数据。获得数据后,对评论数据进行清理,剔除其中无价值的评论,如纯表情符号评论、重复发表的评论等,最终筛选得到有效网络评论18773条。
2 描述性统计分析
2.1 网络高频词的描述性统计分析
利用R语言的“jiebaR”分词程序包对18773条有效评论进行文本数据挖掘处理,截取样本文本中的排名前100个高频词。根据排名前100个高频词所代表的情绪意义,通过人工筛选并按照所代表情感进行分类,剔除无研究意义词语,如就是、没有、一个等词语,再将剩余的高频词按照积极情绪、中级情绪、消极情绪进行分类。其中,积极情绪有21178个,包括高频词有:不错、可以、值得、非常、方便、很多、真的、便宜、特别、好玩、很美、建议、推荐、空气、喜欢、适合、好看、漂亮、很大、开心、下次;中性情绪有4586个,包括高频词有:有点、比较、一般、价格、而且、还行;消极情绪有3440个,包括高频词有:但是、没什么、不过、不要、不值、一点。
从网络评论高频词中发现,72%为积极情绪词,16%为中性情绪词,12%为消极情绪词,反映出大部分的游客对广西旅游整体满意度较好。
2.2 桂林、南宁、北海旅游满意情况的描述性统计分析
将18773条原始评论数据按广西南宁、北海、桂林3个地点、5个项目(餐饮、交通、景点、娱乐项目和住宿)进行分类梳理,并用“八爪鱼”软件的情感分析功能进行评论的正负面分析,得到如下信息(见表1)。
由表1可知,相对来说,南宁在景点和住宿方面评论较好,北海在餐饮和娱乐项目上评论较好,桂林在交通方面评论较好;南宁的旅游项目满意度偏低,北海的交通满意度偏低,桂林的餐饮和住宿满意度偏低。
3 方差分析
利用表2中的数据,用正面比例作为满意程度(Satisfaction)的代理变量,以正面评论条数作为加权变量,考察满意程度在各项目(Project)之间以及各地区(Region)之间是否有显著差异。利用SAS软件编程,运行结果见表2至表4。
由表2知,检验的P值都小于0.001,满意程度在各项目之间以及各地区之间存在显著差异;由表3可知,在5个项目维度中,交通、景点、住宿的满意程度均值较高,而餐饮、娱乐项目的满意程度均值相对较低;由表4可知,南宁的满意程度最高,桂林的满意程度最低。
4 研究结论
该文通过爬虫技术,获取了广西南宁、桂林、北海三地区经典景点的网络购后评论数据,并在通过描述性统计分析和方差分析,研究了广西旅游满意度在各项目之间以及各地区之间的差异。得到如下结论:(1)网络评论高频词中,72%为积极情绪词,16%为中性情绪词,12%为消极情绪词,反映出大部分的游客对广西旅游整体满意度較好,不满意的只有12%;(2)满意程度在餐饮、交通、景点、娱乐和住宿项目上存在非常显著的差异,其中,交通、景点、住宿的满意程度均值较高,而餐饮、娱乐项目的满意程度均值相对较低;(3)满意程度在南宁、桂林、北海三地区之间存在非常显著的差异,南宁的满意程度最高,北海的满意程度居中,桂林的满意程度最低。
该文研究表明,作为中国旅游的名片——桂林,其旅游的满意度还处于偏低水平,主要体现在餐饮和住宿方面,因此要提高桂林旅游满意度,就需提升餐饮特色、改善住宿条件;作为广西旅游接待数最大的城市——南宁,虽然其总体满意度在区内是最高的,但其旅游项目满意度偏低,需进一步开发精致的旅游项目;作为沿海城市——北海,在餐饮和娱乐项目上具有较高的满意度,但其交通满意度偏低,需进一步改善该城市的交通条件。
参考文献
[1] 高翔,陈炜.旅游目的地游客满意度模型新释——基于桂林网络游记的扎根分析[J].旅游研究,2017,9(5):78-86.
[2] 张红英.“互联网+”背景下无锡灵山胜境景区旅游满意度分析——以在线购后评价数据为基础[J].无锡商业职业技术学院学报,2017,17(5):68-71.
[3] 金敏.桂林游客的旅游期望与感知差异的实证研究[J].桂林航天工业学院学报,2017,22(4):398-403.