旅游景点评论数据可视化分析,以旅游网站评论数据为例
栏目:公司动态 发布时间:2023-08-03
对于数据分析师来说,数据获取通常有两种方式,一种是直接从系统本地获取数据,另一种是爬取网页上的数据,爬虫从网页爬取数据需要几步?总结下来,Python爬取网页数据需要发起请求、获取响应内容、解析数据、保存数据共计4步。本文使用Python爬取去哪儿网景点评论数据共计100条数

对于数据分析师来说,数据获取通常有两种方式,一种是直接从系统本地获取数据,另一种是爬取网页上的数据,爬虫从网页爬取数据需要几步?总结下来,Python爬取网页数据需要发起请求、获取响应内容、解析数据、保存数据共计4步。

本文使用Python爬取去哪儿网景点评论数据共计100条数据,数据爬取后使用Tableau Public软件进行可视化分析,从数据获取,到数据清洗,最后数据可视化进行全流程数据分析,下面一起来学习。

示例工具:Tableau Public
本文讲解内容:数据获取、数据可视化
适用范围:网页数据获取及评论分析

数据可视化

打开Tableau Public软件,点击连接到Microsoft Excel,根据路径导入我们需要的Excel数据。


数据格式转换,右键Abc调出属性,将数值均调整为数字(整数)。


右键数值设置地理角色,将Lng地理角色设置为经度,将Lat地理角色设置为纬度。


点击工作表1,进入可视化界面。


1、地图可视化

将Lng拖入到列,Lat拖入到行,评论数量拖入到大小,景点名称拖入到标签。


由地图可以得知,秦始皇帝陵博物院的评论数据量最多。


2、共享轴柱形图

将景点名称拖入到列,作为公共轴,评论数量和攻略提到数量拖入到行作为求和值。并且设置数据标签和颜色。


由图像来看,秦始皇帝陵博物院的评论数据量最多,回民街攻略提到数量最多。


3、词云图

将景点名称拖入到行,攻略提到数量拖入到列,在智能推荐里勾选气泡图。


将数据标签标记设置为文本,调整文本颜色。


由图像来看,回民街攻略提到数量最多,秦始皇帝陵博物院的攻略次之。

平台注册入口