?
?
欧洲新冠肺炎疫情大数据可视化设计与实现
?
?
钱浩东苏有慧周军杨晨
摘?要:以欧洲疫情数据为依据,从多个层面展示欧洲疫情的发展。根据9月14日欧洲新冠肺炎疫情数据,利用Hive与大数据框架Hadoop对其进行处理,借助Tableau组件对欧洲9月14日疫情情况进行可视化,获得相关可视化图表。
关键词:欧洲新冠肺炎;Tableau;大数据可视化;Hadoop;Hive
中图分类号:TP391.4?????文献标识码:A????文章编号:1006-8228(2021)09-51-04
Abstract:AccordingtotheEuropeanepidemicdata,thispapershowsthedevelopmentoftheepidemicinEuropefrommultiplelevels.TheepidemicdataofCOVID-19inSeptember14thisprocessedbyHiveandbigdataframeHadoop.TheepidemicdatainSeptember14thisvisualizedbyTableaucomponenttoobtaintherelevantvisualcharts.
Keywords:EuropeanCOVID-19;Tableau;Bigdatavisualization;Hadoop;Hive
0引言
大数据背景下,海量数据只有被合理解读与表达之后才能展现其奥秘[1-2],大数据、人工智能時代的到来,使这些设想变得可能。可视化技术可以将原始数据转变成易于展示的文字、图表或图形的形式,是体现数据关联性价值最直观的方式[3]。人们不再局限于通过关系数据表来观察和分析数据信息,还能以更直观的方式看到数据及其结构关系[4]。一般而言,大数据的可视化复杂且难以理解,需要经过抽取、清洗、转化、挖掘等一系列过程才能展示潜在价值信息[5]。目前,大数可视化形式主要包括文本可视化、网络(图)可视化、时空数据可视化和多维数据可视化[6],丰富多样的可视化形式极大程度的为人们获取关键信息带来便利。
本文通过多种类别图形的方式来反映欧洲各国疫情数据的变化趋势,直观地体现出不同指标下的数据差异。具体来说,根据9月14日欧洲新冠肺炎疫情数据,利用Hive与大数据架Hadoop对疫情数据进行处理,借助Tableau组件对欧洲9月14日疫情情况进行可视化展示,获得了欧洲各国在不同指标下的相关图表。
1可视化内容设计
Tableau是大数据领域中常用数据可视化软件,能够基于海量的数据灵活、快捷地生成多种图形,能够将大量数据智能地转变成各类图表。Tableau利用便捷的数据接口快速提取数据[7],能够兼容许多主流的数据库或者数据仓库工具,通过接口驱动进行连接,对于存储在数据库的大量数据能够方便快捷地进行可视化。本文数据来源于百度新冠实时肺炎疫情数据[8],利用Tableau对其进行处理与展示,获得相应的图形。
1.1欧洲各国疫情柱状图
下面,借助于Tableau生成欧洲各国疫情柱状图。从柱状图,可以直观地看到各个国家确诊、死亡以及治愈人数,方便人们从整体上了解新冠疫情严重程度。
图1(a)中横轴为欧洲各个具体国家,纵轴是确诊人数,可以看出俄罗斯、西班牙、法国、英国、意大利等国确诊人数较多。图1(b)中横轴为欧洲各个具体国家,纵轴是死亡人数,可以看出英国、意大利、法国、西班牙、俄罗斯等国死亡人数较多。图1(c)中横轴为欧洲各个具体国家,纵轴是治愈人数,可以看出俄罗斯、德国、意大利、西班牙等国治愈人数较多。
1.2欧洲各国新冠疫情确诊情况地理图
借助于Tableau软件生成的欧洲各国新冠疫情确诊、死亡、治愈情况地理图。以地理图形式,具体清晰地展现相关指标下每个国家人数的情况。颜色越深,代表人数越多。以鼠标悬浮的形式可以查看具体的国家和人数。
就确诊情况而言,从图2(a)可以直观地看出俄罗斯的颜色最深,其确诊人数最多;其次是欧洲西南部的国家依次为西班牙、英国、法国等国。就治愈情况而言,从图2(b)可以直观地看出俄罗斯的颜色最深,其治愈人数最多;其次是欧洲西南部的国家依次为德国、意大利、西班牙等国。就死亡情况而言,从图2(c)可以直观地看出英国的颜色最深,其死亡人数最多;其他欧洲西南部的国家如法国、意大利、西班牙等国死亡人数也较多。而地图上俄罗斯的颜色较前几个国家淡,死亡人数较少。
1.3欧洲各国在确诊、死亡、治愈指标下的人数气泡图
下面是借助Tableau软件生成的气泡图,分别是确诊人数气泡图、治愈
版权声明
本文仅代表作者观点,不代表百度立场。
本文系作者授权百度百家发表,未经许可,不得转载。
发表评论