原标题:百度大数据部陈旭:基于大数据视角看避暑旅游发展
6月24日,“2016中国避暑旅游产业峰会”在长春召开,本次峰会以“旅游+避暑—休闲新动态,增长新动力”为主题,主要探讨避暑旅游市场发展情况,交流避暑旅游城市发展经验,总结成功模式,促进避暑旅游产业发展。百度大数据部大数据顾问博士陈旭发表了主题演讲,以下为文字实录:
各位来宾,各位领导,大家下午好,之前可以看得出来,咱们户外网的张总的确用了很多百度的大数据。前几天我也收到咱们研究院课题组的邀请,说用百度大数据跟大家分享一下通过我们数据来看避暑旅游发展的状况。从整个行业来看,百度数据还是比较大而全一些。我截取了我们平台上所能看到的数据和大家分享一下,从百度视角或者从大数据的视角我们能看到的避暑旅游发展的一些状况。
百度大数据的确很多,我们现在主要的数据或者这次分享给大家采用的数据主要是基于我们的搜索数据,还有我们的定位数据。搜索数据,大家都很清楚,因为大家每天基本上只要是跟互联网有接触的人都会使用百度,然后每天在百度平台上的搜索量在一百亿左右,我们能覆盖95%左右的网民。定位这块主要是基于百度的手机地图,每天定位历程在200亿次左右,你打开手机这一次会采取一个定位的记录,同时我们还会有一些采用百度地图底层的一些,像墨迹天气、打车,还有手机预装的百度地图,我们都会收到定位的量级。同时我们还会在全网进行数据的抓取,可以抓取到的全网数据量有8000万条左右,包括很多的公开的一些网站上或者论坛上的评论,还有微博的数据。基于这些数据,我们用一些手段以及超大规模的技术能力、计算能力还有百度的一些实验室进行数据挖掘,进行一些智能的预测,我们为旅游行业也开放了一个大数据的分级平台,能够对全球的旅游城市和旅游景区进行搜索分析,差不多是能覆盖到全国所有的地级市,还有全国1600个景区。通过这些数据的分析我们可以看到这些景区或者城市游客的状况是什么样,游客在搜索这些目的地的时候关注哪些东西,同时我们可以通过搜索定位数据看到游客从哪里来到哪里去,然后他在目的地游览了哪些景区,后期我们还会开发更多的,比如他在一个景区停留的时长和旅行画像,进行更加细致精准的分析。
回到避暑这块来。首先看看避暑旅游整体发展趋势。通过百度的数据量来看,避暑旅游搜索肯定出现在夏季高峰期。从数据量来看,基本避暑旅游的搜索高峰期出现在6月份,然后尾声落在8月份。我们注意到在2015年的时候避暑旅游搜索高峰期稍稍有所提前,16年也延续这个状况。同时我们也注意到在避暑旅游搜索猛增的情况基本是在高考结束后,搜索量会激增。从整体的趋势上来看,其实避暑旅游在这几年搜索增速还是蛮高的。我们也是看了一下,今年的同期避暑旅游,我截取的是5月15号,现在6月份还没有结束,所以数据只能到昨天的数据,从5月中旬开始到今年的6月21号的数据来看,避暑旅游增长了25.3%,全国国内旅游增速在10.8%,这与全国的旅游增速基本上是持平的,这个数据。可以看出来避暑旅游的增速的确在今年以及上一年有比较大的提升。
如果通过这个搜索词来看,避暑旅游目的地品牌已经开始有呈现的倾向。怎么看出来呢?大家在百度上进行搜索的时候通常会搜索一些我们称之为通用词,比如夏天到哪里玩或者夏天哪个城市比较凉快,这种目的性不是很明显的,同时也会搜索一些比较有针对性的,比如在长春哪里好玩,然后会搜索6、7月份,这个比较明确一些同时会加上凉都或者夏都,然后加上一个城市名字,或者夏天长春哪里好玩,这个我们会归为品牌词。从品牌词和通用词对比上来看,我们发现这样一个趋势。在2014年大家在夏天搜索时用通用词比较多,比如用了夏天去哪里玩,对比某一个特定的城市或景区,这个搜索是72:28。到2016年时这两个词基本上快要持平了,但通用词基本上还是高一些,和大家搜索习惯相关。尤其在移动端的时候大家搜索并不会很明确,其实在移动端本身有一个信息的定位,比如你在长春搜索的时候,你在搜夏天哪里好玩或者哪里比较凉快,我们在百度平台上搜索的结果通常是基于长春本地的一些信息。
另外来看,虽然大家想到避暑旅游品牌开始出现了,但是相对于其他的一些目的地类型来说,这个品牌或者目的地品牌进程还是有待于提升。今年品牌词占43%,但主题公园品牌词是77%,休闲度假这一块也更加明确,尤其在江浙这一带,这样一个品牌词占比也非常高。也就说明这些目的地品牌或进程相对来说是比较成熟的。
大家在搜索东西的时候,我们会关注占比比较靠前的,一般来看就是攻略、天气、住宿、自助游这些信息,普遍的需求点比较多,占比通常来说也是比较高的。但是同时我们要看一下长尾的需求,也会发现一些趋势。长尾需求越来越多,而且长尾需求从整体来看,移动端长尾的需求要比PC端搜索的长尾需求更多一些。长尾需求,比如说大家有时会搜一些旅行的一些景点比较细微的信息,车辆的分布、温度、有没有导游,乃至于一些景区徒步的信息,或者登山、观光车等等,一般我们把低于5%以下的定为长尾需求。我们看出这个占比也是有所提高的,2015年时占21%,到2016年时占到28%,所以大家的需求是更加精细化。尤其在手机端的需求更加多一些,因为手机端的搜索更加倾向于继发性的需求。
同时我们平台上还有一个数字资产榜的东西,其实就是大家对一个品牌搜索量还有这个品牌在互联网上的留存量,以及大家对它的好感进行一个核算,我们会对一些快销品、汽车品牌、旅游城市和旅游景区品牌都做一些分析。从这些数据来看,我们会发现城市品牌一般是要低于景区的品牌,也就是说像在今年的数据上来看,我们景区的数字资产是在302,城市要低于它,也就是说旅游目的地景区影响力可能要更加大于它所在的城市。举一个例子,我拿长白山作为一个例子,跟它临近的地级市是延边,这个相比,延边的知名度只有192,相对来说长白山品牌资产达到了一千以上。其实一千多也不高,给大家举个例子,如果要是跟黄山比起来,大家觉得黄山会达到多少?黄山达到一万九千多,就是我们的品牌有更高的提升空间。像现在国内如果把所有类型的景区或者避暑景区放在一起来看,品牌最高的一个是黄山,一个是千岛湖。
看了大体的需求趋势,然后看一下消费者的需求。刚才也给大家看了一些消费者的需求。我们发现大家对避暑旅游目的地的需求还是集中在兴趣和了解阶段,他会搜一些攻略,图片搜索占比也比较高。同时可能会涉及到一些具体的比较阶段,这个占比还是比较多一些,这包括住宿、门票,比较具体的三日游或者确定哪些旅行社,这样的占比相对少一些。同时我们看到一个比较有意思的点,这里我们把三日游这个占比特别拿出来看,三日游从整个需求排名上来看,它占比非常低,只有1.6%,为什么单独拿出来看呢?如果我们跟一般的休闲游比的话,可以看出在避暑旅游里三日游搜索占比更高一些。整体上来看,一般的休闲游一日游占比会达到3%,也就是同一个时段一般的休闲游搜索的占比是3%,避暑旅游只占0.35%。二日游差不多,但在更长一点的三日游,大家搜索三日游的情况更多一些,高出一倍,也就是说大家会在休闲避暑旅游目的地停留时间更长一些。另外对于休闲旅游来说,搜索休闲游类型,同时又搜索了租车的状况,租车只占5.3%,对于避暑旅游来说,这个占比比较高,占8.67%,非常高。租车也有一个搜索高峰期的变化,我们注意到在节前一两周的样子,搜索比例可以达到4.2%,如果没有什么节假日,只是在平常的工作日的时候,周二到周四大家对这个搜索会比较高一些,就可能考虑要去哪玩了,到周五一直到周一比例会下来,所以很多人在上班的时候在搜索什么呢?估计还是在搜索旅游的状况。
我们看一下搜索的目的地类型。大家对于避暑旅游的目的地类型,最受欢迎的是湖泊什么的,大家休闲心理并不是那么倾向于海洋度假,可能更倾向于内陆一些,但湖泊占比是比较高的。刚才讲到的千岛湖是排名在第一位的,属于避暑旅游这一块湖泊类型的目的地。海岛游青岛的海底世界占比比较高。森林是张家界的国家森林公园。草原这块,今年木兰围场比较高,峡谷这块是张家界大峡谷,也是非常受欢迎的旅游目的地。
游客来源分布这块,我们主要分布在相对比较热、闷热的省份。如果把这些省份划成片区,华东和华北地方是避暑主要的市场,同时华南也是,主要是华北、华东和华南这三大块。但同时我们也会注意到避暑旅游目的地会出现一些地区性竞争的状况,这是我们截取了同一个人在搜索了一个目的地的同时,他三十分钟之内又搜索了其他哪些目的地。这样一看,我截取了东北这块,因为华北搜索目的地主要集中在东北片区。集中在东三省这些城市,如果我们放在一个城市上来看,长春有哪些竞争利弊呢?长春和哈尔滨、松原这些城市绑定在一起,这个竞争关系或竞合,大家在搜索长春的时候多数人仍然会搜索一下哈尔滨或吉林市、松原的一些旅游资源或避暑目的地的情况。辐射半径,仍然是以本省和周边城市为主,周边游或者省内游仍然是最主要的避暑和休闲的方式,这点是比较一致的。以长春为例,把长春本地游客做个统计,主要游客来自于吉林和四平。游客到了长春以后会去哪些地方?最多人去净月潭、长影世纪城和世界雕塑公园。最远的可以到黑龙江省的一些城市,像镜泊湖、太阳岛这些景点。看着他们跑的范围比较远,但从占比来看,就是在市内景区,像净月潭和伪满皇宫,这块占比达到88%,所以游客在区域的流动半径还是有一定的限制的。
经过一些数据分析,我们认为避暑旅游目前虽然发展较快,但大家对避暑品牌认知度尚未成熟,也是发展的大好时机。通过一些分析,我们得到了精细化的营销服务。同时,大家搜索避暑旅游的时候同时会搜索好几个目的地,我们可能会结合避暑旅游景区,会以景区的为核心,作为整体旅游目的地的品牌化开发,同时开启区域旅游整体协调发展的状况。这是跟大家的一个分享。