本发明涉及信息技术领域,尤其涉及一种关键词微指数数据的获取方法及装置。
背景技术:
随着网络的不断发展,社交软件的应用越来越广泛,其中微博也被更多的用户使用,用户可以通过微博关注和搜索热门话题新闻等。为了更好的进行网络管理,并进行舆情监控,需要将关键词对应的微指数数据进行获取并分析。其中,微指数数据为用于反应各搜索关键词使用热度的数据。
目前,在进行关键词微指数数据的获取时,通常是针对单一搜索关键词获取对应的微指数数据并且显示该搜索关键词对应的数据。然而发明人在实现本发明的过程中发现,由于目前只能针对单个关键词进行微指数数据的获取并且只能针对单个关键词的微指数数据进行显示,从而造成现有关键词微指数数据的获取效率较低。
技术实现要素:
本发明实施例提供一种关键词微指数数据的获取方法及装置,用以解决现有技术中关键词微指数数据的获取效率较低的问题,提高关键词微指数数据获取的效率。
为达到上述目的,本发明主要提供如下技术方案:
一方面,本发明实施例提供了一种关键词微指数数据的获取方法,该方法包括:
获取待查询的多个关键词;
根据各个关键词分别对应的微指数关键词请求链接地址,提取各个关键词分别对应的会话信息记录数据;
根据所述各个关键词分别对应的会话信息记录数据,获取各个关键词分别对应的微指数数据。
另一方面,本发明实施例还提供一种关键词微指数数据的获取装置,该装置包括:
获取单元,用于获取待查询的多个关键词;
提取单元,用于根据各个关键词分别对应的微指数关键词请求链接地址,提取各个关键词分别对应的会话信息记录数据;
所述获取单元,还用于根据所述各个关键词分别对应的会话信息记录数据,获取各个关键词分别对应的微指数数据。
借由上述技术方案,本发明实施例提供的技术方案至少具有下列优点:
本发明提供的一种关键词微指数数据的获取方法及装置,首先获取待查询的多个关键词,然后根据各个关键词分别对应的微指数关键词请求链接地址,提取各个关键词分别对应的会话信息记录数据,再根据所述各个关键词分别对应的会话信息记录数据,获取各个关键词分别对应的微指数数据。与目前只能针对单个关键词进行微指数数据获取相比,本发明由于是可以每次同时获取多个关键词分别对应的微指数数据,而不是只能逐个查询关键词对应的微指数数据,从而可以提高关键词微指数数据的获取效率。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种关键词微指数数据的获取方法的流程图;
图2为本发明实施例提供的另一种关键词微指数数据的获取方法的流程图;
图3为本发明实施例提供的一种关键词微指数数据的获取装置的结构示意图;
图4为本发明实施例提供的另一种关键词微指数数据的获取装置的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供一种关键词微指数数据的获取方法,如图1所示,所述方法包括:
101、获取待查询的多个关键词。
其中,所述关键词为微博用户搜索热词排行榜词库内所包含的词语,可以为网络用语、影视词语、商品名称等,本发明实施例不作限定。
102、根据各个关键词分别对应的微指数关键词请求链接地址,提取各个关键词分别对应的会话信息记录数据。
其中,所述微指数关键词请求链接地址具体可以为微指数热词请求URL(Uniform Resource Locator,统一资源定位符),所述会话信息记录数据(session cookies)具体是在网络上用来为用户浏览器关闭时消失的含有用户相关信息的小文件。
103、根据所述各个关键词分别对应的会话信息记录数据,获取各个关键词分别对应的微指数数据。
其中,所述各个关键词分别对应的微指数数据可以为关键词对应的被搜索量变化趋势数据、搜索用户地域信息数据、搜索用户属性数据等,本发明实施例不作限定。所述微指数数据可以为待查询关键词对应的一个月、三个月、九个月内的微指数数据等,本发明实施例不作限定。
本发明实施例提供的一种关键词微指数数据的获取方法,首先获取待查询的多个关键词,然后根据各个关键词分别对应的微指数关键词请求链接地址,提取各个关键词分别对应的会话信息记录数据,再根据所述各个关键词分别对应的会话信息记录数据,获取各个关键词分别对应的微指数数据。与目前只能针对单个关键词进行微指数数据获取相比,本发明由于是可以每次同时获取多个关键词分别对应的微指数数据,而不是只能逐个查询关键词对应的微指数数据,从而可以提高关键词微指数数据的获取效率。
本发明实施例提供了另一种关键词微指数数据的获取方法,如图2所示,所述方法包括:
201、获取待查询的多个关键词。
其中,所述关键词为微博用户搜索热词排行榜词库内所包含的词语,可以为体育明星、游戏名称、企业名称等,本发明实施例不作限定。进一步地,所述获取待查询关键词列表之后,还可以包括:加载各个关键词分别对应的一条或多条微指数数据,每条微指数数据分别对应唯一一个关键词。所述微指数数据可以为关键词对应的被搜索量变化趋势数据、搜索用户地域信息数据、搜索用户属性数据等,本发明实施例不作限定,所述微指数数据用于反映微博舆情状态及发展趋势。
对于本发明实施例,步骤201具体可以包括:通过预置爬虫程序遍历全部关键词。例如,当在微指数中输入麦迪、魔兽两个关键词进行查询时,获取关键词后加载关键词麦迪、魔兽分别对应的全部微指数数据,并且通过预置爬虫程序遍历关键词。对于本发明实施例,当在微指数中进行关键词微指数数据获取时,同时输入多个关键词,可以提高关键词微指数数据的查询效率,从而可以提高微博舆情监控的效率。
202、获取各个关键词在微指数中分别对应的标识信息。
其中,所述关键词在微指数中分别对应的标识信息具体是指所述关键词的wid(微指数账号),各个关键词在微指数中分别对应唯一一个wid。
对于本发明实施例,步骤202具体可以包括:通过调用预置wid信息获取接口,分别获取各个关键词在微指数中分别对应的wid信息。例如,关键词为迪士尼乐园、故宫,通过调用预置wid信息获取接口获取关键词迪士尼乐园、故宫分别对应的wid信息为wid账号1、wid账号10。对于本发明实施例,通过获取关键词列表中的各个关键词在微指数中分别对应的标识信息,可以保证各个关键词分别对应的微指数数据的精确性。
203、根据所述各个关键词和所述各个关键词在微指数中分别对应的标识信息,生成所述各个关键词分别对应的微指数关键词请求链接地址。
例如,根据关键词腾讯和关键词腾讯在微指数中对应的wid账号8,生成关键词腾讯对应的微指数关键词请求链接地址。
204、根据各个关键词分别对应的微指数关键词请求链接地址,提取各个关键词分别对应的会话信息记录数据。
其中,所述微指数关键词请求链接地址可以为微指数热词请求URL http://data.weibo.com/index/hotword?wid=<wid>&wname=<wname>。
对于本发明实施例,步骤204具体可以包括:根据各个关键词分别对应的微指数关键词请求链接地址,通过调用预置会话信息记录数据获取接口,提取各个关键词分别对应的会话信息记录数据。例如,根据关键词戛纳电影节对应的微指数关键词请求URL,通过调用预置session cookies获取接口,此时可以提取关键词戛纳电影节对应的session cookies。
205、根据所述各个关键词分别对应的会话信息记录数据,获取各个关键词分别对应的微指数数据。
其中,所述微指数数据为根据所述各个关键词分别对应的会话信息记录数据,从获取关键词列表后加载的各个关键词分别对应的一条或多条微指数数据中获取的。
对于本发明实施例,步骤205具体可以包括:通过在配置有所述各个关键词分别对应的会话信息记录数据的预置爬虫请求参数,调用预置微指数数据获取接口获取所述各个关键词分别对应的微指数数据。其中,所述预置爬虫请求参数中配置有所述各个关键词分别对应的会话信息记录数据。例如,预置爬虫请求参数中配置有关键词微信对应的session cookies,爬虫调用预置session cookies获取接口,此时获取关键词微信对应的微指数数据。对于本发明实施例,通过爬虫调用预置会话信息记录数据接口,可以获取各个关键词分别对应的微指数数据,以便于导出各个关键词分别对应的微指数数据进行保存分析,从而可以提高微博舆情监控的效率。
进一步地,在页面中的各个预置位置同时显示所述各个关键词分别对应的微指数数据。其中,所述各个预置位置可以为按照输入顺序排列的位置,也可以为按照关键词首字母顺序排列的位置等,本发明实施例不作限定。对于本发明实施例,通过在页面中对各个关键词分别对应的微指数数据进行显示,可以同时查看各个关键词分别对应的微指数数据,从而可以提高关键词微指数数据获取和显示的效率。
对于本发明实施例,具体的应用场景可以如下所示,但不限于此,包括:当在微指数内同时输入旅游、肯德基、麦迪三个关键词进行微指数数据查询时,首先获取三个关键词,爬虫遍历全部关键词,加载三个关键词分别对应的微指数数据,通过调用预置wid信息获取接口,获取关键词旅游在微指数中对应的wid信息为wid账号15。然后根据关键词旅游和关键词旅游在微指数中对应的wid账号15,生成关键词旅游对应的微指数关键词请求URL,根据关键词旅游对应的微指数关键词请求URL,爬虫通过调用预置会话信息记录数据获取接口,提取关键词旅游对应的session cookies。最后爬虫请求参数head中携带关键词旅游对应的session cookies,通过调用预置微指数数据获取接口,获取加载的关键词旅游对应的微指数数据,并保存关键词旅游对应的微指数数据用于分析。此时,爬虫按照上述步骤,分别获取关键词肯德基、麦迪的微指数数据,直到关键词肯德基、麦迪分别对应的微指数数据获取完成。
本发明实施例提供的另一种关键词微指数数据的获取方法,首先获取待查询的多个关键词,然后获取各个关键词在微指数中分别对应的标识信息,根据所述各个关键词和所述各个关键词在微指数中分别对应的标识信息,生成所述各个关键词分别对应的微指数关键词请求链接地址,再根据各个关键词分别对应的微指数关键词请求链接地址,提取各个关键词分别对应的会话信息记录数据,最后根据所述各个关键词分别对应的会话信息记录数据,获取各个关键词分别对应的微指数数据。与目前只能针对单个关键词进行微指数数据获取并且只能针对单个关键词的微指数数据进行显示相比,本发明由于是可以每次同时获取多个关键词分别对应的微指数数据,而且可以导出保存各个关键词分别对应的微指数数据,而不是只能逐个查询且只能显示关键词对应的微指数数据,从而可以提高关键词微指数数据的获取效率和显示效率。并且,由于本发明实施例还可以在页面中的各个预置位置同时显示多个关键词分别对应的微指数数据,从而实现了同时输出并显示多个关键词分别对应的微指数数据,进一步提高了关键词微指数数据的显示结果。
进一步地,作为图1所述方法的具体实现,本发明实施例提供了一种关键词微指数数据的获取装置,如图3所示,所述装置包括:获取单元31、提取单元32。
获取单元31,用于获取待查询的多个关键词;
提取单元32,用于根据各个关键词分别对应的微指数关键词请求链接地址,提取各个关键词分别对应的会话信息记录数据;
所述获取单元31,还用于根据所述各个关键词分别对应的会话信息记录数据,获取各个关键词分别对应的微指数数据。
需要说明的是,本发明实施例提供的一种关键词微指数数据的获取装置所涉及各功能单元的其他相应描述,可以参考图1所示方法的对应描述,在此不再赘述。
本发明提供的一种关键词微指数数据的获取装置,首先获取待查询的多个关键词,然后根据各个关键词分别对应的微指数关键词请求链接地址,提取各个关键词分别对应的会话信息记录数据,再根据所述各个关键词分别对应的会话信息记录数据,获取各个关键词分别对应的微指数数据。与目前只能针对单个关键词进行微指数数据获取相比,本发明由于是可以每次同时获取多个关键词分别对应的微指数数据,而不是只能逐个查询关键词对应的微指数数据,从而可以提高关键词微指数数据的获取效率。
进一步地,作为图2所示方法的具体实现,本发明实施例提供另一种关键词微指数数据的获取装置,如图4所示,所述装置可以包括:获取单元41,提取单元42。
获取单元41,用于获取待查询的多个关键词;
提取单元42,用于根据各个关键词分别对应的微指数关键词请求链接地址,提取各个关键词分别对应的会话信息记录数据;
所述获取单元41,还用于根据所述各个关键词分别对应的会话信息记录数据,获取各个关键词分别对应的微指数数据。
进一步地,所述装置还包括:生成单元43;
所述获取单元41,还用于获取各个关键词在微指数中分别对应的标识信息;
所述生成单元43,用于根据所述各个关键词和所述各个关键词在微指数中分别对应的标识信息,生成所述各个关键词分别对应的微指数关键词请求链接地址。
进一步地,所述装置还包括:
显示单元44,用于在页面中的各个预置位置同时显示所述各个关键词分别对应的微指数数据。
进一步地,所述获取单元41,具体用于通过在配置有所述各个关键词分别对应的会话信息记录数据的预置爬虫请求参数,调用预置微指数数据获取接口获取所述各个关键词分别对应的微指数数据。
进一步地,所述提取单元42,具体用于根据各个关键词分别对应的微指数关键词请求链接地址,通过调用预置会话信息记录数据获取接口,提取各个关键词分别对应的会话信息记录数据。
需要说明的是,本发明实施例提供的另一种关键词微指数数据的获取装置所涉及各功能单元的其他相应描述,可以参考图2所示方法的对应描述,在此不再赘述。
本发明提供的另一种关键词微指数数据的获取装置,首先获取待查询的多个关键词,然后获取各个关键词在微指数中分别对应的标识信息,根据所述各个关键词和所述各个关键词在微指数中分别对应的标识信息,生成所述各个关键词分别对应的微指数关键词请求链接地址,再根据各个关键词分别对应的微指数关键词请求链接地址,提取各个关键词分别对应的会话信息记录数据,最后根据所述各个关键词分别对应的会话信息记录数据,获取各个关键词分别对应的微指数数据。与目前只能针对单个关键词进行微指数数据获取并且只能针对单个关键词的微指数数据进行显示相比,本发明由于是可以每次同时获取多个关键词分别对应的微指数数据,而且可以导出保存各个关键词分别对应的微指数数据,而不是只能逐个查询且只能显示关键词对应的微指数数据,从而可以提高关键词微指数数据的获取效率和显示效率。并且,由于本发明实施例还可以在页面中的各个预置位置同时显示多个关键词分别对应的微指数数据,从而实现了同时输出并显示多个关键词分别对应的微指数数据,进一步提高了关键词微指数数据的显示结果。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。