文章
  • 文章
搜索
开源情报 >> 开源方法 >>开源方法 >> 快速批量获取各国政府网站发布的经济报告
详细内容

快速批量获取各国政府网站发布的经济报告

时间:2019-01-21     作者:1:0   阅读

利用搜索引擎高级搜索功能,批量找到并下载各国政府网站发布的涉华报告,关键要点如下:

1、优选搜索引擎:googlg.com 和 bing.com。

2、网站发布的报告,一般都是pdf格式,这涉及到第一个高级搜索语法命令——filetype:pdf(搜索的文件类型为pdf)。

3、各国政府网站一般域名后缀均为.gov.?,这涉及到第二个高级搜索语法命令——site:*.gov.? [bing.com的语法为site:.gov.?] (*.gov.?说明:*代表在任何域名中搜索,?代表国家的域名后缀,比如想搜索英国政府网站则把?替换为uk,即*.gov.uk,印度的则为*.gov.in,各国域名后缀,请自行检索查找。也可以直接用site:*.gov.* 进行搜索,但实测返回效果较少,需要特别说明的是美国政府网站域名后缀仅为.gov,美国的军事机构网站域名后缀为.mil)。

4、经济,一般指标题或正文中包括“Economics”或“financial”以及其他语种表示经济等关键词和其他词组,但直接用关键词搜索,会返回所有内容中包括“经济”的结果,准确性较差,为了更精准,可以搜索标题中包括“经济”的内容,这涉及第一个高级搜索语法命令——intitle:Economics(标题中包含关键词“Economics”的内容)。

5、以搜索英国政府网站涉华报告为例,搜索语法命令组合为:intitle:Economics site:*.gov.uk filetype:pdf [bing.com的语法命令组合为:intitle:Economics site:.gov.uk filetype:pdf]

6、可以进一步结合搜索引擎的时间搜索功能,搜索特定时间范围的发布内容。

7、如果使用采集软件进行批量下载,就需要使用bing.com,因为google.com有强大的反爬机制。采集软件也有十分好用的开源软件,后文详细介绍。

示例一:标题中包括“china”的印度政府网站发布的报告

image.png

image.png

示例二:标题中包括“中国军事”的美国军事机构网站发布的报告

image.png

image.png


最新评论
请先登录才能进行回复登录
技术支持: 建站ABC | 管理登录