谷歌 bigquery 配置代理
谷歌 bigquery 配置代理
背景
谷歌云提供bigquery服务,BigQuery是一个RESTful的Web服务 ,可以对与Google Storage结合使用的大型数据集进行交互式分析。它是一种无服务器的平台即服务( PaaS ),且可与MapReduce相互补充使用。我们需要获取部分数据信息进行分析,由于GFW的原因,需要配置代理服务器获取数据。
准备
由于项目主要开发语言为python,这里主要介绍均以python为主。根据BigQuery API Client Libraries的wiki信息,我们首先获取身份认证信息。这个按照wiki一步一步来做即可。最终获取到一个授权的json文件,我们保存到本地的项目当中。
构造请求demo
基于BigQuery API Client Libraries 提供的python demo程序,我们自行构造自己的查询程序,代码如下:
1 |
|
说明:
- 其中AUTH_JSON_FILE_PATH为授权文件路径,自行配置
- 代理配置的思路相当于手动配置当前python程序的http和https代理,如果已经配置了系统代理,这步就可以省略了
- 查询语句根据实际情况自行构建
参考
- https://cloud.google.com/bigquery/docs/reference/libraries#client-libraries-usage-python【BigQuery API Client Libraries】
- https://stackoverflow.com/questions/43926668/python3-bigquery-or-google-cloud-python-through-http-proxy/43945207#43945207【Python3 BigQuery or Google Cloud Python through HTTP Proxy】
本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!