6.3 BigQuery

BigQuery是Google云计算平台的数据仓库,它的主要目的是用于大数据的分析、报告和数据科学。数据能够使用标准的SQL语句或使用BigQuery专用语句去查询,也可以通过页面交互或API去使用。BigQuery可以加载和存储多种数据源的数据,可以将会话和匹配数据从 GA 360 账户导出到 BigQuery,然后用类似 SQL 的语法来查询您所有的 GA数据。 BigQuery的数据在存储和查询都是需要花钱的,价格非常便宜,目前BigQuery的价格是: 存储:0.02美元每GB每年 查询:每月的第1TB是免费的,之后的每5美元1TB GA360的用户每个月都会获得BigQuery专用优惠券,您可以通过代理商去获得,每个月有500美元,只能用于BigQuery结算。

6.3.1设置BigQuery

使用BigQuery需要设置几个步骤,以下是详细过程: 1、创建一个Google API项目

在开发者控制后台的导航栏创建一个项目并开启BigQuery API。 2、开启账单

在左侧的菜单中,如图6-12所示,单击账号进入设置付账的账户信息,需要绑定信用卡或储蓄卡,按需收费,具体费用结算方式见官网

图6-12 开启账单

3、添加权限

同样是左侧菜单,单击“IAM & Admin”,您自己的账号就是账号的管理员,给下面的账号添加编辑的权限,在这个账号有编辑权限是为了将GA的数据自动导入到BigQuery,账号为analytics-procesing-dev@system.gserviceaccount.com.

如果有其他人希望能够查看或编辑数据,对应给他们开通权限即可。

4、将GA关联到BigQuery

在Google Analytics中给BigQuery的所有者授予修改的权限,然后在媒体资源级别下面单击“所有产品”→“BigQuery关联”,填入BigQuery ID和做一些简单的设置即可,GA的数据会在24小时之内导入到Big Query。

6.3.2数据的管理

BigQuery中管理数据是通过BigQuery ACL完成的,界面如图6-13所示,左侧就有不同的数据集,

图6-13 BigQuery界面

页面基本就是跟phpadmin一样,显示的是一张表,其实是两张表格来的,用的是Nosql的结构,分别是用户维度user_dim和事件维度event_dim,user_dim和event_dim不能同时用*查询出来,查询使用表格的定位是:[项目名:库名.表名]。您要做分析就是各种SQL了。

6.3.3常见错误

1.GA数据导入失败

服务账户 (analytics-procesing-dev@system.gserviceaccount.com) 在任何时间点不具有项目的“修改”权限,系统将不会导出数据。

未开启结算

没有开启BigQuery API。

2.查询导出数据出错

(1)ACCES_DENIED

原因:当 GA(分析)无权访问与集成相关联的 BigQuery 项目时,就会出现此错误。

补救措施:确保以下服务账户对此集成的 BigQuery 项目拥有修改权限:analytics-procesing-dev@system.gserviceaccount.com。如果无法为此服务账户添加并保持访问权限,将会导致持续出现访问错误,进而使数据中出现永久性缺口。

(2)BILLING_ERROR

原因:当与您的 BigQuery 项目相关联的 Google Cloud 账户存在结算问题时,就会出现此错误。

补救措施:确保此集成的 BigQuery 项目所用的云端结算账户也包含有效的付款方式,且付款信息都是最新的。

如果不能确保提供最新的结算信息,将会导致持续出现结算错误,进而使数据中出现永久性缺口。

Last updated