代码之家 › 专栏 › 技术社区 › Melih

谷歌分析数据库设计

google-analytics database

Melih · 技术社区 · 16 年前

我想知道谷歌分析数据库的设计,他们是如何处理每小时的巨大价值,甚至在几分钟内。

比如说,他们有1亿用户,几乎每个用户每分钟都有300个计数器。对于一个用户,300个计数器在一小时内有18000行。一天之内,它有432行,近300万行。

我认为他们没有使用关系数据库,但不确定…

有什么建议吗?

当做,

2 回复 | 直到 15 年前

Whatever 16 年前

你说得对,他们没有使用关系数据库。

APC 16 年前

高可扩展性总结了谷歌的架构 here . 它没有直接讨论分析,但它显示了大表是如何适应整个基础结构的。我不确定谷歌模式的细节是否可用——正如文章所说,“基础设施可能是一种竞争优势”——但我想它与硬件实现的联系要比常规数据模型紧密得多。

推荐文章

Luc · Google Analytics with Python仅显示最后一个维度

7 年前

HW-Scientist · 如何从Google Analytics获取R中的大型数据集?

7 年前

Jiri S. · GA-如何使用测量协议(拍卖)测量来源、媒介和活动?

7 年前

wnvko · 通过节点http发布到Google Analytics

7 年前

Jaime Montoya · 我可以在Google的分割测试实验中排除web浏览器吗?

7 年前

NullHypothesis · 分析中的目标转换-仅当来自某个页面时才转换

7 年前

Jaime Montoya · 尝试使用Google实验时出现“未找到Google Analytics跟踪代码”错误

7 年前

unpollito · Google Analytics for private intranet应用程序

7 年前

Blue Learning · Prestashop 1.7 admin中的Google analytics

7 年前

AKAust · 返回函数外部的值

7 年前