我想知道谷歌分析数据库的设计,他们是如何处理每小时的巨大价值,甚至在几分钟内。
比如说,他们有1亿用户,几乎每个用户每分钟都有300个计数器。对于一个用户,300个计数器在一小时内有18000行。一天之内,它有432行,近300万行。
我认为他们没有使用关系数据库,但不确定…
有什么建议吗?
当做,
BigTable
你说得对,他们没有使用关系数据库。
高可扩展性总结了谷歌的架构 here . 它没有直接讨论分析,但它显示了大表是如何适应整个基础结构的。我不确定谷歌模式的细节是否可用——正如文章所说,“基础设施可能是一种竞争优势”——但我想它与硬件实现的联系要比常规数据模型紧密得多。