![]() |
1
2
对于某些部分,比如inbox,它使用NoSQL数据库,它是“最终一致的”,当你查询一个集群时,你会得到“当时的最佳答案”,而不一定是正确的。 从你的部分问题来看,你似乎正在尝试采取一些对社交媒体有效的做法,并将其应用得更广泛。最终,Consistant不会在会计、交易、医疗或研究领域工作。如果这是范妮阿姨最新的猫照,没人会在意FB页面是否一直显示最近的一张。你愿意为了这些陈词滥调而牺牲准确性。 因为FB这么做,所以把每三个标准形式的商业应用程序都变成键值对,这不是我愿意乘坐的火车。 |
![]() |
2
1
这个问题有点模糊,我们只能猜测Facebook做了什么。 但是我们可以讨论一个典型的Solr搜索是如何工作的,这是一个更具体的话题。是的,你 有 去规范化数据( here are some good tips on Solr schema design )将数据加载到Solr索引时。这个ETL过程可以通过 Data Import Handler ,或自定义ETL进程。数据源可以是任何东西,而不仅仅是关系数据库。如何设计模式在很大程度上取决于要执行的搜索类型。 完全非规范化(Solr实际上有一个平面模式)意味着没有连接,所以它是相当可伸缩的(参见Solr) shards 和 replication 你的另一个顾虑是搜索结果的相关性。这里,索尔是 非常 可调(参见 Relevancy Cookbook FAQ ). 是的,正如您所说,这几乎是一门艺术,因为每个应用程序都有不同的相关性概念,所以需要进行不同的调整。然而,对于开箱即用的Solr实例来说,默认的相关性通常是可以接受的(Solr和Lucene开发人员对此表示赞赏)。 |
![]() |
Kiddo · 合并多个文本文件,但跳过每个文件的第一行和最后一行 7 年前 |
|
user7039042 · 键入内容时意外的批处理程序 8 年前 |
![]() |
Souparno Adhikary · PBS通信错误:节点无法通信 8 年前 |