|
|
1
2
要回答您的问题:
从您的示例代码来看,您似乎只对文件的纯文本进行索引感兴趣。在此基础上,我将创建以下类,用于将数据传递给Solr。
使用此类存储您读取的每个文件的Id(必须是唯一值)。文件名(还包括路径)可能足够唯一。 将您的示例更改为以下内容:
如果您需要为每个文件索引更多的附加属性,您可以将它们添加到IndexItem类中,因为我注意到您在上面的Document类中有Name和CreateDate属性。您只需要提供到Solr的映射,以便将它们存储在适当的Solr字段中。请参阅 SolrNet Mapping 页面了解更多详细信息。 |
|
|
2
1
我猜您打算提取纯文本、HTML、DOC和其他丰富的文档。您的错误消息来自一个试图解析非XML内容的XML解析器。
使用
extracting request handler
设置为
|
|
|
A B · C#Excel自动调整列避免长文本时出错 1 年前 |
|
|
Megrez7 · C#ToArray转换合并为一行,导致数组元素更改 1 年前 |
|
Aycon · 在工厂方法中释放部分创建的对象的正确方法是什么? 1 年前 |
|
|
Sei · Avalonia/WPF将路由器传递到控制模板 1 年前 |