![]() |
1
2
要回答您的问题:
从您的示例代码来看,您似乎只对文件的纯文本进行索引感兴趣。在此基础上,我将创建以下类,用于将数据传递给Solr。
使用此类存储您读取的每个文件的Id(必须是唯一值)。文件名(还包括路径)可能足够唯一。 将您的示例更改为以下内容:
如果您需要为每个文件索引更多的附加属性,您可以将它们添加到IndexItem类中,因为我注意到您在上面的Document类中有Name和CreateDate属性。您只需要提供到Solr的映射,以便将它们存储在适当的Solr字段中。请参阅 SolrNet Mapping 页面了解更多详细信息。 |
![]() |
2
1
我猜您打算提取纯文本、HTML、DOC和其他丰富的文档。您的错误消息来自一个试图解析非XML内容的XML解析器。
使用
extracting request handler
设置为
|