![]() |
1
29
这看起来是一个相当简单的基于关键字的分类任务。因为您使用Java,因此需要考虑好的包。 Classifier4J , Weka 或 Lucene Mahout . 分类4J Classifier4J支持使用 naive Bayes 和A vector space 模型。 如此所见 source code snippet 在使用朴素的贝叶斯分类器进行训练和评分时,包是相当容易使用的。它也在自由党的领导下发行 Apache Software License . 韦卡 WEKA是一种非常流行的数据挖掘工具。使用它的一个优点是你可以很容易地尝试使用许多 different machine learning models 将书籍分类为主题,包括 朴素贝叶斯 , decision trees , support vector machines , k-nearest neighbor , logistic regression 甚至是 rule set based learner . 您将找到一个关于使用WEKA进行文本分类的教程。 here . 但是,WEKA分布在 GPL . 您将无法将其用于要分发的封闭源代码软件。但是,您仍然可以使用它来支持Web服务。 卢西恩马哈特 Mahout是为在非常大的数据集上进行机器学习而设计的。它建在 Apache Hadoop 并支持使用NaiveBayes进行监督分类。 您将找到一个教程,介绍如何使用mahout进行文本分类。 here . 像Classifier4J一样,Mahout也是在自由主义者的领导下发行的。 Apache软件许可证 . |
![]() |
2
0
你不想要这么简单的东西吗?
现在
当然,有些书会出现在多个类别中,但这也发生在现实生活中… |
![]() |
3
0
|
![]() |
4
-1
你可能想看看 fuzzy matching algorithms 比如Soundex和Levenshtein。 |
![]() |
Toothpick Anemone · 字母“i”本身的正则表达式是什么? 12 月前 |
|
me0076 · 使用LLM提取多个实体 1 年前 |
|
jstark523 · 试图为我的应用程序找出最佳LLM选项 1 年前 |
![]() |
lyanna · 检测同词句子的语义相异性 1 年前 |