![]() |
1
2
对于问题(1),我不确定。我以前没做过。也许其他答案中的一个会有帮助。 对于问题(2),自动创建摘要不是一个开发领域。它通常被称为“句子选择”,因为现在的典型方法是只选择整个句子。 对于问题(3),从机器学习中创建摘要的基本方法是:
我最喜欢的机器学习参考是汤姆·米切尔的 Machine Learning . 它列出了实现步骤(3)的多种方法。 对于问题(4),我确信有几篇论文,因为我的顾问去年提到过,但是我不知道从哪里开始,因为我不是这个领域的专家。 |
![]() |
2
3
你可以看看我的 boilerpipe 在谷歌代码上进行项目,并在你选择的网页上使用谷歌AppEngine上的Live Web应用程序进行测试(链接在那里)。 我正在研究这个领域,并写了一些关于从HTML页面中提取内容/删除样板文件的论文。例如,请参见“使用浅文本功能的样板文件检测”,并在videoscheases.net上观看相应的视频。本文应该给你一个很好的概述在这方面的最新进展。 干杯, 基督教的 |
![]() |
3
0
我不知道它是如何工作的,但是看看可读性。这正是你想要的。 |