我只和boost.spirit(来自boost 1.44)一起工作了三天,试图通过rfc2822中的精确语法来解析原始电子邮件消息。我以为我已经开始理解它并有所收获,但后来我遇到了一个问题:
#include <iostream>
#include <boost/spirit/include/qi.hpp>
namespace qi = boost::spirit::qi;
using qi::omit;
using qi::repeat;
using std::cout;
using std::endl;
typedef qi::rule<std::string::const_iterator, std::string()> strrule_t;
void test(const std::string input, strrule_t rule) {
std::string target;
std::string::const_iterator i = input.begin(), ie = input.end();
if (qi::parse(i, ie, rule, target)) {
cout << "Success: '" << target << "'" << endl;
} else {
cout << "Failed to match." << endl;
}
}
int main() {
strrule_t obsolete_year = omit[-qi::char_(" \t")] >> repeat(2)[qi::digit] >>
omit[-qi::char_(" \t")];
strrule_t correct_year = repeat(4)[qi::digit];
test("1776", correct_year | repeat(2)[qi::digit]); // 1: Works, reports 1776.
test("76", obsolete_year); // 2: Works, reports 76.
test("76", obsolete_year | correct_year); // 3: Works, reports 76.
test(" 76", correct_year | obsolete_year); // 4: Works, reports 76.
test("76", correct_year | obsolete_year); // 5: Fails.
test("76", correct_year | repeat(2)[qi::digit]); // 6: Also fails.
}
如果测试3有效,那么为什么测试5——与两个备选方案完全相同的测试相反——失败了?
同样的道理,如果你能原谅这个表达:如果测试4有效,并且开始的空格被标记为可选,那么为什么测试5(完全相同的测试,完全相同的输入,除了输入中没有前导空格)失败了?
最后,如果这是一个提振精神的错误(正如我怀疑的那样),我该如何解决它呢?