代码之家  ›  专栏  ›  技术社区  ›  Timothy Carter

将XML文件读取到C数据集中时出现问题

  •  6
  • Timothy Carter  · 技术社区  · 17 年前

    我得到了一个.xml文件,我需要将其作为数据集读入我的代码(作为背景,该文件是通过创建 DataSet 在C和呼叫中 dataSet.WriteXml(file, XmlWriteMode.IgnoreSchema) 但这是别人做的)。

    .xml文件的形状如下:

     <?xml version="1.0" standalone="yes"?>
     <NewDataSet>
      <Foo>
        <Bar>abcd</Bar>
        <Foo>efg</Foo>
      </Foo>
      <Foo>
        <Bar>hijk</Bar>
        <Foo>lmn</Foo>
      </Foo>
    </NewDataSet>
    

    使用C和.NET 2.0,我使用下面的代码读取文件:

            DataSet ds = new DataSet();
            ds.ReadXml(file);
    

    在此之后使用断点 line ds.Tables[0] 看起来像这样(用破折号代替我无法正确格式化的下划线):

    Bar     Foo-Id    Foo-Id-0
    abcd     0         null
    null     1         0
    hijk     2         null
    null     3         2
    

    我发现了一个解决方法(我知道有很多种),并且能够成功地用.xml读取,但是我想知道为什么 ds.ReadXml(file) 以这种方式执行,所以我将来可以避免这个问题。谢谢。

    2 回复  |  直到 10 年前
        1
  •  4
  •   Keith    17 年前

    这对您的 嵌套的 Foo标签:

    <NewDataSet>  
      <Foo>              <!-- Foo-Id: 0 -->
        <Bar>abcd</Bar>
        <Foo>efg</Foo>   <!-- Foo-Id: 1, Parent-Id: 0 -->
      </Foo>
      <Foo>              <!-- Foo-Id: 2 -->
        <Bar>hijk</Bar>
        <Foo>lmn</Foo>   <!-- Foo-Id: 3, Parent-Id: 2 -->
      </Foo>
    </NewDataSet>
    

    因此,这将正确地成为结果中的4条记录,父子键为“foo-id-0”

    尝试:

    <NewDataSet>  
      <Rec>              <!-- Rec-Id: 0 -->
        <Bar>abcd</Bar>
        <Foo>efg</Foo>   
      </Rec>
      <Rec>              <!-- Rec-Id: 1 -->
        <Bar>hijk</Bar>
        <Foo>lmn</Foo>   
      </Rec>
    </NewDataSet>
    

    这将导致:

    Bar     Foo        Rec-Id
    abcd    efg        0
    hijk    lmn        1
    
        2
  •  0
  •   rohancragg    17 年前

    这些是我的观察结果,而不是一个完整的答案:

    我的猜测(不想自己重新生成)是,当数据集试图将层次结构“扁平化”为关系数据结构时,可能会发生一些事情。

    1)从关系数据库的角度考虑数据;没有明显的主键字段来标识集合中的每个foo元素,因此数据集自动使用文件中的顺序位置作为一个名为foo-id的自动生成字段。

    2)实际上有两个名为“foo”的元素,因此可能可以解释为“foo-id-0”列生成一个奇怪的名称(它自动为该列生成了一个唯一的名称-我想您可以将其视为数据集中的容错行为)。