代码之家  ›  专栏  ›  技术社区  ›  user85461

美国人口普查地图边界文件的字符编码

  •  0
  • user85461  · 技术社区  · 16 年前

    我正在尝试导入美国人口普查地图边界文件(可在此处获得: http://www.census.gov/geo/www/cob/bdy_files.html )到geodjango应用程序中。但是,python抱怨unicodedecode错误(例如,波多黎各的非ASCII字符)。

    shapefile描述文件(*.dbf)没有指定它使用的字符编码;shapefile的规范没有定义这一点。要使用的正确字符编码是什么?

    2 回复  |  直到 14 年前
        1
  •  2
  •   greenwar    14 年前

    我对CBSA也有同样的问题,并将2010年人口普查的数据放入完整的几何图形中。这些不是剪辑的卡通文件。

    IBM850对我来说工作不正常。一时兴起,我试过拉丁裔,但效果很好。

        2
  •  1
  •   user85461    16 年前

    美国人口普查地图边界文件使用 IBM850 字符编码。正确编码这些字符串的python代码如下:

    unicode(featurestring.decode("IBM850"))