代码之家  ›  专栏  ›  技术社区  ›  mmcdole

从音频文件中提取数据的好库有哪些?

  •  3
  • mmcdole  · 技术社区  · 15 年前

    最近我开始使用 Shazam app 在我的iPhone上。对于那些不知道的人,这个应用程序通过听播放的一小段歌曲来识别歌曲。我对它的准确性和速度感到惊讶,所以我决定做一点挖掘。

    here . 在本文中,开发人员详细描述了Shazam中使用的指纹算法。

    有哪些音频库可以帮助您提取音频剪辑或mp3歌曲在其持续时间内的频率、振幅和其他特征?

    我正在使用.NET,但我对其他语言库开放。我对开源和付费图书馆都很满意。只要我能可靠地从程序中提取音频特征,我就会很高兴。

    另见:
    How Shazam Works
    Shazam Journal Paper

    3 回复  |  直到 15 年前
        1
  •  2
  •   Sebastian Gray    15 年前

    试试看NAudio。它可能没有所有你想要的音频分析,但它是相当可扩展的,如果你使用.Net语言,它将是一个很好的开始。

        2
  •  0
  •   lizzie    11 年前

    首先,您应该阅读 this paper

    许多实验室都开发了自己的库来提取音频特性。 你可以看看亚菲,奥比奥,贾迪奥。。。。

        3
  •  -1
  •   MrMage    15 年前

    这个 ffmpeg

    为了提取音频属性,您应该考虑一个适合信号分析的合适的库。例如,您将特别需要快速傅立叶变换(FTT)从音频样本中提取频率数据。 A search 在这个问题上有很多结果。

    /编辑:对于.NET,我相信 ffmpeg 接口。你也可以找到.NET的信号分析工具。