代码之家  ›  专栏  ›  技术社区  ›  Felix

提高通话质量Twilio+Zoom

  •  0
  • Felix  · 技术社区  · 1 年前

    我让Twilio打电话给 Zoom 呼叫,然后与其他呼叫者交互。它运行良好,但演讲质量相当低。我试着使用Neural Polly和Google WaveNet,但听起来比我在AWS和Google网站上听这些声音要糟糕得多。我的理解是,Twilio将通话质量降级为8kHz。有没有办法提高演讲质量?

    我试过不同的声音。

    0 回复  |  直到 1 年前
        1
  •  -1
  •   Peter Mortensen icecrime    1 年前

    这里是Twilio的开发者代言人。

    通常,音频流是使用PCM(8kHz)的公共交换电话网络的呼叫。

    目前,以下是Twilio支持的格式:

    • WAV(采样率为8kHz的8位PCM单声道uLaw)
    • MP3
    • AIFF
    • FLAC(无损)

    Twilio将所有内容转换为8位,采样率与模型匹配(通常为8kHz或16kHz)。 然而,标准带宽被限制在300Hz-8kHz的音频范围内,并且是为语音设计的,并提供可接受的语音质量结果。

    因此必须对有效载荷进行编码 音频/x-molaw 具有8000的采样率和Base64编码。

    因此,关于Twilio可编程语音和录音功能,恐怕我们只有8kHz的采样率,这是目前唯一的采样率。

    有关更多详细信息,请参阅文章: Best Practices for Audio Recordings

    我知道这不是你想要的答案,但我想确保我对这种情况有一个恰当的解释。

    推荐文章