![]() |
1
1
|
![]() |
2
1
我成功地解决了这个问题。我必须用ffmpeg正确地转换文件:
***消除沉默:
并修复我的sync-request.json:
|
![]() |
3
0
谷歌云语音到文本提供了非常准确的结果。对于一些长的音频,它提供了成片的成绩单,作为你观察到的一系列备选方案。我所做的是在我的识别配置中设置MaxAlternatives=1,然后连接alternatives数组以获得完整的转录本。下面给出了我在c#中使用Google.Cloud.Speech.V1的识别配置
|