MS SAPI SpeechRecognitionEngine在C#完全错误的转录(MS SAPI

2019-09-26 14:27发布

我是新来的MS SAPI,我想写一个WAV到使用SpeechRecognitionEngine类C#/ Windows窗体TXT转换工具。 我注意到的讲话,是完全不正确。 这一措词并不甚至听起来很相似。 我猜这可能由多种因素,如输入WAV文件的音质和加载到识别引擎的语法一长串的影响。 我现在用的是DictationGrammar类。

我会很感激,从经验丰富的语音识别/数字信号处理乡亲任何线索那里。

Answer 1:

还有你可能有这样的结果令人失望的几个原因。 首先,如果你使用的是台式识别器,你应该训练它的扬声器。

第二个想法是,如果你是从WAV文件转换,您必须选择该文件的格式时请务必小心。 您可能需要重新采样WAV文件,因为语音识别引擎只支持特定的采样率。

  • 每个样本8位
  • 单信道单声道
  • 每秒22050个采样
  • PCM编码

行之有效的Windows。 见https://stackoverflow.com/a/6203533/90236更多的一些信息。



文章来源: MS SAPI SpeechRecognitionEngine in C# completely wrong transcription