晚上好,我的工作与Kinect的一个项目,我需要利用传感器的麦克风捕捉声音信息进行性别识别。 识别也可以是基于文本的 ,即由用户说了一句可能永远是相同的。 我“只是”需要二进制答案男/女。
我检查了颇为流行的开源狮身人面像,但我不明白,如果它可以被用来满足我的需求。
任何想法是什么,我可以使用?
提前致谢。
晚上好,我的工作与Kinect的一个项目,我需要利用传感器的麦克风捕捉声音信息进行性别识别。 识别也可以是基于文本的 ,即由用户说了一句可能永远是相同的。 我“只是”需要二进制答案男/女。
我检查了颇为流行的开源狮身人面像,但我不明白,如果它可以被用来满足我的需求。
任何想法是什么,我可以使用?
提前致谢。
为了完整起见,我终于解决了识别任务,而不分析语音输入。
性别可以与可接受的精确度也通过学习,然后视觉生物统计学特征进行分类来检测。 我用语音识别只为“接口”,以激活演示。
There are several ways to achieve this. You can track pitch (lower pitch values will be male, otherwise female). Or try to build a GMM (Sphinx cannot do this, but HTK can), with one model for male, other for female and another to children.