大家好,我的要求是我的现场音频流作为输入,说2人之间的呼叫,现在转换成音频的文字直播,并从提取的文本挑选某些关键字和数据库中插入。
按建筑https://github.com/aws-samples/amazon-connect-realtime-transcription两个AWS室壁运动视频流服务和AWS撷取音讯用于流媒体直播,但按照链接: https://aws.amazon.com /博客/机器学习/亚马逊录制,现在已经支持实时-转录/ AWS撷取音讯支持实时转录那么为什么要在这个架构中使用特异致动?
如果有任何人知道,请帮我理解,希望亚马逊可以连接现场摄取音频AWS撷取音讯活转录。
亚马逊的Kinesis视频流是能够从亚马逊连接流语音数据服务。 亚马逊撷取音讯可以摄取任何来源的实时转录,但只有这样,流得到来自亚马逊连接的实时数据通过室壁运动。 该实时流宣布推出可能有助于使这更清晰:
随着客户的语音流功能,您的客户的音频将自动发送到亚马逊的Kinesis视频流,它可以通过您允许集成访问。 例如,你可以客户语音流对通话质量的实时文字转录和情感分析的即时反馈整合,或自动使用此功能与第三方语音生物识别产品,以验证调用,而不必输入密码或确认个人信息。
文章来源: What is the difference between AWS Transcribe > Streaming Transcription feature and Kinesis Video Streams(For Audio Input) for live streaming audio