文件名称:watson-multimedia-analyzer:使用Watson视觉识别,语音到文本,自然语言理解和音调分析器来丰富媒体文件的Node应用程序
文件大小:55.41MB
文件格式:ZIP
更新时间:2024-06-15 12:56:52
nodejs natural-language bluemix watson-services watson-speech
使用IBM Watson丰富音频和视频文件。 在开发者的这一旅程中,我们将使用Watson服务来展示如何在时间轴上丰富媒体(音频和视频)。 感谢提供的初始申请。 流 媒体文件被传递到Media Processor扩充过程中。 Watson语音到文本服务将音频转换为文本。 根据计时器,说话者的变化或语音的明显停顿,将文本分成场景。 Watson自然语言理解服务为每个场景提取关键字,实体,概念和分类法。 Watson音调分析器服务为每个场景提取最重要的情绪,社交和写作音调。 Watson Visual Recognition Service每10秒捕获一次屏幕截图,并创建一个“瞬间”。 从每个屏幕截图中提取分类,面部和单词。 所有场景和“时刻”都存储在Watson Cloudant NoSQL DB中。 应用程序用户界面显示存储的场景和“时刻”。 沃森加速器 访问门户以查看更多实