文件名称:展示与讲述:神经视觉讲故事的人-研究论文
文件大小:544KB
文件格式:PDF
更新时间:2024-06-09 15:12:32
Recursive Neural Network (RNN) Convolution
自动叙述图像的概念是将计算机视觉和自然语言处理联系起来的人工智能的一个基本问题。 RNN,CNN和NLP是强大的技术,可帮助我们努力生成字幕并进一步生成故事。 该模型将使用递归神经网络(RNN)和自然语言处理(NLP)等技术描述复杂的图像。 RNN由内存组成:它将其输入反馈回自身,因此它可以记住过去的信息。 RNN用于顺序数据。 但是它们在记住信息方面确实存在一些缺陷。 这就是为什么CNN用于生成字幕的原因,因为它们擅长识别模式。