文件名称:视频字幕方法综述-研究论文
文件大小:465KB
文件格式:PDF
更新时间:2024-06-09 09:31:15
Deep Learing Text Description SVM
深度学习(DL)由于其效率和在解决与人工智能有关的某些特定问题方面的出色表现而受到广泛欢迎。 在计算机视觉(CV)和自然语言处理(NLP)领域也取得了实质性进展。 预计到2024年,计算机视觉市场将从2019年的109亿美元增长到174亿美元,在预测期间以7.8%的复合年增长率增长。 因此,出现了视频字幕的任务,并且相信DL,CV,NLP的混合可以提供很好的结果。 视频字幕是指自动生成描述给定视频内容的自然语言句子的过程。 本文讨论了用于解决各种问题的技术,例如CNN,RNN,LSTM,3D CNN等。