如何改善提示词,让 GPT-4 更高效准确地把视频内容整体转换成文章?

时间:2024-07-06 20:21:01

(注:本文为小报童精选文章。已订阅小报童或加入知识星球「玉树芝兰」用户请勿重复付费

让我们来讨论一下大语言模型应用中的一个重要原则 ——「欲速则不达」。

095502c7fdd86449aef90a0ea0b1b39b.png

作为一个自认为懒惰的人,我一直有一个愿望:完成视频制作后,能够将其内容顺畅地转化为文章。这样一来,同一份工作就能以两种不同的形式存在,带来双倍的成果。

你可能会有疑问,既然已经发布了视频,为什么还需要费力制作文章?难道视频自身不足以表达内容吗?

根据多年的观察,我发现尽管视频观众和文章读者之间有重叠,但他们通常属于不同的群体,拥有不同的偏好。通过两种形式呈现内容,能更好地满足不同群体的需求,对内容传播效果影响更为显著。

为了实现这一目标,我曾请教吕立青,能否在 他的产品 BibiGPT 中增加一个功能。原本,BibiGPT 就不仅能够从在线视频链接中提取字幕,还能生成思维导图、进行问答等。

28f11e1d123a88e6cd7d42b4869d73bc.png

我提出的需求是,让 BibiGPT 帮助我们将视频中的音频内容直接转写成文章。有了这个功能,我们就可以在转写的基础上进行简单修改和润色,最终完成文章的创作。吕立青对此也很兴奋,很快就开发出了这一功能。此外,我已经多次利用这一功能完成了相关工作。

ac12670cbfcfb03f794c2655d9a698c6.png

然而,润色工作并不像看上去那么简单。如前所述,我的 语音输入流程需要强有力的提示词 和多次尝试及调整。在尝试精简内容时,有时咱们只会得到一个总结;而若强调保留原意,则文本中的口癖问题总会依旧存在。自动纠错?那可能导致更多问题,如未能识别同音字误读或拼写错误。最终的修改过程中,几乎每句都需咱们人工重写…… 这让我感到挫败,甚至加剧了拖延症。

最近,在 尝试使用 GPTs 撰写学术基金申请书时,我意识到了一个问题。这个工具并不是让我们快速完成稿件,而是将过程分解为多个步骤,每一步都不急不缓,通过对话收集大量信息。

3dc2c680f0361e5309b07aca82c56931.png

在掌握了这些信息后,GPTs 才逐步确定需要输出的内容,然后整体输出。

9ae15f12ee105b5ab49a6cf301d2cec2.png

尽管在这个过程中,我们仍然需要强烈的提示词干预才能得到满意的结果,但这让我认识到,我们有时确实需要将一个复杂的工作流程拆解成若干步骤。这看起来会把简单问题搞得枯燥复杂,但其实结果并非如此。

反思

我们需要提到一个重要的概念:「欲速则不达」。