AGI自学分享,简单有用的理论与实践

时间:2024-11-15 16:36:01

开始必备

谷歌邮箱

没有谷歌邮箱简直“寸步难行”。

GitHub · Build and ship software on a single, collaborative platform · GitHub

GitHub上有所有开源项目的源代码,当然还有许许多多资源的分享。

huggingface

huggingface上的space可以试用许多模型demo,当然也可以下载众多的模型。

通往AGI之路

通过AGI之路

包含了AI生成内容的所有方面,教程与资源,文本,绘画,视频,语音,音乐...

这样超大集合网站,推荐先粗略看看每种AGI是做什么,然后专注到某一个方面学习。

并不推荐分散精力什么都去看看,太多太杂真的劝退人,还是去看最想看的东西。

AIGC知识库

Wiki

AI之旅工具导航

AI之旅 | 为用户提供全面的AI工具和资源导航平台

包含了AI各种实用工具的导航网站,既可以直接用,也能用来学习目前“AI到底能做什么”。

AI文本

目前生成内容应用最广泛的AI应用,也是大模型名称来源,所谓Large Language Models,也就ChatGTP等文本对话应用,不同于之前,对话AI目前的差距并没有天壤之别了,对于多数常见区别不大。

做什么
  • 询问办法:你只需要提出需求,给出它专业身份,它会给出主流办法,比如如何实现批量解压压缩包。
  • 解释技术:特别是计算机相关的知识,因为网络资源丰富,GTP非常擅长而且专业,比如解释transformer。
  • 工具编程:GTP对于简单的需求已经能够非常好实现了,比如写一个python处理数据输出excel,bash批量解压。
  • 推荐工具:直接告诉它你要做什么,让它直接给出相关工具的网址。
  • ....
应用网站

https://poe.com/

poe:各种GTP导航网站,主要是可以用ChatGTP-mini很多次。

Kimi.ai - 会推理解析,能深度思考的AI助手

kimi:长文本对话,一个对话框可以上下文聊很多很多,支持读取图片内容,可以联网搜索。

智谱清言

智谱清言:多模态AI,文本,绘画,视频都可以尝试。

Prompt

结构化Prompt模板与技巧 | GPTPMT

深入浅出学习如何写一个prompt,了解必要的AI对话基本概念,也是AI智能体的基础。

云中江树的prompt

超大合集资源,可以看看各种专业的prompt是如何写的,但我感觉没必要那么复杂。

理论原理

GTP发展历程

你可以看看GTP的发展历程,了解GTP的训练过程,也是神经网络和机器学习的通用过程,了解模型的训练过程有助于明白数据标注在做什么,当然更有利于使用GTP这件事情,写出更准确的prompt。

Generative AI exists because of the transformer

这里你可以深入浅出的了解GTP到底是如何处理你的输入,给出它的输出(精致的动画演示),而且还有更为重要的算法核心-transformer。是一种神经网络,是大模型真正实用的开端。

transformer到底是如何工作的

解释transformer是如何工作的,说不上研究算法,但对使用GTP有更交心的对话体验。

AI绘画

面向创造最成熟的AI应用,无论是工作还是娱乐,都可以。

做什么
  • 媒体编辑配图,再也不用各种费尽心思寻找,独一无二又简单方便。
  • 分享灵感观点,再怎么说也不如给出一个草图来的直接。
  • 创造艺术分享,不会画画的我终于可以创造脑海想法了,表达审美。
  • ....
应用网站

目前主流是midjourney和stable diffusion。下面只是官方网站,并不能直接使用。

Sign in to Diffus

https://www.midjourney.com/home

不同于文本应用的点击即用,AI绘画需要巨大的计算性能,还要复杂的配置参数,对于只想简单表达想法小白真是复杂呀,所以我主要推荐一些点击即用的model,但也足够了日常使用了。

下面的网址是huggingface上space免费的试用接口,点击即用。

https://dreamstudio.ai/generate

stable diffusion demo

midjourney demo

able diffusion的试用model更为强大,模型效果更好。但并不是说那个模型更好,AI绘画相对AI文本复杂很多,绘画效果不仅跟使用的底层模型,还有调优模型,还有prompt,还有许许多多的参数有关。

Prompt

对于AI绘画简单使用者,prompt可比模型如何配置重要的多。

prompt的关键还是自己多尝试,找到“词语的实际感觉”

AI绘画分享社区,prompt

对于第一次的新手,模仿才是最快的理解方式,去看别人的prompt结构。

这份 Stable diffusion 提示词攻略,记得收好了! - 大模型知识库|大模型训练|开箱即用的企业大模型应用平台|智能体开发|53AI

简单但实用的入门教程。

开源图像模型Stable Diffusion入门手册

https://proximacentaurib.notion.site/e28a4f8d97724f14a784a538b8589e7d?v=ab624266c6a44413b42a6c57a41d828c

全面可以参考的艺术家风格。

全面介绍stablediffusion各方面的参数,包括如何生成原理和prompt书写原则。

https://prompt.qpipi.com/

上面链接是在线的提示词选择网站,基本够用了。

理论原理

stable diffusion工作原理

stablediffusion是如何工作的,也是AI绘画通用的原理。

Docs

stable diffusion技术完整解读

深入浅出,全面完整各方面专业的stable diffusion技术解读。

AI语音

应用已经非常成熟了,模仿人的声音,还是变声。

语音合成(TTS)技术原理简介:如何一步步将文字变成语音-腾讯云开发者社区-腾讯云

做什么
  • 数字人+语音生成AI视频。
  • AI声音对视频配音。
  • 模仿特定人物声音娱乐。
  • ...
应用网站

不同于AI文本和AI绘画,需要自己提供素材进行训练。要么使用别人训练好的模型,也就是对应的角色声音,要么就只能自己训练模型,从步骤上说更加复杂。

https://gsv.acgnai.top/

上面可以输入参考文本合成原神和星穹铁道的角色语音。可以发现很受制于人。如果想要其他声音只能不断寻找别人训练好的网站,更现实的是自己训练。

当然如果只是体验完全足够了。

Text To Speech - 在线文本转语音

上面这个在线网站,有多种人声可以合成10000字文本,可以用于配音等等。

GitHub - LokerL/tts-vue: ???? 微软语音合成工具,使用 Electron + Vue + ElementPlus + Vite 构建。

上面这个软件本地使用

理论原理

此处为语雀内容卡片,点击链接查看:整合包教程 · 语雀

一个通用的TTS训练过程。