Llama 3 开源了「GitHub 热点速览」

时间:2024-04-28 18:30:15

e21320d78d26b7e9ece8c48f3e771cee.jpeg

近日,Meta(原 Facebook)开源了他们公司的新一代大模型 Llama 3,虽然目前只放出了 8B 和 70B 两个版本,但是在评估结果上已经优于 Claude 3 Sonnet、Mistral Medium 和 GPT-3.5 等大模型。Meta 官方还表示,这些只是开胃菜,更强的 400B 参数的模型已经在训练中了,预计几个月后将和大家见面(开源与否尚不明确)。

e2051b387af4e32fddd52a9c14113681.png

说回上周的热门开源项目,最近基于 LLM 构建知识库的开源项目很火,但我一个都没收录。因为如果是本地起大模型效果不好,请求大模型的 API 又不免费,所以我找到了一个 OpenAI API 反向代理开源项目,可用来实现免费白嫖 OpenAI API。内容也是知识库的关键,Reader 能够将网页内容转化成 LLM 友好的文本。对于没有编程基础的小伙伴,这有一个 30-Days-Of-Python 的开源教程,学它!当然,学习之余也可以娱乐一下,比如试试‘无名杀’,这是一款类似于三国杀的开源卡牌游戏。

bc639c8d7067bccf9a2571952a9f5814.png

1. 开源新闻

1.1 Meta 开源 Llama 3 大模型

今年初,扎克伯格就曾公开解释过:Meta 为什么开源 Llama 模型?

  1. 改进模型:开源可以借助社区的力量持续提升模型的质量,因为社区的反馈和审查有助于安全性和运行效率的提升,而这对每个人都有益。

  2. 产品发展:虽然开源并不排除将模型转化为商业产品的可能性,开源模型的领导者可以将社区创新整合进自家产品中,提高产品竞争力。

  3. 行业标准:开源软件有潜力成为行业标准,从而促进技术发展和统一性。

  4. 吸引人才:由于开发者和研究人员更倾向于参与开源项目,开源策略可以帮助公司吸引和招聘到行业内的优秀人才。

最新发布的 Llama 3 相较于 Llama 2 在参数规模、训练数据集、模型架构(GQA)、性能、多语言支持、推理和代码生成方面都有所提升,但现在对中文支持的不是很好,而且 meta.ai 上用的还是 Llama 2。

3c6937da240a49f6e27b34747021b6de.png

GitHub 地址:github.com/meta-llama/llama3

2. 开源热搜项目

2.1 OpenAI API 免费反向代理:ChatGPT

8f0ebb46700aca8a538c5b161599b4e8.png

主语言:TypeScriptStar:3.7k周增长:1k

虽然现在无需登陆就可以免费使用 ChatGPT(gpt-3.5-turbo 模型),但如果是想用接口的话还要收费的。该项目就是基于免费的 ChatGPT 网站服务,将其转化成免费的 ChatGPT API,接口返回和官方一致,支持 Docker 部署。需要注意的是部署的服务器,要在 OpenAI 服务支持的国家和地区。

GitHub 地址→github.com/PawanOsman/ChatGPT

2.2 一门新兴的系统级编程语言:Zig

cdf119a80c3a387563cf197bfe89de42.png

主语言:ZigStar:30k周增长:300

这是一种命令式、通用、静态类型、编译的系统编程语言,注重性能、安全和可读性。它支持编译时泛型与反射、交叉编译以及手动存储器管理,目标为改进 C 语言,可以轻松地和 C 语言的代码库配合工作。Zig 简洁且直接,没有隐式控制流、没有隐式内存分配、没有预处理器、没有宏,特别适合用于开发编译器、操作系统内核、桌面应用、性能敏感的应用、嵌入式系统等。

const std = @import("std");
const parseInt = std.fmt.parseInt;

test "parse integers" {
    const input = "123 67 89,99";
    const ally = std.testing.allocator;

    var list = std.ArrayList(u32).init(ally);
    // Ensure the list is freed at scope exit.
    // Try commenting out this line!
    defer list.deinit();

    var it = std.mem.tokenizeAny(u8, input, " ,");
    while (it.next()) |num| {
        const n = try parseInt(u32, num, 10);
        try list.append(n);
    }

    const expected = [_]u32{ 123, 67, 89, 99 };

    for (expected, list.items) |exp, actual| {
        try std.testing.expectEqual(exp, actual);
    }
}

GitHub 地址→github.com/ziglang/zig

2.3 将网页内容转化成 LLM 友好的文本:Reader

2f3667d83305f7f51ce83962a5d1f57c.png

主语言:TypeScriptStar:3k周增长:2.5k

该项目可以将指定的 URL 内容转化为干净、LLM 友好的文本,从而提高 Agent 和 RAG 系统的输入质量,可作为构建知识库的一环。我试用了一下,内容提取效果不错,但是对于需要登陆才能访问的 URL 就不行了。

GitHub 地址→github.com/jina-ai/reader

2.4 三国杀类型的卡牌游戏:noname

3591feb7579e4be622470394db895be3.png

主语言:JavaScriptStar:1.9k周增长:100

「无名杀」是一款以三国为背景的卡牌策略游戏,它完全免费、无广告,玩法和三国杀一样,但*度高很多,有海量武将可供玩家选择,还支持自制武将和技能,提供了身份、国战、斗地主、塔防、单挑、联机等游戏模式。

GitHub 地址→github.com/libccy/noname

2.5 为期 30 天的 Python 编程挑战:30-Days-Of-Python

cf2171c36250891d7cf888bf49aa5d58.png

主语言:PythonStar:31k周增长:600

该项目是帮助人们在 30 天内学会 Python 编程语言,通过每天的练习和学习,逐渐掌握 Python 的基础和进阶知识,全部完成可能需要超过 100 天。该教程适合想要快速入门 Python 的初学者,或者对 Python 有一定了解,想通过实践深入理解 Python 的开发者。

GitHub 地址→github.com/Asabeneh/30-Days-Of-Python

3. HelloGitHub 热评

在这个章节,将会分享下本周 HelloGitHub 网站上的热门开源项目,欢迎与我们分享你上手这些开源项目后的使用体验。

3.1 自定义 Windows 任务栏透明度的小工具:TranslucentTB

5cd75eebe5062aae3b7488347223a74c.png

主语言:C++

该项目是采用 C++ 开发的用于调整 Windows 任务栏透明度的工具,它体积小、免费、简单易用,支持 5 种任务栏状态、6 种动态模式、Windows 10/11 操作系统。

项目详情→hellogithub.com/repository/48c9ce6373cd4e108d74bcb4f8ac7a41

3.2 跨平台的手写笔记和绘图应用:Rnote

a4cdff1646b61c07461b82c114012a65.png

主语言:Rust

这是一款用 Rust 和 GTK4 编写的绘图应用,可用于绘制草图、手写笔记和注释文档等。它支持导入/导出 PDF 和图片文件,以及无限画布、拖放、自动保存等功能。适用于 Windows、Linux 和 macOS 系统,需要搭配手写板使用。

项目详情→hellogithub.com/repository/1d768cfa742c4fcd9c0a0bd4374cb425

4. 结尾

在结束本周「GitHub 热点速递」的精彩内容后,希望这些开源项目能够对大家有所启发,帮助你们找到新的工具、学习资源或是娱乐项目。如果看完这些还不过瘾,可以通过阅读「往期回顾」的内容,找到更多热门开源项目。

往期回顾

  • 一周涨 15k Star 的开源项目

  • 拥抱开源更省钱

以上为本周的「GitHub 热点速递」全部内容,如果你发现其他好玩、有趣的 GitHub 项目,就来 HelloGitHub 和大家一起分享吧。

- END -

???? 关注「HelloGitHub」第一时间收到更新????

点击阅读原文访问开源社区