如今,科技公司似乎无法足够快地雇用他们的AI或ML专家。 因此,如果您正在寻求升级您的技能组合或只是使用一个很酷的新工具,我们已经为您提供了前5个选择,以获得最佳的机器学习开源工具。
如今,机器学习经历了复兴。 似乎每天都有这项技术的新进展,从图像和声音识别的进步到唇读,以及在所有游戏中击败我们。
然而,这种复兴主要由硅谷资助。 公司正在争先恐后地寻找能够编写ML和深度学习代码的足够程序员。 去年是信息*的好年景,谷歌,微软,Facebook,亚马逊,甚至百度等行业的巨头开源了他们的ML框架。
解放代码是吸引人才和发展社区以及赢得善意的好方法。 (毕竟,开发人员高度重视雇主的开源工作。)谷歌无疑是开源机器学习领域的巨人,TensorFlow以大多数指标击败所有参与者。
鉴于机器学习的真正革命可能带来的范式转变,保持技术对开源的投入是非常重要的。 这些科学进步不属于任何一家公司或公司,而是属于全世界。 让ML开放和均匀分布意味着每个人都可以加入这场革命。
OpenAI
有些人对机器学习军备竞赛感到有点担心,因为世界顶尖大学失去了人才。 如果有专有的公司信息,技术上的巨大飞跃就意味着什么。
因此,Elon Musk和他的伙伴们为OpenAI这个非盈利的人工智能研究计划提供了超过10亿美元的资金。
OpenAI的使命是建立安全的人工智能通用智能(AGI),并确保AGI的优势尽可能广泛和均匀地分布。 我们预计AI技术在短期内会产生巨大影响,但其影响将超过第一批AGI的影响。
OpenAI拥有60多名全职研究人员,他们发表了有关人工智能功能和开源软件工具的精彩论文。 前往那里查看他们的平台,如Gym,一个用于开发比较强化学习算法的工具包,以及Universe,一个测量AI的一般智能的健身房环境的集合。
TensorFlow
由谷歌开源,这是开源ML库的赢家和冠军。 TensorFlow主要使用易于使用的Python编写,在Java和Go中也有一些实验性API。
有用的是,TensorFlow的入门部分有一个ML for beginners部分以及专家部分。 TensorFlow可能是此列表中更易于访问的开源工具之一,并且有充分的理由。 它是GitHub上最*的开源ML工具,拥有大多数项目(你尝试过噩梦般的搞笑edge2cats吗?)以及最大的社区。
鉴于TensorFlow目前这么流行,想要学习和实践的程序员们也可以了解下谷歌最近的AI开源项目——AIY Projects。AIY 全称是 Artificial Intelligence Yourself,顾名思义就是利用 AI 来进行的 DIY 功能套件。借助 AIY 项目,创客可以利用人工智能来实现更像人与人交流的人机交互。谷歌目前为 AIY Projects 推出了两款硬件产品--AIY Voice Kit 和 AIY Vision Kit。
而且谷歌为此还发布了一个TensorFlow.js的工具,有了这项工具,即使不是机器视觉领域的专家,大家也可以实现很多应用场景,比如在浏览器中训练自己的宠物脸辨识系统,在自家的监视系统中使用等等。
char-RNN
好吧,公平地说,由于Janelle Shane的工作,这个基于Torch / Lua的神经网络在此列表中是100%。 作为科学前沿的明信片背后的研究人员,McShane用角色级语言模型提出了一些非常有趣的项目。 无论是食谱,行星还是神奇宝贝,她的神经网络都在努力学习。 我们不应该笑。
Torch一般来说是一个很好的学习框架,至少因为FB似乎基本上都是支持这个深度学习框架。
PaddlePaddle
这是我们在JAXenter的一个新的。 PaddlePaddle是研究人员在百度,中国谷歌(以及其他事物)的工作。 百度有一个相当先进的人工智能实验室,由前斯坦福大学教授管理。 PaddlePaddle几乎是谷歌开源深度学习主导的直接镜头。
Paddle代表PArallel Distributed Deep LEarning,它被称为易于使用,高效,灵活和可扩展的深度学习平台。 他们的入门页面非常适合深度学习初学者,并通过一些问题集的初始步骤走新人。
CNTK
Microsoft的Cognitive Toolkit是一个深度学习工具包,用于训练算法,以便像人类大脑一样学习。 正如他们的GitHub页面迷人地指出的那样,“CNTK正在微软积极使用并不断发展。 会有错误。“足够公平。
毫无疑问,这个工具意味着使用神经网络来浏览非结构化数据的大型数据集。 通过更快的培训时间和易于使用的架构,CNTK可高度自定义,允许您选择自己的参数,算法和网络。 它是用Python和C ++编写的。