who?
Python是基于Torch的一种使用Python作为开发语言的开源机器学习库.主要是应用领域是在自然语言的处理和图像的识别上.它主要的开发者是Facebook人工智能研究院(FAIR)团队.在2017年1月,在Gihu上被开源了.开源之后,迅速占领了Github的热搜榜.并且凭借着它独特的优势,迅速的流行开来.
what?
这么多深度学习框架,为什么选择PyTorch呢?
因为PyTorch是当前难得的简洁优雅且高效快速的框架。当前开源的框架中,没有哪一个框架能够在灵活性、易用性、速度这三个方面有两个能同时超过PyTorch。在《深度学习框架PyTorch:入门与实践》这本书里,作者总结了PyTorch的优点。
简洁:PyTorch的设计追求最少的封装,尽量避免重复造*。不像TensorFlow中充斥着session、graph、operation、name_scope、variable、tensor、layer等全新的概念,PyTorch的设计遵循tensor→variable(autograd)→nn.Module 三个由低到高的抽象层次,分别代表高维数组(张量)、自动求导(变量)和神经网络(层/模块),而且这三个抽象之间联系紧密,可以同时进行修改和操作。
简洁的设计带来的另外一个好处就是代码易于理解。PyTorch的源码只有TensorFlow的十分之一左右,更少的抽象、更直观的设计使得PyTorch的源码十分易于阅读。在笔者眼里,PyTorch的源码甚至比许多框架的文档更容易理解。
速度:PyTorch的灵活性不以速度为代价,在许多评测中,PyTorch的速度表现胜过TensorFlow和Keras等框架 。框架的运行速度和程序员的编码水平有极大关系,但同样的算法,使用PyTorch实现的那个更有可能快过用其他框架实现的。
易用:PyTorch是所有的框架中面向对象设计的最优雅的一个。PyTorch的面向对象的接口设计来源于Torch,而Torch的接口设计以灵活易用而著称,Keras作者最初就是受Torch的启发才开发了Keras。PyTorch继承了Torch的衣钵,尤其是API的设计和模块的接口都与Torch高度一致。PyTorch的设计最符合人们的思维,它让用户尽可能地专注于实现自己的想法,即所思即所得,不需要考虑太多关于框架本身的束缚。
活跃的社区:PyTorch提供了完整的文档,循序渐进的指南,作者亲自维护的论坛 供用户交流和求教问题。Facebook 人工智能研究院对PyTorch提供了强力支持,作为当今排名前三的深度学习研究机构,FAIR的支持足以确保PyTorch获得持续的开发更新,不至于像许多由个人开发的框架那样昙花一现。
why ?
说了那么多?我为什么要去认识和学习它呢?仅仅是它牛逼吗?显然不是.工作了那么多年,对程序的热情已经远远不像上学的时候那样什么热们研究什么了.能够引起我兴趣的代码就只有两种了.一种是经典中的经典代码,比如,linux内核代码,C编译器的代码等.另外一种就是工作中能用得到的代码.比如,开源的音频和视频处理源码webrtc,opencv等.
细想下来,决定让我去深入的研究Pytorch的,以上两个原因都有了.基于此,今后一段时间,要好好花一些时间去研究它,分析它.
要达到什么境界呢?也就是研究到什么程度为止.给自己定个目标吧.三个阶段目标.
阶段一: 熟悉例和应用.走读相关代码,并写出总结文档.(两周时间)
阶段二: 走读核心的源码,并输出一些有价值的文档. (一个月)
阶段三: 裁剪代码,基于Pytorch,做一个最精简的本地的语音识别系统和一个人形识别系统.(一个月)
每日一言:
骐骥一跃、不能十步、驽马十驾、功在不舍
参考文档:
1 https://en.wikipedia.org/wiki/PyTorch
2 https://blog.csdn.net/broadview2006/article/details/79147351