CoBOT检测出AI开源框架TensorFlow中的缺陷

时间:2024-05-19 11:19:58

建立在库博大数据安全分析平台之上的库博软件成分和安全分析工具可以对AI开源框架进行成分分析,根据框架中引用的组件,形成一个组件依赖的知识图谱。任何一个依赖的组件发现问题,能够根据知识图谱快速判断是否收到影响,找到受影响的组件并进行修复,防止0day漏洞发生。通过对Tensorflow的成分分析获知,整个框架主要是由Java语言开发、1,099,906行代码,4312个文件。共找到9个依赖的组件,tensorflow-for-poets-2、android-remote-notifications v1.1.4、IconShowcase v0.1、ttrss-reader-fork v1.89.0、JGiven v0.17.0、asset-pipeline vrel-0.6.1、weex-devtool-iOS v0.16.2、mapfish-print Verison  v3.2.0、UltraCosmetics v2.4.8。这些组件中又包含了其它组件,形成了组件之间的网状引用关系,增加了框架的复杂程度,如果没有相关的分析工具,则基本上难以厘清之间的关系。

建立在库博大数据安全分析平台之上的库博源代码缺陷检测工具可以对AI开源框架的分析,发现数组越界、空指标解引用、内存泄露、整数溢出、除0异常等问题,可能会导致应用软件产生拒绝服务攻击、控制流劫持、潜在的数据污染等攻击的程序运行时缺陷。也可以发现SQL注入、跨站脚本攻击、密码权限漏洞、线程死锁、Cookie安全、DoS攻击等安全漏洞。

下面我们从人工智能开源框架TOP 10中选择一款框架进行剖析。

TensorFlow是一个用于机器智能的开源软件库,使用数据流图进行数值计算。该项目曾经做过4018次提交(说明了支持组织活跃,但是另一个方面也说明缺陷问题较多),是一个非常活跃的开源项目。通过利用北大软件的CoBOT源代码缺陷和安全漏洞检测工具检测,发现存在着严重缺陷,容易受到外部攻击。

例如下面代码段:

CoBOT检测出AI开源框架TensorFlow中的缺陷

工具报出的缺陷描述如下:

缺陷说明:在TensorFlowMultiBoxDetector.java第(153)行执行循环语句,当[reader]对象中包含任意长度的行或者文件中有任意行时,该循环会不断读取文件耗尽堆内存,导致OutofMemoryError,建议对读取文件的行数和每行的长度进行限制。该函数在(88)行调用被调用[new TensorFlowMultiBoxDetector()],创建对象[d]。

通过对该缺陷进行通过污点跟踪人工分析如下:

在153行通过while循环条件中的reader对应的readLine方法一直读取输入流的每一行,直到读到文件结束。通过150行创建reader对象可看出,创建的输入流是is对象。is对象是在139行定义,在140-144行根据本地文件前缀判断是1个文件还是多个文件,打开本地文件或输入流。在137行注释语句,印证了从sdcard上或android_asset位置中读取。如果恶意攻击者通过构造外部文件,使程序一直读,占用堆内存,有可能会耗尽堆内存,而使系统内存资源耗尽而无法提供处理或拒绝服务。从而确认该缺陷是一个严重缺陷,可能会导致来自于外部的恶意攻击。

该开源框架检测报出的其它缺陷和安全漏洞比较多,除了违反MISRA 2004/2008/2012安全编码标准大量缺陷之外,还存在多处潜在的内存泄漏,例如:

CoBOT检测出AI开源框架TensorFlow中的缺陷

上述代码中,55行创建labelsInputStream对象,在栈上申请了内存,该对象作为参数两处传递给OvicClassifier对象,而该对象也是在方法内部创建的局部变量,是临时对象,在方法结束之前未释放,潜在着内存泄露和资源调度上的隐患。其它缺陷由于篇幅不再一一赘述。

希望采用该框架的企业,分析一下开源框架中的潜在风险。

(完)