文件名称:论文研究-张量数据中的多密集块检测方法.pdf
文件大小:912KB
文件格式:PDF
更新时间:2022-08-11 13:02:36
张量数据,密集块,二叉树搜索,终止条件
过去的许多研究表明在实际张量数据中密集的部分存在着异常或者欺诈行为,如微博僵尸粉行为、网络攻击等。因此,研究人员提出了各种各样的方法来针对密集块的提取,但是这些方法存在低准确率和低召回率的缺点。针对这些缺点,提出了一种基于二叉树搜索的多密集块检测方法(DDB-BST),通过对张量数据进行基于评价指标的局部搜索,找到评价指标最高的子张量数据,将数据分成左右子节点,通过不断比较父节点和左右子节点评价指标值的数值关系,判断二叉树生长是否终止。同时对终止条件给出了严格的数学证明。在合成数据集以及真实数据集上进行实验,发现DDB-BST比现有的M-zoom多密集块方法的F1值提高了近30%。