赶过一半的互联网流量是由机器人孕育产生的——有些是合法的,有些是恶意的。竞争对手和仇敌都部署“恶意”机器人,操作差此外要领来实现不良方针。这包孕接管帐户、抓取数据、薅羊毛资源抢占和倡议拒绝处事打击,目的是窃取数据或造成处事中断。
这些打击凡是不会被传统的缓解系统和计谋检测到,因为机器人已经从根基的脚本演化为具有类似人类交互能力的大规模漫衍式机器人,从而能够逃避传统检测机制。要想在威胁范围连结领先职位地方,需要更庞大、更先进的安适能力来准确地检测和缓解这些威胁。阻止当今最先进的机器人的关键技术能力之一是,基于意图的深度行为分析(IDBA)。
什么是IDBA?
IDBA是机器人检测技术的一个重要进步,它在更高条理的意图抽象长进行行为分析,而不像凡是使用的基于交互的浅层行为分析。例如,帐户接管是意图的一个例子,而“鼠标指针在直线上移动”是交互的一个例子。
捕获意图使IDBA能够供给更高级另外精度来检测高级机器人。IDBA旨在操作深度学习的最新成长。更具体地说,IDBA使用半监督学习模型来克服标签数据禁绝确、机器人突变和人类用户异常行为的挑战。它操作意图编码、意图分析和自适应学习技术,精确地检测具有庞大的类人交互成果的大规模漫衍式机器人。
IDBA的三个阶段
除了交互级另外特征(如鼠标移动)外,还需要分析访谒者在web属性中的旅程。操作更丰富的行为信息,访客可以分为三个阶段:
意图编码:通过鼠标或击键交互、URL和引用遍历以及时间戳等信号捕捉访谒者对Web属性的访谒。这些信号使用专有的、深入的神经网络体系布局编码成一种基于意图编码的、固定长度的暗示形式。该编码网络配合实现了两个方针:能够暗示全新类另外机器人的异常特征,以及为人类和机器人之间差此外行为特征供给更大的权重。
意图分析:这里,使用多机器学习模块并行分析用户的意图编码。 监督和无监督的基于学习的模块组合在一起,用于检测已知和未知模式。
自适应学习:自适应学习模块收集差别模型做出的预测,并按照这些预测对机器人采纳法子。在许多情况下,该操纵包孕向访谒者提出挑战,如验证码或供给反馈机制的SMS OTP(即验证码解决)。该反馈被纳入来姑且决策过程中。决策可以大抵分为两类任务。
.确定阈值:通过自适应阈值控制技术确定异常评分和分类概率的阈值。
.识别bot集群:对可疑集群执行选择性增量黑名单。使用与集群相关的怀疑分数(从同谋检测器模块获得)设置先验偏差。
IDBA或bust!
目前的机器人检测和分类要领在反抗快速进化和变异的庞大机器人所带来的威胁方面是无效的。使用基于交互的行为分析的机器人检测技术可以识别3级机器人,但无法检测具有类人交互成果的先进的4级机器人。级别4的机器人无法获得正确符号的数据、机器人的突变以及来自差别行业范围的人类访谒者的异常行为,这些都要求开发半监督模型,该模型在更高条理的意图抽象上事情,而不但是基于交互的行为分析。
IDBA操作意图编码、意图分析和自适应学习技术的组合来识别大规模漫衍式类人机器人打击背后的意图。