文件名称:数字检测:跟踪和识别网络攻击-研究论文
文件大小:420KB
文件格式:PDF
更新时间:2024-06-29 13:43:34
cyberbullying cyberpredation
青少年是“数字原住民”[22],他们在互联网和“现实”世界中过着平行的生活 [29, 14]。 这些平行生活或网络社区建立在年轻人愿意在线披露高度个人信息的基础上,而不管他们共享的线下关系的亲密程度如何 [5, 20, 27]。 不幸的是,此类个人信息披露可能会从具有社会建设性变为具有破坏性,从无害的聊天变为攻击性 [14, 20, 17, 35, 21]。 网络欺凌者和网络掠夺者利用信息技术对隐私的不断侵蚀 [24],经常通过匿名或使用创造性的网名来保护自己。 一些攻击者使用多个网名,允许对一个或多个受害者进行多次攻击。 更复杂的检测是 ISP 隐私政策,这些政策通常会限制发布有关网络攻击者的识别信息,即使在攻击发生后也是如此。 当前关于青少年和网络攻击的研究分为三个一般领域:网络欺凌和网络掠夺的发生率、影响和预防 [20, 35]。 学术界较少关注的一个领域是跟踪网络攻击者以保护网络受害者的有效性。 这项研究探索了在多个平台上使用多个屏幕名称来检测、识别和跟踪网络欺凌者和网络掠夺者。 网络攻击和语言模式分析:显然,研究人员热切尊重并大力捍卫个人隐私权; 然而,当前方法无法充分保护青年,强烈表明需要这种研究方法。 网络犯罪的自动检测正在被确立为一个跨学科的研究领域 [1, 28, 11],并且正在利用机器学习技术,根据通信理论的研究来开发自动检测电子媒体中的掠夺和欺凌的算法. 我们目前正在进行一项多管齐下的研究,分析网络欺凌者 [29] 和性犯罪者在网上与青少年接触性行为所采用的交流方式。 使用 Olson 等人的修改版本。 吸引通信理论模型 (LCT),我们正在开发机器学习技术 Chatcoder,以帮助识别和检测这些通信模式。 我们能够正确识别包含受害者和捕食者年龄的线条、修饰语言的使用和方法(尝试实际相遇)以及未标记的线条,使用基于规则的、具有 68% 的准确率、和决策树学习器 [18, 15]。 为了提高 Chatcoder 的准确性并提高父母和执法部门保护青少年的能力,我们正在开始一个新的研究阶段,这将使我们能够根据多个在线社交网站上基于文本的活动来识别作者身份。 正在进行的工作:在本文中,我们描述了我们正在创建的数据集、用于开发数据集的过程以及 Internet 身份任务。 我们还讨论了我们在基于多个网站上的交流模式的作者身份识别方面的进展。 为了促进对互联网作者身份的研究,我们正在准备一个新的数据集,该数据集将提供给研究界。 我们目前正在手动收集提供有关特定在线用户信息的网站(我们用于发起收集活动的用户 ID 是从各种社交网站随机收集的)。 我们的研究助理正在使用搜索技术来识别这些人使用的其他用户 ID 和社交网站。 到目前为止,我们已经收集了 69 位用户的信息,还有更多的正在进行中。 我们的下一步是抓取这些链接并构建一个可用于分析和测试的 XML 数据库。 这些在线作者技术一旦成熟,将使我们能够开发技术来跟踪网络攻击者,即使他们更改了 ID 或转移到了不同的平台。 致谢:本材料部分基于美国国家科学基金会在拨款号 0916152 下支持的工作。