罗伯特·莱莫斯| 2015 年 3 月 24 日
德雷珀实验室(Draper Laboratory)是一家非营利性研究实验室,前身是麻省理工学院的一部分,该实验室正在开发一种机器学习系统,可以分析数 TB 的软件代码,以查找安全漏洞并进行修复。这项工作是与斯坦福大学机器学习先驱 Andrew Ng 领导的团队合作进行的。
Draper 网络系统副总监布拉德·盖纳 (Brad Gaynor) 表示,这套名为 DeepCode 的系统已经被用于发现 OpenSSL 中的 Heartbleed 等安全漏洞。据他介绍,实验室目前正在将 DeepCode 进行决策的数据量扩大 1,000 倍。
“DeepCode 是一种全新的网络安全方法。该系统收集并吞噬大量软件代码,使该软件可搜索,索引已知的缺陷和安全漏洞,并找到与先前发现的缺陷相匹配的代码(在新的或现有的代码中),”盖纳说。
几十年来,研究人员一直致力于创建警告软件潜在漏洞的系统。商业系统通常侧重于静态分析,即分析源代码以查找已知的“不良”模式,或动态分析,即通过观察程序的执行来发现缺陷的迹象。然而,这种方法通常只能检测已知类别的漏洞,并产生相当大比例的误报。
利用机器学习和模式分析技术(人工智能研究的两个基本领域),Draper 的开发人员希望 DeepCode 能够学会理解什么是好代码,什么是坏代码。一旦学会识别漏洞,研究人员就会使用该系统来识别有缺陷的代码并提出修复建议。
“最终,DeepCode 应该能够找到每 沙特阿拉伯电报数据 个已知软件缺陷的每个实例,”盖纳解释道。 “我们正在量化我们分析的准确性,并计划在未来几个月内,随着该平台初始功能版本的发布,发布有关其准确性的具有统计意义的数据。”
此前,DeepCode 团队表示,他们已经使用相同技术,通过分析大量网络流量来检测主动隐形攻击。在 11 月发表的一篇论文中,一组行业和学术研究人员描述了使用类似的机器学习系统来识别企业环境中远程指挥中心的恶意流量,否则这些流量是无法检测到的。
Draper 正在与著名的机器学习先驱 Andrew Ng 合作。他是斯坦福大学的教授,帮助创立了在线教育平台Coursera,并为其创建了一门受欢迎的机器学习课程。吴恩达还与谷歌合作开展了谷歌大脑项目,该项目使用机器学习和数千台计算机的集群来模拟人类思维的各个方面。吴恩达目前担任中国搜索引擎公司百度的首席科学家。
DeepCode 项目由美国空军研究实验室和国防高级研究计划局(DARPA)在挖掘和理解软件飞地(MUSE)计划下资助。
德雷珀实验室与美国政府还有其他合同,包括在各种网络攻击模拟中充当黑客或红队,以评估联邦政府系统的安全性。