谷歌开源新工具Magika:基于AI高效识别文件格式和内容
2月16日消息,谷歌近日在其官方博文中宣布,已开源一款名为Magika的新工具。这款工具基于人工智能技术,可以快速高效地识别文件格式和内容类型。目前,相关的源代码已经托管到了GitHub平台上,供开发者们参考和使用。
Magika的核心是一个定制的、经过高度优化的深度学习模型。这个模型的设计非常出色,即使在普通的CPU上运行,也能够在几毫秒的时间内精确识别出文件类型。这一特性使得Magika在处理大量文件时能够保持高效和准确。
据本站了解,谷歌还分享了Magika的性能数据。在对100多种格式的100万个文件进行基准评估测试后,结果显示,Magika的性能比现有工具高出约20%。此外,Magika的精确度和召回率均达到了99%以上,这在同类产品中是非常出色的表现。
谷歌已经在内部利用Magika来加强用户安全。该系统已经被大规模部署,用于将Gmail、Drive和安全浏览中的文件发送到适当的安全和内容策略扫描器。与以前依赖手工创建规则的系统相比,谷歌通过Magika发现文件类型识别的准确率提高了50%。这一改进有助于谷歌更好地保护用户的隐私和安全。
此外,谷歌还表示,VirusTotal集成Magika之后,将进一步提高平台的效率和准确性。在VirusTotal的Code Insight对文件进行分析之前,Magika将起到预过滤的作用。Code Insight使用谷歌的生成式人工智能来检测恶意代码,而Magika的加入将使得这一过程更加高效和准确。这对于打击网络犯罪、保护用户安全具有重要意义。 |