Magika
Magika利用尖端深度学习的力量来增强文件类型检测的准确性,支持多种内容类型,准确率和召回率均超过了传统工具,达到了99%以上。Magika专为效率而设计,即使在单个CPU上也能快速运行,谷歌类似的模式目前每秒扫描数百万个文件。Magika采用了一种定制的、高度优化的深度学习模型,即使在CPU上运行,也能在几毫秒内实现精确的文件识别。Magika还能通过AI模型和大型训练数据集,在1M个文件基准测试中优于其他现有工具约20%,在文本文件上表现尤为突出。在谷歌内部,Magika被大规模使用,帮助提高用户的安全性,提高文件类型识别准确性50%。Magika的开源将有助于其他软件提高文件识别的准确性,并为研究人员提供一种可靠的大规模识别文件类型的方法。Magika代码和模型从今天开始在Github中以Apache2许可证的形式免费提供。Magika还可以通过pypi包管理器作为独立的实用程序和python库快速安装,无需GPU。
广告:私人定制视频文本提取,字幕翻译制作等,欢迎联系QQ:1752338621