🚀 谷歌发布Magika 1.0:AI文件类型检测工具升级,速度与精度大幅提升
谷歌已发布其基于人工智能的文件类型检测工具Magika的稳定版本Magika 1.0。该工具的整个引擎已用Rust语言重写,显著提升了速度和内存安全性。Magika 1.0现在能够识别超过200种文件类型,是此前约100种的两倍,并能更精确地区分JSON与JSONL、TSV与CSV等相似格式。谷歌团队利用3TB的训练数据集,并借助Gemini为罕见文件类型生成合成样本,以增强其处理能力。此外,Magika 1.0支持Python和TypeScript集成,并提供原生的Rust命令行客户端。
(科技圈)
via 茶馆 - Telegram Channel
谷歌已发布其基于人工智能的文件类型检测工具Magika的稳定版本Magika 1.0。该工具的整个引擎已用Rust语言重写,显著提升了速度和内存安全性。Magika 1.0现在能够识别超过200种文件类型,是此前约100种的两倍,并能更精确地区分JSON与JSONL、TSV与CSV等相似格式。谷歌团队利用3TB的训练数据集,并借助Gemini为罕见文件类型生成合成样本,以增强其处理能力。此外,Magika 1.0支持Python和TypeScript集成,并提供原生的Rust命令行客户端。
(科技圈)
via 茶馆 - Telegram Channel