时间在变,空间随着时间也在变,不变的唯有真知灼见。
2025年09月25日  星期四
首页
财经
观察
参考
ESG
公告
市场
研究
IPO
公司
周报
动态
推荐
首页 > 快讯

【微软开源创新框架:可将DeepSeek,变成AI Agent】

来源:真灼财经 时间:2025-02-17 07:35:36

字号

 【微软开源创新框架:可将DeepSeek,变成AI Agent】微软在官网发布了视觉Agent解析框架OmniParser最新版本V2.0,可将DeepSeek-R1、GPT-4o、Qwen-2.5VL等模型,变成可在计算机使用的AI Agent。与V1版本相比,V2在检测较小的可交互UI元素时准确率更高、推理速度更快,延迟降低了60%。在高分辨率Agent基准测试ScreenSpot Pro中,V2+GPT-4o的准确率达到了惊人的39.6%,而GPT-4o原始准确率只有0.8%,整体提升非常大。除了V2,微软还开源了omnitool,这是一个基于Docker的 Windows 系统,涵盖屏幕理解、定位、动作规划和执行等功能,也是将大模型变成Agent的关键工具。(AIGC开放社区)

微信扫码 > 右上角点击 > 分享