算子简报

2025-06-09 · 算子简报

1

通义千问3大模型下载量突破1250万,衍生模型数量超13万

通义千问3大模型在开源一个月内全球下载量超过1250万次。

在Hugging Face平台上,衍生模型数量已超过13万个,成为全球第一。

该模型在多个主流AI开源平台上表现出色,展现出强劲的市场吸引力。

2

即梦图片3.0全量上线,AI设计进入零门槛时代

字节跳动旗下的即梦AI更新了其智能参考功能,支持一键生成影视级海报。

该更新大幅降低了设计门槛,使普通用户也能轻松创作专业级作品。

即梦图片3.0的推出标志着AI设计的普及化进程。

3

智谱AI推出企业级超级助手Agent CoCo

智谱AI发布了全新的企业级超级助手Agent CoCo,旨在提升企业工作效率。

该助手以‘懂你懂企业,能干能交付’为核心理念,提供全流程辅助服务。

Agent CoCo引入独特记忆机制,能够提供个性化服务,主动跟踪行业动态。

4

百度发布金融行业大模型,智能体成新焦点

在2025智能经济论坛上,百度智能云推出了千帆慧金大模型,专为金融行业设计。

该模型旨在提供更精准高效的AI解决方案,满足行业对准确性与实时性的高要求。

百度已与65%的央企合作,显示出其智能云技术的市场认可度。

5

小红书发布开源大模型dots.llm1,助力中文性能提升

小红书推出了首个开源大模型dots.llm1,使用11.2万亿非合成数据进行训练。

该模型具有1420亿参数,表现优异,尤其在中文测试中得分达到91.3。

dots.llm1的推出标志着中文AI模型的进一步发展与应用。

6

Hugging Face推出LeRobot,降低AI机器人研发门槛

Hugging Face发布了LeRobot项目,整合先进算法和开发工具链,提供高效的机器人AI开发平台。

该项目显著降低了硬件适配成本和技术门槛,推动AI机器人研发的普及化。

LeRobot的推出为开发者提供了更多的创新机会与灵活性。

7

ChatGPT语音功能升级,实时翻译更自然流畅

OpenAI对ChatGPT的语音功能进行了全面升级,提升了语音表达的自然流畅性。

新增的实时翻译功能支持多语言对话,增强了用户体验。

尽管功能升级,仍存在音频质量波动和“幻觉”现象的问题。

8

谷歌Gemini应用下载量超越ChatGPT,但用户活跃度不足

谷歌的Gemini应用在全球Android下载量上超过了ChatGPT,每周安装量达到600万以上。

尽管下载量增长显著,Gemini的用户活跃度仅为4.9%,远低于ChatGPT的42.52%。

Gemini面临提升用户日常使用率的挑战,以确保市场竞争力。

9

文档解析模型MonkeyOCR震撼登场,表现超越Gemini

MonkeyOCR以3B参数量在多种文档解析任务中超越Gemini2.5Pro和Qwen2.5-VL-72B。

该模型在公式解析上提升了15.0%,显示出其强大的解析能力。

MonkeyOCR的解析速度达0.84页/秒,适合企业级快速响应需求。

10

Google Veo 3推出FAST/TURBO模式,视频生成进入超速时代

Google推出Veo3的全新FAST/TURBO模式,大幅降低视频生成成本并提高效率。

该模式支持带声音的视频输出,为内容创作者提供更多可能性。

Veo3的快速生成与高质量细节表现,满足多样化的制作需求。

11

Google AI Studio政策变动,Gemini2.5Pro模型免费访问遭限流

Google宣布停止免费调用Gemini2.5Pro系列模型,转向API密钥认证。

免费用户仍可使用Gemini2.0系列模型,但性能不及Gemini2.5Pro。

此政策调整将影响开发者的使用体验,需权衡性能与成本。