算子简报
2025-06-09 · 算子简报
通义千问3大模型下载量突破1250万,衍生模型数量超13万
•通义千问3大模型在开源一个月内全球下载量超过1250万次。
•在Hugging Face平台上,衍生模型数量已超过13万个,成为全球第一。
•该模型在多个主流AI开源平台上表现出色,展现出强劲的市场吸引力。
即梦图片3.0全量上线,AI设计进入零门槛时代
•字节跳动旗下的即梦AI更新了其智能参考功能,支持一键生成影视级海报。
•该更新大幅降低了设计门槛,使普通用户也能轻松创作专业级作品。
•即梦图片3.0的推出标志着AI设计的普及化进程。
智谱AI推出企业级超级助手Agent CoCo
•智谱AI发布了全新的企业级超级助手Agent CoCo,旨在提升企业工作效率。
•该助手以‘懂你懂企业,能干能交付’为核心理念,提供全流程辅助服务。
•Agent CoCo引入独特记忆机制,能够提供个性化服务,主动跟踪行业动态。
百度发布金融行业大模型,智能体成新焦点
•在2025智能经济论坛上,百度智能云推出了千帆慧金大模型,专为金融行业设计。
•该模型旨在提供更精准高效的AI解决方案,满足行业对准确性与实时性的高要求。
•百度已与65%的央企合作,显示出其智能云技术的市场认可度。
小红书发布开源大模型dots.llm1,助力中文性能提升
•小红书推出了首个开源大模型dots.llm1,使用11.2万亿非合成数据进行训练。
•该模型具有1420亿参数,表现优异,尤其在中文测试中得分达到91.3。
•dots.llm1的推出标志着中文AI模型的进一步发展与应用。
Hugging Face推出LeRobot,降低AI机器人研发门槛
•Hugging Face发布了LeRobot项目,整合先进算法和开发工具链,提供高效的机器人AI开发平台。
•该项目显著降低了硬件适配成本和技术门槛,推动AI机器人研发的普及化。
•LeRobot的推出为开发者提供了更多的创新机会与灵活性。
ChatGPT语音功能升级,实时翻译更自然流畅
•OpenAI对ChatGPT的语音功能进行了全面升级,提升了语音表达的自然流畅性。
•新增的实时翻译功能支持多语言对话,增强了用户体验。
•尽管功能升级,仍存在音频质量波动和“幻觉”现象的问题。
谷歌Gemini应用下载量超越ChatGPT,但用户活跃度不足
•谷歌的Gemini应用在全球Android下载量上超过了ChatGPT,每周安装量达到600万以上。
•尽管下载量增长显著,Gemini的用户活跃度仅为4.9%,远低于ChatGPT的42.52%。
•Gemini面临提升用户日常使用率的挑战,以确保市场竞争力。
文档解析模型MonkeyOCR震撼登场,表现超越Gemini
•MonkeyOCR以3B参数量在多种文档解析任务中超越Gemini2.5Pro和Qwen2.5-VL-72B。
•该模型在公式解析上提升了15.0%,显示出其强大的解析能力。
•MonkeyOCR的解析速度达0.84页/秒,适合企业级快速响应需求。
Google Veo 3推出FAST/TURBO模式,视频生成进入超速时代
•Google推出Veo3的全新FAST/TURBO模式,大幅降低视频生成成本并提高效率。
•该模式支持带声音的视频输出,为内容创作者提供更多可能性。
•Veo3的快速生成与高质量细节表现,满足多样化的制作需求。
Google AI Studio政策变动,Gemini2.5Pro模型免费访问遭限流
•Google宣布停止免费调用Gemini2.5Pro系列模型,转向API密钥认证。
•免费用户仍可使用Gemini2.0系列模型,但性能不及Gemini2.5Pro。
•此政策调整将影响开发者的使用体验,需权衡性能与成本。