算子简报

2025-06-09 · 算子简报

通义千问3大模型下载量突破1250万，衍生模型数量超13万

•通义千问3大模型在开源一个月内全球下载量超过1250万次。

•在Hugging Face平台上，衍生模型数量已超过13万个，成为全球第一。

•该模型在多个主流AI开源平台上表现出色，展现出强劲的市场吸引力。

•字节跳动旗下的即梦AI更新了其智能参考功能，支持一键生成影视级海报。

•该更新大幅降低了设计门槛，使普通用户也能轻松创作专业级作品。

•即梦图片3.0的推出标志着AI设计的普及化进程。

•智谱AI发布了全新的企业级超级助手Agent CoCo，旨在提升企业工作效率。

•该助手以‘懂你懂企业，能干能交付’为核心理念，提供全流程辅助服务。

•Agent CoCo引入独特记忆机制，能够提供个性化服务，主动跟踪行业动态。

•在2025智能经济论坛上，百度智能云推出了千帆慧金大模型，专为金融行业设计。

•该模型旨在提供更精准高效的AI解决方案，满足行业对准确性与实时性的高要求。

•百度已与65%的央企合作，显示出其智能云技术的市场认可度。

•小红书推出了首个开源大模型dots.llm1，使用11.2万亿非合成数据进行训练。

•该模型具有1420亿参数，表现优异，尤其在中文测试中得分达到91.3。

•dots.llm1的推出标志着中文AI模型的进一步发展与应用。

•Hugging Face发布了LeRobot项目，整合先进算法和开发工具链，提供高效的机器人AI开发平台。

•该项目显著降低了硬件适配成本和技术门槛，推动AI机器人研发的普及化。

•LeRobot的推出为开发者提供了更多的创新机会与灵活性。

•OpenAI对ChatGPT的语音功能进行了全面升级，提升了语音表达的自然流畅性。

•新增的实时翻译功能支持多语言对话，增强了用户体验。

•尽管功能升级，仍存在音频质量波动和“幻觉”现象的问题。

•谷歌的Gemini应用在全球Android下载量上超过了ChatGPT，每周安装量达到600万以上。

•尽管下载量增长显著，Gemini的用户活跃度仅为4.9%，远低于ChatGPT的42.52%。

•Gemini面临提升用户日常使用率的挑战，以确保市场竞争力。

•MonkeyOCR以3B参数量在多种文档解析任务中超越Gemini2.5Pro和Qwen2.5-VL-72B。

•该模型在公式解析上提升了15.0%，显示出其强大的解析能力。

•MonkeyOCR的解析速度达0.84页/秒，适合企业级快速响应需求。

•Google推出Veo3的全新FAST/TURBO模式，大幅降低视频生成成本并提高效率。

•该模式支持带声音的视频输出，为内容创作者提供更多可能性。

•Veo3的快速生成与高质量细节表现，满足多样化的制作需求。

•Google宣布停止免费调用Gemini2.5Pro系列模型，转向API密钥认证。

•免费用户仍可使用Gemini2.0系列模型，但性能不及Gemini2.5Pro。

•此政策调整将影响开发者的使用体验，需权衡性能与成本。