算子简报
2025-05-30 · 算子简报
阿里云推出全新AI IDE,提升编程效率
•阿里云正式上线通义灵码 AI IDE,深度适配千问3。
•该IDE具备编程智能体、长期记忆和行间建议预测等功能。
•通义灵码已成为国内最受欢迎的编程辅助工具之一。
小米开源多模态大模型MiMo-VL
•小米发布了多模态大模型Xiaomi MiMo-VL,参数量为7B。
•该模型在多项多模态任务中表现优异,超越了更大规模的闭源模型。
•MiMo-VL展现了强大的视觉感知能力和创新的训练方法。
黑森林实验室推出FLUX.1Kontext,支持多次图像编辑
•FLUX.1Kontext是一款支持文本和参考图像的图像生成模型。
•该模型具备角色一致性、局部编辑和风格参考等特性。
•FLUX.1Kontext为企业提供快速迭代的解决方案。
Midjourney V7重磅更新,渲染速度提升40%
•Midjourney V7版本实现了渲染速度提升40%。
•新增的AI版主功能升级,提供更精准的优化建议。
•启动第二轮社区路线图投票,用户可参与决定未来功能开发。
DeepSeek成为全球第二大AGI实验室
•DeepSeek R1-0528在技术性能和开源权重领域取得重大突破。
•该实验室与谷歌并列,超越了xAI、Meta和Anthropic。
•智能指数得分从60跃升至68,进步幅度显著。
Hugging Face推出开源人形机器人HopeJR
•Hugging Face正式进军人形机器人市场,推出售价3000美元的HopeJR。
•HopeJR是开源机器人,旨在打破大科技公司在机器人技术上的垄断。
•该机器人适用于多种应用场景,提升了技术的可及性。
字节跳动火山方舟接入DeepSeek-R1-0528版本
•火山方舟平台已接入最新版DeepSeek-R1-0528大模型。
•该模型提供高性能服务体系和丰富功能,提升企业应用体验。
•火山方舟致力于为开发者提供高效便捷的应用工具。
Anthropic发布‘电路追踪’工具,揭秘AI决策过程
•Anthropic推出开源工具‘电路追踪’,展示大语言模型的内部决策路径。
•该工具提升了对AI决策机制的理解,推动AI技术的透明化发展。
•‘电路追踪’工具为AI技术的可控性提供了新的思路。
阿里巴巴开源AI智能体WebAgent,提升研究效率
•WebAgent具备端到端的信息检索和多步推理能力。
•该智能体能够主动搜索、分析和决策,极大提升信息检索效率。
•WebAgent的两个模块分别负责智能体训练和语言模型基准测试。
Hume发布新语音模型EVI3,带来低延迟和高情感
•Hume推出语音语言模型EVI3,具有低延迟和高情感表现力。
•该模型为语音交互带来了革命性进步,提升了用户体验。
•EVI3适用于多种应用场景,展现强大实用价值。
Manus Slides发布,一键生成专业幻灯片
•Manus推出全新功能Manus Slides,支持一键生成结构化幻灯片。
•该功能适用于多种场景,提升演示文稿创作效率。
•用户可通过简单提示词快速生成和优化幻灯片内容。
Runway Gen-4 References解锁手机照片艺术化新玩法
•Runway的Gen-4 References功能现已支持移动设备,用户可轻松上传照片。
•结合自然语言提示,用户可以生成风格一致的艺术作品。
•该功能极大提升了创作便捷性和多样性。