算子简报

2025-05-30 · 算子简报

1

阿里云推出全新AI IDE,提升编程效率

阿里云正式上线通义灵码 AI IDE,深度适配千问3。

该IDE具备编程智能体、长期记忆和行间建议预测等功能。

通义灵码已成为国内最受欢迎的编程辅助工具之一。

2

小米开源多模态大模型MiMo-VL

小米发布了多模态大模型Xiaomi MiMo-VL,参数量为7B。

该模型在多项多模态任务中表现优异,超越了更大规模的闭源模型。

MiMo-VL展现了强大的视觉感知能力和创新的训练方法。

详情链接
3

黑森林实验室推出FLUX.1Kontext,支持多次图像编辑

FLUX.1Kontext是一款支持文本和参考图像的图像生成模型。

该模型具备角色一致性、局部编辑和风格参考等特性。

FLUX.1Kontext为企业提供快速迭代的解决方案。

详情链接
4

Midjourney V7重磅更新,渲染速度提升40%

Midjourney V7版本实现了渲染速度提升40%。

新增的AI版主功能升级,提供更精准的优化建议。

启动第二轮社区路线图投票,用户可参与决定未来功能开发。

详情链接
5

DeepSeek成为全球第二大AGI实验室

DeepSeek R1-0528在技术性能和开源权重领域取得重大突破。

该实验室与谷歌并列,超越了xAI、Meta和Anthropic。

智能指数得分从60跃升至68,进步幅度显著。

6

Hugging Face推出开源人形机器人HopeJR

Hugging Face正式进军人形机器人市场,推出售价3000美元的HopeJR。

HopeJR是开源机器人,旨在打破大科技公司在机器人技术上的垄断。

该机器人适用于多种应用场景,提升了技术的可及性。

7

字节跳动火山方舟接入DeepSeek-R1-0528版本

火山方舟平台已接入最新版DeepSeek-R1-0528大模型。

该模型提供高性能服务体系和丰富功能,提升企业应用体验。

火山方舟致力于为开发者提供高效便捷的应用工具。

8

Anthropic发布‘电路追踪’工具,揭秘AI决策过程

Anthropic推出开源工具‘电路追踪’,展示大语言模型的内部决策路径。

该工具提升了对AI决策机制的理解,推动AI技术的透明化发展。

‘电路追踪’工具为AI技术的可控性提供了新的思路。

9

阿里巴巴开源AI智能体WebAgent,提升研究效率

WebAgent具备端到端的信息检索和多步推理能力。

该智能体能够主动搜索、分析和决策,极大提升信息检索效率。

WebAgent的两个模块分别负责智能体训练和语言模型基准测试。

详情链接
10

Hume发布新语音模型EVI3,带来低延迟和高情感

Hume推出语音语言模型EVI3,具有低延迟和高情感表现力。

该模型为语音交互带来了革命性进步,提升了用户体验。

EVI3适用于多种应用场景,展现强大实用价值。

详情链接
11

Manus Slides发布,一键生成专业幻灯片

Manus推出全新功能Manus Slides,支持一键生成结构化幻灯片。

该功能适用于多种场景,提升演示文稿创作效率。

用户可通过简单提示词快速生成和优化幻灯片内容。

12

Runway Gen-4 References解锁手机照片艺术化新玩法

Runway的Gen-4 References功能现已支持移动设备,用户可轻松上传照片。

结合自然语言提示,用户可以生成风格一致的艺术作品。

该功能极大提升了创作便捷性和多样性。