算子简报

2025-06-03 · 算子简报

1

小米将“Kimi”商标转让给月之暗面,助力AI助手发展

小米将多枚“Kimi”商标转让给北京月之暗面科技有限公司,优化非核心商标资源。

此次转让可能是小米优化资源的战略调整,支持月之暗面拓展智能助手业务。

月之暗面推出的Kimi智能助手于2023年上线,此次商标转让为其发展提供支持。

2

微软必应推出Bing视频创作工具,简化AI视频生成

微软必应推出基于OpenAI Sora模型的Bing视频创作器,用户可通过文本提示生成短视频。

该工具目前仅支持移动设备,生成速度较慢,但用户可免费使用。

Bing视频创作器的推出标志着微软在视频创作领域的进一步布局。

3

ElevenLabs发布Conversational AI 2.0,提升语音助手体验

ElevenLabs推出全新语音交互平台Conversational AI 2.0,显著提升对话流畅性和多语言支持。

该平台为客服、营销和内容创作等领域带来全新可能,具备企业级应用能力。

Conversational AI 2.0的发布标志着AI语音助手的进一步智能化。

详情链接
4

谷歌Gemini Live功能正式上线iOS,开启AI识别新体验

谷歌Gemini Live功能现已在iOS和iPadOS平台上线,支持AI识别场景和屏幕内容。

该功能通过摄像头和屏幕共享提供便捷的信息获取体验,目前仅限美国地区用户使用。

Gemini Live的推出标志着谷歌在AI领域的持续创新与应用拓展。

5

Character.AI推出AvatarFX,用户可制作个性化动画视频

Character.AI推出新功能AvatarFX,允许用户创建自定义动画视频。

新增的'场景'和'流'功能使用户能够分享角色创作,提升互动体验。

该平台面临滥用问题,需加强安全措施以保护用户。

详情链接
6

OpenAI重塑Codex CLI,告别Node.js

OpenAI宣布将Codex CLI从Node.js迁移到Rust语言重写,带来性能优化和安全性提升。

Rust实现零依赖安装,支持沙箱环境运行,增强跨平台兼容性。

Codex CLI的新版本将提升AI编程工具的使用效率和安全性。

7

NUS推出OmniConsistency,低成本实现图像风格化一致性

新加坡国立大学团队发布OmniConsistency项目,通过独特学习框架实现图像风格化与一致性的结合。

该项目以极低成本为开发者提供强大工具,助力AI艺术创作。

OmniConsistency的推出将推动图像处理技术的进一步发展。

详情链接
8

Hume AI发布EVI 3,情感智能语音AI再升级

Hume AI推出第三代语音交互模型EVI 3,具备卓越的情感理解能力。

该模型能精准识别用户语音中的情绪,生成特定风格的声音和个性。

EVI 3的推出标志着语音AI在情感交互和自然沟通领域的重大突破。

详情链接
9

苹果内部拥有1500亿参数AI模型,尚未公开发布

内幕曝光显示,苹果拥有媲美ChatGPT的1500亿参数AI模型,但未有公开发布计划。

苹果将在WWDC上开放基础模型,但其性能有限,主要支持基础功能。

领导层分歧导致多个AI项目延期,WWDC发布的多为小幅更新而非创新功能。

10

谷歌推出AI Edge Gallery应用,支持离线智能手机AI处理

谷歌推出AI Edge Gallery应用,允许用户在手机上离线运行复杂的AI模型。

该应用增强隐私保护,支持多种AI功能,但安装和使用体验仍有提升空间。

AI Edge Gallery的推出标志着谷歌在AI技术应用上的进一步探索。

11

Cerebras推理API全面开放,开发者获百万免费Token

Cerebras Systems宣布推理API全面开放,取消等待名单限制,提供每日百万免费Token。

这一举措显著提升AI推理效率,尤其在实时语音和视频处理等领域表现卓越。

Cerebras的推理API将为开发者提供强大支持,推动AI应用的广泛使用。

12

英伟达与MIT合作推出Fast-dLLM框架,推理速度提升27.6倍

英伟达联合MIT与香港大学发布Fast-dLLM框架,提升扩散模型推理速度。

该框架通过创新机制保持生成质量,为AI应用提供强大支持。

Fast-dLLM的推出将推动AI技术在各个领域的应用与发展。

详情链接