算子简报

2025-06-03 · 算子简报

小米将“Kimi”商标转让给月之暗面，助力AI助手发展

•小米将多枚“Kimi”商标转让给北京月之暗面科技有限公司，优化非核心商标资源。

•此次转让可能是小米优化资源的战略调整，支持月之暗面拓展智能助手业务。

•月之暗面推出的Kimi智能助手于2023年上线，此次商标转让为其发展提供支持。

微软必应推出Bing视频创作工具，简化AI视频生成

•微软必应推出基于OpenAI Sora模型的Bing视频创作器，用户可通过文本提示生成短视频。

•该工具目前仅支持移动设备，生成速度较慢，但用户可免费使用。

•Bing视频创作器的推出标志着微软在视频创作领域的进一步布局。

ElevenLabs发布Conversational AI 2.0，提升语音助手体验

•ElevenLabs推出全新语音交互平台Conversational AI 2.0，显著提升对话流畅性和多语言支持。

•该平台为客服、营销和内容创作等领域带来全新可能，具备企业级应用能力。

•Conversational AI 2.0的发布标志着AI语音助手的进一步智能化。

详情链接

谷歌Gemini Live功能正式上线iOS，开启AI识别新体验

•谷歌Gemini Live功能现已在iOS和iPadOS平台上线，支持AI识别场景和屏幕内容。

•该功能通过摄像头和屏幕共享提供便捷的信息获取体验，目前仅限美国地区用户使用。

•Gemini Live的推出标志着谷歌在AI领域的持续创新与应用拓展。

Character.AI推出AvatarFX，用户可制作个性化动画视频

•Character.AI推出新功能AvatarFX，允许用户创建自定义动画视频。

•新增的'场景'和'流'功能使用户能够分享角色创作，提升互动体验。

•该平台面临滥用问题，需加强安全措施以保护用户。

详情链接

OpenAI重塑Codex CLI，告别Node.js

•OpenAI宣布将Codex CLI从Node.js迁移到Rust语言重写，带来性能优化和安全性提升。

•Rust实现零依赖安装，支持沙箱环境运行，增强跨平台兼容性。

•Codex CLI的新版本将提升AI编程工具的使用效率和安全性。

NUS推出OmniConsistency，低成本实现图像风格化一致性

•新加坡国立大学团队发布OmniConsistency项目，通过独特学习框架实现图像风格化与一致性的结合。

•该项目以极低成本为开发者提供强大工具，助力AI艺术创作。

•OmniConsistency的推出将推动图像处理技术的进一步发展。

详情链接

Hume AI发布EVI 3，情感智能语音AI再升级

•Hume AI推出第三代语音交互模型EVI 3，具备卓越的情感理解能力。

•该模型能精准识别用户语音中的情绪，生成特定风格的声音和个性。

•EVI 3的推出标志着语音AI在情感交互和自然沟通领域的重大突破。

详情链接

苹果内部拥有1500亿参数AI模型，尚未公开发布

•内幕曝光显示，苹果拥有媲美ChatGPT的1500亿参数AI模型，但未有公开发布计划。

•苹果将在WWDC上开放基础模型，但其性能有限，主要支持基础功能。

•领导层分歧导致多个AI项目延期，WWDC发布的多为小幅更新而非创新功能。

谷歌推出AI Edge Gallery应用，支持离线智能手机AI处理

•谷歌推出AI Edge Gallery应用，允许用户在手机上离线运行复杂的AI模型。

•该应用增强隐私保护，支持多种AI功能，但安装和使用体验仍有提升空间。

•AI Edge Gallery的推出标志着谷歌在AI技术应用上的进一步探索。

Cerebras推理API全面开放，开发者获百万免费Token

•Cerebras Systems宣布推理API全面开放，取消等待名单限制，提供每日百万免费Token。

•这一举措显著提升AI推理效率，尤其在实时语音和视频处理等领域表现卓越。

•Cerebras的推理API将为开发者提供强大支持，推动AI应用的广泛使用。

英伟达与MIT合作推出Fast-dLLM框架，推理速度提升27.6倍

•英伟达联合MIT与香港大学发布Fast-dLLM框架，提升扩散模型推理速度。

•该框架通过创新机制保持生成质量，为AI应用提供强大支持。

•Fast-dLLM的推出将推动AI技术在各个领域的应用与发展。

详情链接