框架更新
-
DeepSeek 发布 Janus-Pro 和 JanusFlow2:DeepSeek 发布两款开源多模态框架。Janus-Pro 是解耦视觉编码的统一多模态框架,通过视觉编码解耦、统一 Transformer 架构等设计,在文生图基准测试 GenEval 和 DPG - Bench 中表现出色,超越 OpenAI DALL - E 3 等竞品;JanusFlow 是自回归与生成流融合的极简框架,将自回归语言模型与生成流结合,通过双编码器设计等策略,生成的图像细节表现优于 Stable Diffusion v1.5 和 SDXL。
-
百川智能推出 Baichuan - Omni - 1.53:百川智能推出开源全模态模型 Baichuan - Omni - 1.5,支持文本、图像、音频和视频处理,在多模态流式处理方面超越 GPT - 4 omini,能应对自然语言理解、图像分析和音视频内容生成等多种复杂场景,为学术界和行业应用研究提供了新工具。
-
GLM 技术团队发布 GLM - 4V - Plus - 0111beta3:GLM 技术团队发布 GLM - 4V - Plus - 0111beta 版本,利用可变分辨率等先进技术,具备分析 2 小时时长视频内容的能力,同时能优化处理资源利用率,为内容创作者和教育工作者提供了便利。
应用更新
-
DeepSeek 发布 DeepSeek - V54:DeepSeek 发布全新一代智能助手 “DeepSeek - V5”,在自然语言处理上有质的飞跃,具备高度个性化的内容生成能力,可理解复杂语境、捕捉用户情绪意图,能为不同职业用户量身定制内容,还可应用于企业的营销文案生成、客户服务流程优化等场景。
-
可灵 AI 上线新特效功能3:可灵 AI 的 “快乐秀我” 模块上线,用户可体验 “万物脸联” 等多种趣味特效,为用户提供了更多趣味性的互动体验。
-
云迪科技申请 AI 适配专利7:广州云迪科技有限公司申请 “一种基于 AI 智能体适配达梦数据库的 Spring Boot Mapper 文件修改方法” 的专利,通过引入 AI 智能体,实现了 Spring Boot Mapper 文件的智能修改,提高了适配达梦数据库的效率,降低开发和维护成本。