klingai  可灵AI

全新推出可灵O1-全新引擎、全能指令、全面掌控

klingai

可灵O1多模态模型——大一统创作引擎,一站式闭环创作

作为可灵2025年底至2026年初的重磅更新,可灵O1多模态模型打造了全球首个统一的多模态视频及图片创作全能引擎,彻底打破传统AI创作中多任务割裂的困境。该模型基于MVL多模态视觉语言理念,将文生视频、图生视频、首尾帧生视频、视频增删修改、风格重绘、镜头延展等多种任务融合一体,用户无需在多个工具间跳转,即可实现从灵感到成品的一站式创作闭环。据悉,在图片参考任务上,可灵O1对Google Veo 3.1的整体效果胜负比达247%,指令变换任务上与Runway Aleph对比胜率达230%,技术实力领跑行业。

可灵2.6模型——音画同出里程碑,重构AI视频创作流程

可灵2.6模型的上线实现了里程碑式的“音画同出”能力,彻底改变传统AI视频“先出画面、后人工配音”的低效流程。2026年最新优化后的该模型,支持单次生成包含自然语言对白、动作音效及环境氛围音的完整视频,涵盖单人独白、多人对白、旁白解说、音乐表演等多种场景,语音部分目前已支持中英双语,后续还将拓展更多语言及固定声线功能。其采用扩散变换器与3D时空联合注意力机制融合架构,可稳定输出10秒1080P高清视频,生成5秒视频仅需25积分,算力成本较上一版本下降30%,大幅提升创作效率的同时降低成本。

动作控制全面升级——30秒武打级动作,精准复刻无压力

2026年初可灵动作控制功能完成重大升级,依托基于Transformer的DiT架构及时空联合注意力机制,实现30秒武打级动作、表情、手势的全维度掌控。该功能可精准提取参考视频中的骨骼动态、运镜逻辑,完美迁移至目标角色图像,能识别追踪200多个面部特征点及22关节手部骨骼,微表情还原度超90%,有效解决虚拟角色“面瘫”“手部穿帮”等行业痛点。无论是热门舞蹈、体育竞技、武术散打等复杂动作,均可一镜到底完整呈现,无需切分拼接,普通用户只需上传一张图片和一段参考视频,即可生成流畅自然的创意视频,带动“宠物跳舞”等玩法全网病毒式传播。

数字人2.0迭代——自定义建模,5分钟长视频轻松生成

可灵数字人2.0功能同步完成迭代,成为2026年创作者的核心工具之一。该功能简化了数字人制作流程,用户只需上传角色图片,添加配音内容并描述角色表现,即可生成表现力生动的自定义数字人,无需专业建模基础。相较于上一版本,数字人2.0大幅提升了角色表情、动作的细腻度,支持角色个性化特征微调,且生成视频长度最长可达5分钟,可广泛应用于短视频创作、直播虚拟形象、企业培训、公益演讲等场景,央视新闻“AI奇妙夜”中,渐冻症患者蔡磊的数字人演讲便依托该功能实现。

多端适配优化——网页版免下载直达,全设备无缝衔接

针对用户便捷使用需求,可灵2026年持续优化多端适配体验,其中网页版作为核心入口,实现免下载、免安装,通过浏览器即可直达官方平台,适配电脑、平板等多种设备及主流浏览器,彻底打破设备配置限制。网页版同步搭载所有最新功能,包括可灵O1模型、音画同出、动作控制等,用户无需切换至APP,即可完成一站式创作、编辑、导出。同时,可灵已形成网页版、APP、小程序、海外版的多端产品矩阵,实现创作内容云端同步,无论是专业创作者的高精度制作,还是普通用户的趣味创作,都能获得流畅便捷的操作体验,目前月活用户已超4500万。

商业化与海外突破——覆盖多行业,全球市场表现亮眼

2026年初,可灵在商业化落地与海外拓展上实现双重突破,目前已覆盖企业用户超2万家,涵盖影视制作、广告创意、电商营销、教育培训、游戏开发等多个行业,为不同领域提供降本增效的AI创作解决方案。在海外市场,可灵位居巴西、俄罗斯、新加坡等近40个国家和地区的iOS端绘图和设计品类下载榜第一,成为韩国和俄罗斯市场iPhone上收入最高的图形与设计类应用。2025年12月单月收入超2000万美元,2026年1月日均收入较上月提升30%,付费用户规模环比增长350%,成为国产AI出海的核心代表之一,后续还将推出4K超高清版本,进一步拓展专业创作场景。