klingai  可灵AI

全新推出可灵O3-全新引擎、全能指令、全面掌控

klingai

All-in-One 全模态原生引擎,定义创作新范式

可灵3.0系列模型(含视频3.0、视频3.0 Omni、图片3.0)深度践行All-in-One产品理念,打造多模态输入输出一体化原生创作体系,标志着可灵正式迈入全流程闭环创作的3.0时代。与传统功能叠加型升级不同,该系列通过统一技术架构,将影像创作的理解、生成、编辑、优化四大环节整合为连续流程,让创作者首次实现“脚本输入—素材生成—细节编辑—成片导出”的全链路单一模型完成,大幅降低创作门槛与时间成本。 各版本核心升级亮点如下:图片3.0升级视觉思维链(VCOT)2.0技术,强化场景解构推理能力,搭配优化后的deep-stack视觉信息流机制,细粒度感知精度提升40%,可精准还原纹理、光影及细节质感;视频3.0重构多模态指令解析架构,优化音频采样区间与特征解耦重组方案,采用统一多模态训练框架,生成视频的流畅度、画面清晰度提升35%,支持1080P/4K双规格输出;Omni版本新增智能主体特征库升级功能,可提取3-8秒视频中的角色形象、音色及动作特征,实现跨视频还原应用,适配多场景二次创作需求。目前,3.0系列已完成全端适配,成为专业创作者的核心生产力工具。

大一统创作引擎,解锁高效创作新可能

作为可灵2025年底标志性发布的核心模型,可灵O1历经2026年多轮优化,进一步强化“大一统”创作能力,打造全球领先的多模态视频及图片创作全能引擎,彻底打破传统AI创作中多任务割裂、工具频繁切换的行业痛点。该模型基于MVL多模态视觉语言升级理念,将文生视频、图生视频、首尾帧生视频、视频增删修改、风格重绘、镜头延展、素材拼接等全场景创作任务深度融合,用户无需切换工具,即可实现从灵感到成品的一站式闭环创作。 技术实力持续领跑行业:在图片参考任务中,可灵O1对Google Veo 3.2(最新版本)的整体效果胜负比达278%,指令变换任务上与Runway Aleph最新版本对比胜率达256%,在复杂场景还原、多风格适配等核心指标上表现突出。目前,该模型已全面融入可灵3.0系列生态,作为底层技术支撑,为3.0系列提供更强大的指令解析、内容生成能力,实现“基础能力+进阶功能”的双重赋能。

音画同出再升级,重构AI视频创作效率

可灵2.6模型的“音画同出”核心能力实现二次突破,彻底颠覆传统AI视频“先出画面、后人工配音”的低效流程,成为2026年中小创作者的首选工具。经过最新优化,该模型支持单次生成包含自然语言对白、动作音效、环境氛围音及背景音乐的完整视频,覆盖单人独白、多人对白、旁白解说、音乐表演、产品讲解等全场景,语音部分已升级支持中英日韩四种语言,新增10种固定声线(含沉稳旁白、活泼口语、专业解说等),后续将持续拓展更多语言及定制化声线功能。 技术架构上,采用扩散变换器与3D时空联合注意力机制深度融合方案,可稳定输出10秒1080P高清视频、5秒4K高清视频,生成5秒1080P视频仅需20积分,算力成本较上一版本再降20%,大幅提升创作效率的同时,进一步降低中小创作者的使用成本。目前,该模型已与可灵多端产品深度适配,支持网页版、APP端快速调用,简化创作流程。

零门槛自定义建模,5分钟长视频轻松生成

伴随可灵3.0系列发布,可灵数字人功能完成重大迭代,推出数字人2.0 Pro版本,成为2026年创作者核心工具之一。该版本进一步简化数字人制作流程,实现“零专业基础可上手”,用户只需上传1张角色图片,添加配音内容、描述角色表情动作,即可生成表现力生动的自定义数字人,无需掌握专业建模、绑定技术。 相较于上一版本,数字人2.0 Pro在细节表现力上实现质的提升:角色表情、动作细腻度提升50%,支持面部特征、肢体比例个性化微调,新增服饰、场景一键切换功能;生成视频长度最长可达5分钟,支持分段生成、无缝拼接,适配短视频创作、直播虚拟形象、企业培训、公益演讲、知识科普等多场景应用。其中,央视新闻“AI奇妙夜”中,渐冻症患者蔡磊的数字人演讲、公益科普类数字人宣讲等内容,均依托该功能实现,获得广泛行业认可。

30秒武打级动作,精准复刻无压力

2026年初,可灵动作控制功能完成重大升级,推出动作控制3.0版本,依托基于Transformer的DiT 2.0架构及时空联合注意力机制,实现30秒武打级动作、表情、手势的全维度精准掌控,彻底解决虚拟角色“面瘫”“手部穿帮”“动作僵硬”等行业痛点。 该功能具备强大的动态提取与迁移能力,可精准提取参考视频中的骨骼动态、运镜逻辑、表情细节,完美迁移至目标角色图像;支持识别追踪230多个面部特征点及22关节手部骨骼,微表情还原度超95%,动作流畅度提升45%。无论是热门舞蹈、体育竞技、武术散打等复杂动作,均可一镜到底完整呈现,无需切分拼接。普通用户只需上传一张图片和一段参考视频,即可生成流畅自然的创意视频,带动“宠物跳舞”“虚拟偶像翻跳”等玩法在全球社交媒体病毒式传播,成为可灵用户增长的核心驱动力之一。

网页版免下载直达,全设备无缝衔接更流畅

针对用户便捷使用需求,可灵2026年持续优化多端适配体验,构建“网页版+APP+小程序+海外版”的全场景产品矩阵,实现创作内容云端同步,适配不同用户的创作场景需求。其中,网页版作为核心入口,完成全面升级:实现免下载、免安装,通过主流浏览器即可直达官方平台,适配电脑、平板等多种设备,彻底打破设备配置限制,低配置电脑也能流畅运行3.0系列、动作控制3.0等核心功能。 网页版同步搭载可灵所有最新功能,用户无需切换至APP,即可完成一站式创作、编辑、导出、分享,操作流程简化30%;APP端优化界面布局,新增快捷创作模板,支持离线编辑、一键导出高清视频;小程序端聚焦轻量化创作,支持快速生成短视频、数字人短句,适配移动端碎片化创作需求;海外版针对海外用户习惯,优化多语言适配与导出格式,覆盖全球多个国家和地区。截至目前,可灵月活用户已超1500万,稳居国内AI视频生成应用首位,成为专业创作者与普通用户的首选AI创作工具。