klingai  可灵AI

全新推出可灵O3-全新引擎、全能指令、全面掌控

klingai

All-in-One 全模态原生引擎,定义创作新范式

可灵3.0系列模型(含视频3.0、视频3.0 Omni、图片3.0)深度践行All-in-One产品理念,打造多模态输入输出一体化原生创作体系,标志着可灵正式迈入全流程闭环创作的3.0时代。不同于传统功能叠加型升级,该系列凭借统一技术架构,整合影像创作理解、生成、编辑、优化四大核心环节,让创作者首次通过单一模型完成“脚本输入—素材生成—细节编辑—成片导出”全链路创作,有效降低创作门槛,大幅缩短创作耗时。 各版本核心升级亮点鲜明:图片3.0升级视觉思维链(VCOT)2.0技术,强化场景解构推理能力,搭配优化后的deep-stack视觉信息流机制,细粒度感知精度提升40%,可精准还原纹理、光影及细节质感,支持4K超清直出;视频3.0重构多模态指令解析架构,优化音频采样与特征解耦方案,生成视频流畅度、清晰度提升35%,支持1080P/4K双规格输出及15秒连续生成;Omni版本升级智能主体特征库,可提取3-8秒视频中角色形象、音色及动作特征,实现跨视频还原,适配多场景二次创作。目前3.0系列已全端适配、面向所有用户开放,成为专业创作者的核心生产力工具。

大一统创作引擎,解锁高效创作新可能

可灵O1作为可灵核心旗舰模型,经多轮优化后进一步强化“大一统”创作能力,打造全球领先的多模态视频及图片创作全能引擎,彻底打破传统AI创作中多任务割裂、工具频繁切换的行业痛点。该模型基于MVL多模态视觉语言升级理念,深度融合文生视频、图生视频、首尾帧生视频等全场景创作任务,用户无需切换工具,即可实现从灵感到成品的一站式闭环创作,大幅提升创作效率。 可灵O1的技术实力持续领跑行业:图片参考任务中,其对Google Veo 3.2(最新版本)的整体效果胜负比达278%;指令变换任务上,与Runway Aleph最新版本对比胜率达256%,在复杂场景还原、多风格适配、角色一致性等核心指标上表现突出。目前该模型已全面融入可灵3.0系列生态,作为底层技术支撑,为3.0系列提供更强的指令解析与内容生成能力,实现“基础能力+进阶功能”双重赋能。

音画同出再升级,重构AI视频创作效率

可灵2.6模型的“音画同出”核心能力实现二次突破,彻底颠覆传统AI视频“先出画面、后人工配音”的低效流程,成为中小创作者的首选工具。经最新优化,该模型可单次生成包含自然对白、动作音效、环境音及背景音乐的完整视频,覆盖单人独白、多人对白、旁白解说等全场景,语音支持中英日韩四语,新增10种固定声线,后续将持续拓展更多语言及定制化声线功能。 技术架构上,可灵2.6采用扩散变换器与3D时空联合注意力机制深度融合方案,可稳定输出10秒1080P、5秒4K高清视频,生成5秒1080P视频仅需20积分,算力成本较上一版本下降20%,既提升创作效率,又降低中小创作者使用成本。目前该模型已与可灵多端产品深度适配,支持网页版、APP端快速调用,进一步简化创作流程,适配各类轻量化创作需求。

零门槛自定义建模,5分钟长视频轻松生成

伴随可灵3.0系列发布,可灵数字人功能完成重大迭代,推出数字人2.0 Pro版本,成为创作者核心工具之一。该版本大幅简化数字人制作流程,实现“零专业基础可上手”,用户仅需上传1张角色图片,添加配音内容并描述角色表情动作,即可生成表现力生动的自定义数字人,无需掌握专业建模、绑定等复杂技术。 相较于上一版本,数字人2.0 Pro在细节表现力上实现质的飞跃:角色表情、动作细腻度提升50%,支持面部特征、肢体比例个性化微调,新增服饰、场景一键切换功能;最长可生成5分钟视频,支持分段生成、无缝拼接,适配短视频、虚拟直播、企业培训等多场景应用。央视新闻“AI奇妙夜”中,渐冻症患者蔡磊的数字人演讲等内容均依托该功能实现,获得行业广泛认可。

30秒武打级动作,精准复刻无压力

可灵动作控制功能完成重大升级,推出动作控制3.0版本,依托基于Transformer的DiT 2.0架构及时空联合注意力机制,实现30秒武打级动作、表情、手势的全维度精准掌控,彻底解决虚拟角色“面瘫”“手部穿帮”“动作僵硬”等行业普遍痛点,大幅提升虚拟角色动作表现力。 该功能具备强大的动态提取与迁移能力,可精准提取参考视频中的骨骼动态、运镜逻辑、表情细节,并完美迁移至目标角色图像;支持追踪230多个面部特征点及22关节手部骨骼,微表情还原度超95%,动作流畅度提升45%,复杂场景下面部一致性稳定。各类复杂动作可一镜到底呈现,普通用户上传1张图片和1段参考视频即可生成创意视频,带动相关玩法全球传播,成为用户增长核心驱动力。

网页版免下载直达,全设备无缝衔接更流畅

针对用户便捷使用需求,可灵持续优化多端适配体验,构建“网页版+APP+小程序+海外版”全场景产品矩阵,实现创作内容云端同步,适配不同用户的多样化创作场景。其中网页版作为核心入口已全面升级,实现免下载、免安装,通过主流浏览器即可直达,适配电脑、平板等设备,低配置电脑也能流畅运行各类核心功能。 网页版搭载可灵所有最新功能,用户无需切换APP即可完成一站式创作、编辑、导出与分享,操作流程简化30%;APP端优化界面布局,新增快捷创作模板,支持离线编辑、一键导出高清视频;小程序端聚焦轻量化创作,适配移动端碎片化需求;海外版优化多语言适配与导出格式,覆盖全球多地区。目前可灵全球用户超6000万,月活稳居国内AI视频生成应用首位,成为各类创作者的首选工具。