电话: 邮箱:
诚 朴 雄 伟   励 学 敦 行 SINCERITY · SIMPLICITY · STRIVING · PRACTICE

尊龙资讯

尊龙资讯

Z6·尊龙凯时「中国区」官方网站 京东开源JoyAI-Echo长视频生成框架

发布日期:2026-06-04 19:12 来源:未知 作者:admin 浏览次数:

Z6·尊龙凯时「中国区」官方网站 京东开源JoyAI-Echo长视频生成框架

据京东黑板报,6月3日,京东推出JoyAI-Echo长音视频生成框架,径直措置行业长期存在的“长视频生成三浩劫题”——变装易崩、声息乱变、生成逐步。该框架收尾了“对话式裁剪”功能,无需为改一个镜头重跑整条视频。

JoyAI-Echo的发布,标记着京东在长视频生成限度投入大家第一梯队。

该框架包含四项中枢时代改进。一是跨模态音视频回顾库,框架内置专诚回顾库,能在多镜头生成过程中捏续保存并调用变装外不雅特征和语言东谈主音色信息。实测恶果显露,长达5分钟的视频里,变装身份、视觉形象和声息音色齐能保捏高度一致。

二是回顾启动后进修,团队改进性建议回顾启动后进修经由,纠合SFT、跨模态RLHF和DistributionMatchingDistillation(DMD)时代,仅DMD一项时代就带来约7.5倍的速率升迁,让长视频生成从“等半天”酿成“秒出片”。

2026世界杯官方指定中国区认证平台

三是DirectorAgent智能导演助理,用户用当然语言说需求,Z6尊龙凯时中国官方网站系统会自动拆分红脚本、变装、场景和镜头。那处不欢欣,径直用对话步地告诉它修改,只从头生成有问题的局部镜头,整条视频无用重来。

四是轻量化及时超分,配套专老诚时超分模块,复旧736×1280到1152×1920、以及736×1280到1472×2560两档折柳率升迁,通过单步超分就能生成高折柳率视频和精好意思化音频。

为客不雅评估性能,相关团队基于100个故事、3000个镜头构建了专诚的长音视频生成评测集。恶果显露,JoyAI-Echo在跨镜头一致性、视频质地、文本一致性和语音现实准确率等系数中枢筹备上齐赢得跨越阐明,其中文音现实准确率高达0.8646。在用户偏好调研中,81.7%的用户觉得其音频质地偏好,80.6%觉得提醒词除名偏好,63.6%觉得视觉好意思学偏好,59.4%觉得IP一致性偏好。

JoyAI-Echo的代码与权重已沿途开源Z6·尊龙凯时「中国区」官方网站,当今姿首页和GitHub代码仓库已精良上线。