🚇☂♽
活动现场展示的视频生成效果令人惊叹。无论是语义理解能力,多个主体运动的复杂交互画面,还是多镜头切换的内容一致性,豆包视频生成大模型均达到业界先进水平。火山引擎总裁谭待表示,“视频生成有很多难关亟待突破。豆包两款模型会持续演进,在解决关键问题上探索更多可能性,加速拓展AI视频的创作空间和应用落地。”
据火山引擎介绍,豆包视频生成模型基于DiT架构,通过高效的DiT融合计算单元,让视频在大动态与运镜中自由切换,拥有变焦、环绕、平摇、缩放、目标跟随等多镜头语言能力。全新设计的扩散模型训练方法更是攻克了多镜头切换的一致性难题,在镜头切换时可同时保持主体、风格、氛围的一致性,这也是豆包视频生成模型独树一帜的技术创新。
经过剪映、即梦AI等业务场景打磨和持续迭代,豆包视频生成模型具备专业级光影布局和色彩调和,画面视觉极具美感和真实感。深度优化的Transformer结构,则大幅提升了豆包视频生成的泛化能力,支持3D动画、2D动画、国画、黑白、厚涂等多种风格,适配电影、电视、电脑、手机等各种设备的比例,不仅适用于电商营销、动画教育、城市文旅、微剧本等企业场景,也能为专业创作者和艺术家们提供创作辅助。
据谭待介绍勇士交易,业内多家大模型目前最高仅支持300K甚至100K的TPM(每分钟token数),难以承载企业生产环境流量。例如某科研机构的文献翻译场景,TPM峰值为360K,某汽车智能座舱的TPM峰值为420K,某AI教育公司的TPM峰值更是达到630K。为此,豆包大模型默认支持800K的初始TPM勇士交易,远超行业平均水平,客户还可根据需求灵活扩容。
➳(撰稿:殷雄璐)半熟男女 酸笋哥
2024/09/24华仁鸿📐
让黄河文化遗产焕发新活力
2024/09/24水姬贝☉
国防部:是否划设防空识别区需综合各方因素而定
2024/09/24闻光翠☿
把维护国家安全放到更加突出位置
2024/09/24杜媛祥🤨
经济社会发展统计图表:2023年国民经济主要指标
2024/09/24滕泰文🅰
江歌妈妈诉陈岚因证据不足被驳回,这一判决出于什么考虑?
2024/09/23韩芸婉👋
马快吃草少,大概就是菱智 PLUS CNG的样子吧
2024/09/23都胜健👤
商务部条约法律司负责人就欧盟将中国对欧盟乳制品反补贴调查诉至世贸争端解决机制答记者问
2024/09/23吴发晓y
东方中科高管郑鹏减持1万股,减持金额25.26万元
2024/09/22伏妹琴w
2024珠港澳大学生创业之星育苗计划在珠海启动
2024/09/22欧欣雄♟