今天分享的是:2024生成式AI 视频行业发展现状、国内外龙头及未来方向发展分析报告
报告共计:49页
《2024生成式AI 视频行业发展现状、国内外龙头及未来方向发展分析报告》由信达证券发布,对生成式AI 视频行业进行了全面深入的分析,包括技术发展、市场参与者、应用方向以及未来展望等方面。
一、生成式AI 视频行业发展现状
1.生成式AI发展进程
-生成式AI历经文生文、文生图的发展,目前正处于AI 视频和AI 3d渗透的阶段。
-AI视频生成及编辑在市场中占比较多,重要性和产品推进速度较快。
2.主流AI视频生成技术的迭代路径
-GAN VAE:GAN用于视频生成,通过生成器和判别器对抗训练生成新数据,但存在训练不稳定等问题;VAE引入隐变量推断,训练稳定但生成图像缺少细节,两者串联融合可实现数据自动生成和高质量图像生成。
-Transformer模型:基于注意力机制,具有并行处理、可扩展性、泛化能力等优点,在视频生成领域应用广泛,但存在参数效率低、对输入数据敏感、难以处理时空动态变化等缺点。
-扩散模型:通过添加噪声和去噪过程生成新数据,分为去噪扩散概率模型、基于噪声条件评分的生成模型和随机微分方程三种类型,在视频生成领域有广泛应用。
-DiT(Transformer Diffusion):利用Transformer处理潜在空间中的图像数据块,具有潜在扩散模型的优点,生成式视频行业发展现状国内外龙头及未来方向发展分析报告提高了计算效率,可实现高质量图像生成,但也存在实现复杂性、训练稳定性、对硬件要求高等缺点。
二、市场主流的生成式视频参与者
1.海外市场
-LumaAI-DreamMachine:能将文本和图像快速转换为视频,具备前后帧输入图片生成连贯视频功能,在电影质感、提示词理解等方面有一定优势,但存在视频内物体变形等问题。
-Runway-Gen1-2&Gen-3Alpha:提供多种AI驱动的创作工具,Gen-3Alpha在保真度、一致性和运动方面有重大改进,支持多种视频编辑功能,收费标准为144美金/年。
-Pika:专注于让所有创作者都能创作出高质量视频,在文生视频基础上能实现多种编辑功能,如提示词修改指定区域框、更改视频风格等,采用订阅模式收费。
-OpenAISora:发布的文生视频模型Sora在生成视频质量、分辨率、文本语义还原等方面表现良好,最长可生成1分钟视频,功能包括文本生成视频、根据图像生成视频等。
2.国内市场
-快手-可灵AI:快手大模型涵盖多种核心技术方向,可灵视频生成大模型具备强大的视频生成能力,重点方向包括合理运动、长视频生成、模拟物理世界特性等,在APP端视频生成效果出色,产品迭代速度快。
-美图-MiracleVision4.0AI视频:主打AI设计与AI视频,新增文生视频功能,对提示词理解和物体细节处理较好,支持图生视频及运镜,后续有望更新视频生视频功能。
-PixVerse-爱诗科技:全球用户量较大的国产AI视频生成产品,通过双融合技术路径搭建AIGC视觉多模态大模型,PixVerseV2支持一次生成多个视频片段,人物一致性布局较深,可对生成结果进行二次编辑。
-即梦-字节剪映:AI作图和AI视频生成功能已上线,创新打造首帧照片和尾帧照片输入方式,增强视频生成可控性,支持中文提示词创作,产品使用界面添加了更多用户可控细节功能。
-清华-Vidu:视频大模型Vidu可根据文本描述直接生成长达16秒、分辨率达1080P的高清视频内容,强调高一致性和高动态性,采用自研U-ViT架构。
-七火山科技-Etna:Etna模型采用最新神经网络架构,融合Transformer模型和Diffusion模型,致力于通过精确的文本到视频转换,目前暂未对外开放功能测试。
三、从AI生成到AI剪辑,一站式AI视频生成 编辑有望成为核心方向
1.一站式平台型公司
以下为报告节选内容