AI视频生成工具:快手可灵、CogVideoX及使用方法


近期,国产AI视频生成工具快手可灵备受关注,甚至超越了OpenAI的Sora项目。在公测阶段,申请试用通道的人数甚至排队数十万人之外。不过,最近可灵开始收费,年费高达数千元,给用户带来一定压力。


与此同时,与快手可灵相媲美的CogVideoX项目也正式推出。该项目还可以部署到本地电脑使用,其效果甚至不逊色于快手可灵。



CogVideoX

最新中文版:


百度网盘:



https://pan.baidu.com/s/1b2dS7Wj6-yta7xo7NrjihQ?pwd=7hmo


CogVideoX


的提示词上限为


226





token


,视频长度为


6


秒,帧率为


8





/


秒,视频分辨率为


720*480


。用户只需输入一段文字,就能快速生成充满想象力的视频,还可以自由选择生成的视频风格,包括卡通、


3D


、黑白、油画、电影等,并配上软件自带的音乐


CogVideoX


通过融合文本、时间和空间三个维度,实现了高效、连贯的视频生成,并采用


DiT


架构和优化算法,显著提升了推理速度和生成质量


工作流程


· 数据预处理:将输入的图像或视频数据转换为模型可以处理的格式,将图像切分成固定大小的


patches


(小块),然后将这些


patches


转换为特征向量

· 噪声引入:在数据预处理后的特征向量上逐步引入噪声,形成一个噪声增加的扩散过程,这个过程可以视为从原始数据到噪声数据的转换


· 模型训练:使用引入了噪声的特征向量作为输入,训练


Transformer


模型,模型的目标是学习如何逆转噪声增加的过程,即从噪声数据恢复出原始数据

· 视频生成:在模型训练完成后,通过输入随机生成的噪声和原始数据的映射关系到模型中,经过模型的处理后生成新的图像或视频


使用方法


1.


点击软件界面右下角的


load


按钮,选择项目自带的


workflow.json


文件并加载


2.


在新打开的界面中,输入待生成视频的提示词


3.


设置参数(一般保持默认)


4.


点击


Queue Prompt


按钮

稍微等待一下,视频就生成好了,甄嬛传中皇上啃鸡腿这段我怎么没见过?


注意事项

①项目安装路径不要包含中文


②推荐使用


GTX1070


以上显卡运行此项目

③使用过程中若不慎关闭软件后台,请重新打开,并刷新网页

未经允许不得转载:大白鲨游戏网 » AI视频生成工具:快手可灵、CogVideoX及使用方法