AI创作更进一步 图片之后视频也被“拿捏” 汇集多项热门技术

《科创板日报》9月30日讯 Meta近期抛出了一个文字转视频(T2V)的拿捏AI模型——Make-A-Video(做个视频),输入几句话就能生成一段原创视频,创作该模型还可以把图片变成视频、更进从原视频得到多个衍生视频。步图被汇
文字描述为:一艘登陆火星的片之频也宇宙飞船文字描述为:机器人在时代广场跳舞把图片变成视频根据原视频生成新视频该模型建立在文字转图像(T2I)模型的基础上,即Meta的后视Make-A-Scene。研究人员通过对Make-A-Scene进行调整和训练,集多然后把它应用于视频生成模型,项热省去了文本-视频对训练这一环节,门技节省了大量的拿捏成本。
其实,创作在Make-A-Video之前,更进已经出现了多个T2V模型,步图被汇其中就包括清华大学和智源研究院研发的片之频也CogVideo,它也是后视目前唯一一个开源的T2V模型。更早之前,GODIVA和的“女娲”也都实现过根据文字描述生成视频。
Meta的研究人员采取了数据测试和人类打分两种方法对模型进行评估,与“前辈们”相比,Make-A-Video生成的视频质量更高,与文本更贴切。
值得注意的是,CogVideo与Make-A-Video的发布时间仅相差三个月。与此同时,一度爆红的T2I模型“Stable Diffusion”的母公司Stability AI已经跃跃欲试,其创始人Emad表示将很快发布一个比Make-A-Video更好的模型。
T2V 模型,为什么让大家趋之若鹜?
由文本生成影像,展示了自然语言处理技术与计算机视觉技术结合的潜力,可以理解为多项热门AI技术的交汇点。
其最直接的应用场景在于艺术、影视行业,如电影剧本编写、创意营销、教学视频,以及公共安全等众多领域。
对于曾“改名明志”的Meta来说,与文字转图像/视频有关的AI技术还连接着元宇宙,Meta已将AI团队并入AR/VR部门。
正如Meta所说,“我们在这个领域取得了进展,但这仅仅是开始。我们将继续使用这类新的生成创意工具来突破可能的界限,以构建在2D/3D中更丰富、更具表现力的消息传递以及混合现实和虚拟世界中人们之间的通信方式。”
值得注意的是,在T2V模型方面,尽管已有多家科技公司展现雄心,但它们依然面临不小的技术、伦理问题。
从Meta公布的作品来看,Make-A-Video生成的视频多少存在失真、掉帧的问题;因AI技术引发的争论性话题可谓层出不穷,前有Deepfake换脸术制造假新闻,后有AI绘画工具Midjourney生成画作获奖遭传统艺术家批评。
Meta甚至提前打起了预防针,在Make-A-Video的发布页面,这家公司声明:由于该模型可以创建看起来逼真的内容,因此我们为所有视频添加了水印,这将有助于确保观众认识到视频是假的。
相关文章
20cm涨停,叕叕创新高!这个题材大爆发,“从0到1”,业绩高增长概念股名单出炉
炒股就看,权威,专业,及时,全面,助您挖掘潜力主题机会!复合铜箔处于量产前夜。昨日,工业和信息化部、国家发展改革委、国务院国资委联合印发了《关于巩固回升向好趋势加力振作工业经济的通知》以下简称《通知》2025-07-07- 记者 辛圆北京大学企业大数据研究中心与研究院本周联合发布的《中国小微经营者调查报告》显示,二季度,小微经营者平均季度营收达13.6万元,比一季度增加1.3万元。报告指出,整体来看,第二季度小微经营者状2025-07-07
山东烟台市原经济和信息化委员会工委书记、主任孙涛接受审查调查
据烟台市纪委监委消息:烟台市原经济和信息化委员会工委书记、主任孙涛涉嫌严重违纪违法,目前正接受烟台市纪委监委纪律审查和监察调查。2025-07-07- 来源:经济参考报近日,中医药科普读物《现代人看中医》和《现代人看中药》的作者,中国中医药信息学会养生分会常务理事、专家委员会委员曹军和国家高级营养师冯清在接受《经济参考报》记者采访时谈到,中西医的基础2025-07-07
- IT之家 11 月 21 日消息,据扬州泰州国际机场微信公号消息,11 月 20 日 11:15,中国商飞国产大飞机 C919B001F)从浦东国际机场起飞,于 11:59 平稳降落在扬州泰州国际机场2025-07-07
- 如何提振信心和扭转预期?还需进一步因城施策出台和调整房地产调控政策,加大信贷的支持力度,降低交易环节税费成本等。这些举措都有助于更好满足刚性和改善性需求,激活市场交易量。随着上半年经济数据的出炉,各行2025-07-07
最新评论