“AI生成剧集”崛起:技术不难 难在创意

撰文: 大学线
出版:更新:

AI生成剧集近年冒起,香港电视台亦加入行列,如TVB近期推出的AI剧《在我心中,你是独一无二》。而AI短剧早于今年年头已在内地兴起,例如今年5月下旬,以AI生成的内地古装仙侠短剧《九尾狐妖男爱上我》在抖音已获得超过1.8亿次播放量。
记者:戴尚瑶 编辑:黄嘉慧/大学线

2024年底OpenAI推出了一款文字生成AI影片模型“Sora”,用家只需输入文字指令语(Prompt)便可生成影片。一句简单指令便能生成像真度高的影片,创作者们究竟如何透过AI在短时间内生成多部短剧?记者决定一探究竟,经实测后,虽然AI模型用不足数小时便生成了一部短剧,但要达到大众接受的水准,还需创作者专业的判断以及创意。

内地微短剧早前已透过其明快的剧情节奏,于内地掀起热潮。不过短处未算短,除了读者观赏影片的时长缩短,连短剧的制作时间也可以缩短至数小时内完成。内地社交媒体近来冒出不少由AI生成的短剧以及相关教学影片,更有创作者开启粉丝群组,交流相关的技术与知识。

TVB于社交平台Facebook公布首部微短剧《在我心中,你是独一无二》后,惹网民热议。(Facebook@TVB)

点图了解更多网民对AI微短剧的看法及AI生成技术的现状:

+14

其中之一是46岁的影片创作者“理想”(化名),他从2023年开始于“小红书”上传短片。截至本年十月,帐户总累积194部短片,累计9.5万赞好及2.2万粉丝。他现时为一名自由职业者,工作以制作广告、影视作品为主,其帐户由2024年7月开始发布AI生成的短片,多围绕武侠打斗或中国经典等题材。他同时亦于“抖音”上载相关制作的教学影片,以增加收入来源。

“理想”有近20年影片制作经验,原本专修土木工程的他,毕业后第一份工作便是与三维建模相关,他随后于2007年成立影片制作公司,聘请了约十名职员,主要制作地产相关的宣传影片。他称,近两年因经济下滑及成本等问题,最终决定解散公司。虽然公司走到终点,但他却看见新起点——他发现身边的制作人都开始使用AI技术辅助制作影片,节省不少成本。

他坦言,AI制作影片的确能提升效率,像是由“自行车”变成“摩托车”。影片制作本有多个工序,一部三分钟的影片,对于五至六人的团队来说,需要花三至四周的时间才可完成,例如处理CG技术(电脑合成影像)步骤繁多,需经过建模、材质、渲染、合成、特效、剪辑及输出等步骤,过程中有大量细节需要人手调整及测试,小至每个镜头的灯光设定及布置也需微调。但是随著各种AI模型兴起,它只需要输入文字,以上过程数分钟便能完成。

AI短剧制作流程繁复 终讲究影片制作知识

“理想”上传的作品包括武侠打斗、古人传记等类别,亦有与AI创作相关的教学影片。然而,AI只是创作者的工具,“理想”坦言使用AI模型作为创作辅助工具的前提是“你必须达到一个非常专业的制作水准”。否则,“学了三天AI,然后你觉得这个能赚大钱,那完全是一种误导。”谈及制作一出成熟的AI短剧的学问,“理想”从过往经验总结出一个属于他的制作流程,主要有四个步骤。

第一步:选择剧本。“理想”建议可先从两个途径入手,分别是网络小说改编和使用AI生成。前者需向作者申请授权,“理想”表示这种小说转为AI短剧一般会较受欢迎,因为小说原本已有一定粉丝基础;若没有剧本,就可用AI生成。现时AI模型的种类众多,各自的功能及优缺不尽相同,有些专攻文字,有些则专门生成图片或影片。生成文字内容的AI模型,包括有港人较为熟知的“ChatGPT”、“DeepSeek”、“豆包”等。选好模型之后,便输入剧本关键字,例如:科技、穿越、剧本等。最后设定剧本字数限制,便可完成。

第二步:以文字指令生成图片,作为影片的形象基础。现时国内较流行四款AI影像生成工具,包括“即梦AI”、“可灵AI”、“海螺AI”和“Vidu AI”;而国外则较为流行“Midjourney”。多个AI模型也支援文字生成影像的功能,但指令语所给予AI模型再诠释的幅度甚阔,所以“理想”会在直接生成影片之前,额外做多一步:“把剧本及分镜图转化成若干张图片”,以保持影片风格及形象一致性及可控性。操作上,需先按剧本需要,以及自己理想的效果,输入所需分镜的数量及说明镜头的运动,例如:远景切入。AI就会生成与之相近的构图,一般而言,一分钟的短剧大概需要12-20张图片,而生成的图片正是对应每一个分镜的内容。如果对效果不满,就要在AI生成分镜的过程中不断修改指令语,如镜头、人物表情和气氛,最后达到理想中的图片。

第三步:把生成的图片转成影片。将已有的图片上传至“可灵AI”,一键生成影片,并透过更改指令语,反复调整影像内容,如欲更改影片时长,便在对话框输入“五秒变四秒”。在反复调整后,从每张生成的图片,都转化成与之对应的影像素材(Footage),就可进入最后一步 —— 剪辑和后期制作。

第四步:剪辑和后期制作。“理想”指出现时AI已经可以将所有输入的图片,以全自动方式剪辑成完整影片,或可省掉剪辑工作,且速度较人手快,但在追求细节上,AI仍不及人手剪接,因此人工剪辑依然必不可少。剪辑工具方面与传统影片制作相近,可使用“Adobe Premiere Pro”、“Capcut 剪映”、“Sony Vegas Pro”等软件进行剪接工作。其他后期制作工作方面,他亦会继续使用“Adobe After Effect”来增加特效等。

与AI沟通常“炒车” 回复流于敷衍

尽管由剧本创作到分镜到“拍摄”,甚至连剪辑都能由AI一手包办,但“理想”笑言AI也会“炒车”。他表示现时AI模型尚未充分理解用家输入抽象或具想像力的指令。例如过往他在创作关于诗人苏轼的影片时,曾指令AI生成一幅苏轼“心中有光”的图片,但AI生成的画面却是一个人在发光,反映AI现时尚未能够完全捕捉较为抽象的描述。此外,AI在生成影片时,亦可能脱离故事逻辑令连贯性降低。“AI根本不考虑上一个画面和下一个画面怎么衔接,它(AI)只对指令负责”。

因此,与AI沟通往往是“理想”在生成影片时最耗时的部分,他现时一般需要花四至五小时来完成一条约30秒的影片。他谈到现时的AI在多次沟通后渐渐形成敷衍的态度:

你问AI这个主意好吗?它会说非常好。你问AI我这样改行吗?它会说行行行。

他指出AI很少会有新想法,“真人的话会给你另辟蹊径,给你很多不同的思路碰撞。”AI即使可能和你的想法南辕北辙,但随著你和AI沟通时间增加,它的回复会更顺应你。

记者实测:指示AI生成影片 需逐步沟通清楚

记者尝试按以上步骤制作一条约30秒的AI影片,先后在“DeepSeek”、“豆包”两个AI模型输入指令语:

请帮我写一个30秒影片的剧本,内容为中秋节、破镜重圆、古代的爱情故事。

“DeepSeek”生成的故事情节较“豆包”更详细,亦提供了分镜表,以文字阐述30秒内情节分配、配乐、影片意念等资讯;“豆包”生成的情节虽不及“DeepSeek”丰富,但会主动询问是否需要分镜表、配乐、甚至免税版配乐等后续资讯。从剧本创作角度而言,当记者输入生成剧本指令时,AI大多数会以影片镜头作导向,剧本几乎没有对白。惟记者认为AI的剧本欠缺新意,创意跨度上较为保守。

记者基于DeepSeek生成的剧本较详细而选用。记者将剧本及分镜表原封不动贴上至“可灵AI”,结果AI显示无法执行相应的指令,图片或画面会出现与文字不相符的结果。记者其后按照“理想”所建议的方法,逐一输入每一个分镜的文字描述,并指示AI对应每一个分镜的内容,分别生成两张照片。

最后在生成影片的部分,记者则组合由“可灵AI”生成的图片作参考的分镜图,然后把图片及分镜内容上载成指令的一部份,并指示AI按所写的要求生成影片,最后“可灵AI”成功执行及大致对应了指示,以九个分镜制作时长30秒的影片,总共花了一个半小时完成,整体仍算流畅清晰,但过程中AI依然偶尔无法全部跟随指令,偶有错漏,例如:在古代的时空里出现了现代建筑天秤等错误镜头。

AI生成无创意?在乎人的创作意志

科技急速的步伐下,本地AI 艺术家谢慧姗(Bianca Tse)也本著尝试的心态急急跟上,并藉著自小感兴趣的地方“九龙城寨”作为题材,以AI为器,从参考纪录照片中的“过去”,在已逝的时空里加添人物活动的色彩,再度诠释这地方。Bianca在2023年5月开始将作品发布到社交媒体上后,获媒体关注,其作品及后亦在其他展览展出。

在面对“使用AI等同缺乏创作力”的质疑,Bianca则认为具备自己的风格和品味才是最重要。她表示AI不会无缘无故自行创作,必需有人输入指示它才会运行,所以AI也如工具般,是大用或小用便要看电脑前的人。

抄袭的本质是人的意愿,不是工具本身。

谈到AI抄袭争议,Bianca认为抄袭从来不是AI的行为,而是人类的意志,“抄袭的本质是人的意愿,不是工具本身。就算是一张摄影作品,你都可以抄袭别人的摄影作品。”而Bianca在进行九龙城寨的AI生成创作时,因部分参考来源自林保贤及Greg Girard的著作《黑暗之城:九龙城寨的日与夜》(City of Darkness: Life in Kowloon Walled City),会涉及摄影师Greg Girard的摄影作品,所以都会先询问他的意愿,并在作品提及其名字。 Bianca从事了广告行业多年,两年前适逢AI面世,当时有个说法称AI会淘汰全部设计师,刚巧客户也问及AI:

我也很好奇想知道,现在的AI有多厉害?为甚么会取代我呢?

两年后,她认为AI作品的成果如何,最后还是要看创作者的创意以及品味。

【本文获香港中文大学新闻与传播学院实习刊物《大学线》授权转载。】