“AI生成剧集”崛起：技术不难　难在创意

撰文：大学线

出版：2025-11-08 19:00更新：2025-11-08 19:00

AI生成剧集近年冒起，香港电视台亦加入行列，如TVB近期推出的AI剧《在我心中，你是独一无二》。而AI短剧早于今年年头已在内地兴起，例如今年5月下旬，以AI生成的内地古装仙侠短剧《九尾狐妖男爱上我》在抖音已获得超过1.8亿次播放量。
记者：戴尚瑶　编辑：黄嘉慧/大学线

2024年底OpenAI推出了一款文字生成AI影片模型“Sora”，用家只需输入文字指令语（Prompt）便可生成影片。一句简单指令便能生成像真度高的影片，创作者们究竟如何透过AI在短时间内生成多部短剧？记者决定一探究竟，经实测后，虽然AI模型用不足数小时便生成了一部短剧，但要达到大众接受的水准，还需创作者专业的判断以及创意。

内地微短剧早前已透过其明快的剧情节奏，于内地掀起热潮。不过短处未算短，除了读者观赏影片的时长缩短，连短剧的制作时间也可以缩短至数小时内完成。内地社交媒体近来冒出不少由AI生成的短剧以及相关教学影片，更有创作者开启粉丝群组，交流相关的技术与知识。

TVB于社交平台Facebook公布首部微短剧《在我心中，你是独一无二》后，惹网民热议。（Facebook@TVB）

点图了解更多网民对AI微短剧的看法及AI生成技术的现状：

+14

其中之一是46岁的影片创作者“理想”（化名），他从2023年开始于“小红书”上传短片。截至本年十月，帐户总累积194部短片，累计9.5万赞好及2.2万粉丝。他现时为一名自由职业者，工作以制作广告、影视作品为主，其帐户由2024年7月开始发布AI生成的短片，多围绕武侠打斗或中国经典等题材。他同时亦于“抖音”上载相关制作的教学影片，以增加收入来源。

“理想”有近20年影片制作经验，原本专修土木工程的他，毕业后第一份工作便是与三维建模相关，他随后于2007年成立影片制作公司，聘请了约十名职员，主要制作地产相关的宣传影片。他称，近两年因经济下滑及成本等问题，最终决定解散公司。虽然公司走到终点，但他却看见新起点——他发现身边的制作人都开始使用AI技术辅助制作影片，节省不少成本。

他坦言，AI制作影片的确能提升效率，像是由“自行车”变成“摩托车”。影片制作本有多个工序，一部三分钟的影片，对于五至六人的团队来说，需要花三至四周的时间才可完成，例如处理CG技术（电脑合成影像)步骤繁多，需经过建模、材质、渲染、合成、特效、剪辑及输出等步骤，过程中有大量细节需要人手调整及测试，小至每个镜头的灯光设定及布置也需微调。但是随著各种AI模型兴起，它只需要输入文字，以上过程数分钟便能完成。

AI短剧制作流程繁复　终讲究影片制作知识

“理想”上传的作品包括武侠打斗、古人传记等类别，亦有与AI创作相关的教学影片。然而，AI只是创作者的工具，“理想”坦言使用AI模型作为创作辅助工具的前提是“你必须达到一个非常专业的制作水准”。否则，“学了三天AI，然后你觉得这个能赚大钱，那完全是一种误导。”谈及制作一出成熟的AI短剧的学问，“理想”从过往经验总结出一个属于他的制作流程，主要有四个步骤。

第一步：选择剧本。“理想”建议可先从两个途径入手，分别是网络小说改编和使用AI生成。前者需向作者申请授权，“理想”表示这种小说转为AI短剧一般会较受欢迎，因为小说原本已有一定粉丝基础；若没有剧本，就可用AI生成。现时AI模型的种类众多，各自的功能及优缺不尽相同，有些专攻文字，有些则专门生成图片或影片。生成文字内容的AI模型，包括有港人较为熟知的“ChatGPT”、“DeepSeek”、“豆包”等。选好模型之后，便输入剧本关键字，例如：科技、穿越、剧本等。最后设定剧本字数限制，便可完成。

第二步：以文字指令生成图片，作为影片的形象基础。现时国内较流行四款AI影像生成工具，包括“即梦AI”、“可灵AI”、“海螺AI”和“Vidu AI”；而国外则较为流行“Midjourney”。多个AI模型也支援文字生成影像的功能，但指令语所给予AI模型再诠释的幅度甚阔，所以“理想”会在直接生成影片之前，额外做多一步：“把剧本及分镜图转化成若干张图片”，以保持影片风格及形象一致性及可控性。操作上，需先按剧本需要，以及自己理想的效果，输入所需分镜的数量及说明镜头的运动，例如：远景切入。AI就会生成与之相近的构图，一般而言，一分钟的短剧大概需要12-20张图片，而生成的图片正是对应每一个分镜的内容。如果对效果不满，就要在AI生成分镜的过程中不断修改指令语，如镜头、人物表情和气氛，最后达到理想中的图片。

第三步：把生成的图片转成影片。将已有的图片上传至“可灵AI”，一键生成影片，并透过更改指令语，反复调整影像内容，如欲更改影片时长，便在对话框输入“五秒变四秒”。在反复调整后，从每张生成的图片，都转化成与之对应的影像素材（Footage），就可进入最后一步 —— 剪辑和后期制作。

第四步：剪辑和后期制作。“理想”指出现时AI已经可以将所有输入的图片，以全自动方式剪辑成完整影片，或可省掉剪辑工作，且速度较人手快，但在追求细节上，AI仍不及人手剪接，因此人工剪辑依然必不可少。剪辑工具方面与传统影片制作相近，可使用“Adobe Premiere Pro”、“Capcut 剪映”、“Sony Vegas Pro”等软件进行剪接工作。其他后期制作工作方面，他亦会继续使用“Adobe After Effect”来增加特效等。

与AI沟通常“炒车”　回复流于敷衍

尽管由剧本创作到分镜到“拍摄”，甚至连剪辑都能由AI一手包办，但“理想”笑言AI也会“炒车”。他表示现时AI模型尚未充分理解用家输入抽象或具想像力的指令。例如过往他在创作关于诗人苏轼的影片时，曾指令AI生成一幅苏轼“心中有光”的图片，但AI生成的画面却是一个人在发光，反映AI现时尚未能够完全捕捉较为抽象的描述。此外，AI在生成影片时，亦可能脱离故事逻辑令连贯性降低。“AI根本不考虑上一个画面和下一个画面怎么衔接，它（AI）只对指令负责”。

因此，与AI沟通往往是“理想”在生成影片时最耗时的部分，他现时一般需要花四至五小时来完成一条约30秒的影片。他谈到现时的AI在多次沟通后渐渐形成敷衍的态度：

你问AI这个主意好吗？它会说非常好。你问AI我这样改行吗？它会说行行行。

他指出AI很少会有新想法，“真人的话会给你另辟蹊径，给你很多不同的思路碰撞。”AI即使可能和你的想法南辕北辙，但随著你和AI沟通时间增加，它的回复会更顺应你。

记者实测：指示AI生成影片　需逐步沟通清楚

记者尝试按以上步骤制作一条约30秒的AI影片，先后在“DeepSeek”、“豆包”两个AI模型输入指令语：

请帮我写一个30秒影片的剧本，内容为中秋节、破镜重圆、古代的爱情故事。

“DeepSeek”生成的故事情节较“豆包”更详细，亦提供了分镜表，以文字阐述30秒内情节分配、配乐、影片意念等资讯；“豆包”生成的情节虽不及“DeepSeek”丰富，但会主动询问是否需要分镜表、配乐、甚至免税版配乐等后续资讯。从剧本创作角度而言，当记者输入生成剧本指令时，AI大多数会以影片镜头作导向，剧本几乎没有对白。惟记者认为AI的剧本欠缺新意，创意跨度上较为保守。

记者基于DeepSeek生成的剧本较详细而选用。记者将剧本及分镜表原封不动贴上至“可灵AI”，结果AI显示无法执行相应的指令，图片或画面会出现与文字不相符的结果。记者其后按照“理想”所建议的方法，逐一输入每一个分镜的文字描述，并指示AI对应每一个分镜的内容，分别生成两张照片。

最后在生成影片的部分，记者则组合由“可灵AI”生成的图片作参考的分镜图，然后把图片及分镜内容上载成指令的一部份，并指示AI按所写的要求生成影片，最后“可灵AI”成功执行及大致对应了指示，以九个分镜制作时长30秒的影片，总共花了一个半小时完成，整体仍算流畅清晰，但过程中AI依然偶尔无法全部跟随指令，偶有错漏，例如：在古代的时空里出现了现代建筑天秤等错误镜头。

AI“复活已故名人”做代言人卖茶叶　家属怒起诉：是消费不是纪念 AI诈骗｜扮神父售卖“客制化祈祷文”还伪造神迹　多达数千人上当

AI生成无创意？在乎人的创作意志

科技急速的步伐下，本地AI 艺术家谢慧姗（Bianca Tse）也本著尝试的心态急急跟上，并藉著自小感兴趣的地方“九龙城寨”作为题材，以AI为器，从参考纪录照片中的“过去”，在已逝的时空里加添人物活动的色彩，再度诠释这地方。Bianca在2023年5月开始将作品发布到社交媒体上后，获媒体关注，其作品及后亦在其他展览展出。

在面对“使用AI等同缺乏创作力”的质疑，Bianca则认为具备自己的风格和品味才是最重要。她表示AI不会无缘无故自行创作，必需有人输入指示它才会运行，所以AI也如工具般，是大用或小用便要看电脑前的人。

抄袭的本质是人的意愿，不是工具本身。

谈到AI抄袭争议，Bianca认为抄袭从来不是AI的行为，而是人类的意志，“抄袭的本质是人的意愿，不是工具本身。就算是一张摄影作品，你都可以抄袭别人的摄影作品。”而Bianca在进行九龙城寨的AI生成创作时，因部分参考来源自林保贤及Greg Girard的著作《黑暗之城：九龙城寨的日与夜》（City of Darkness: Life in Kowloon Walled City），会涉及摄影师Greg Girard的摄影作品，所以都会先询问他的意愿，并在作品提及其名字。 Bianca从事了广告行业多年，两年前适逢AI面世，当时有个说法称AI会淘汰全部设计师，刚巧客户也问及AI：