一贯以来,大模型常常以「文科生」的形象为人所知。从写周报、邮件,到赞助写学术论文、法律文书,这类事务型写作由于规则和用场明确,特殊能让大模型发挥自己的所长。
可正是这些高度规则化的写作里,容不下缺点。
与事实不符、凭空生造内容、不按用户指令输出等等,这些都是大措辞模型常常会涌现的「幻觉」,是目前最让工程师和用户都头疼的问题。
然而,在另一些人眼里,「幻觉」和「天生」相伴相生,意味着机器也在创造。
去年十月,第五届江苏省青年科普科幻作品发布获奖作品,评审们惊奇地创造得到二等奖的《机忆之地》,是一部完备由 AI 天生的短篇小说。
作者是清华大学数据新闻教授沈阳,创作中他和 AI 交往返回对话了六十多轮,连笔名都是 AI 起的。
同样是去年,GenWorld 联合 Hugging Face、真格基金,办了两届「中文 AI 眇小说大赛」。不同于沈阳的匿名投稿,眇小说大赛不仅明文规定了要用 AI ,而且要全都用:不许可人为对文本直接进行润色和加工,修正都必须通过 prompting 完成。
全文都靠天生并不是件随意马虎的事儿,毕竟大模型的幻觉完备不可控,哪怕是同一套描述词,每次输入后,返送的结果都会有所不同。
选手们很多是程序员出身,因此涌现了千奇百怪的「创作法」,除了写尴尬刁难象,还用上代码、excel 帮忙,都是为了尽可能掌握住 chatbot 的表现,稳定输出品质。
可以说,选手们是在通过模拟 AI 的写作办法,理解它的逻辑,从而达到强化掌握的效果——这多少有点倒反天罡了。
现阶段,有一个事实不得不面对:AI 写作能很好地完成事务型写作(邮件、文书、文案等等),但在故事写作上,有很大的局限。
一个西班牙团队不久前做过研究,请来了一位屡获殊荣的西语作家 Patricio Pron,直接和 GPT 打擂台比赛写标题,并找了专业的文学评论家来打分。
职业作家在创意、文学性、风格化方面,都得到了更高的分数。当两边的成品放在一起时,很明显能看出差异。
部分标题摘录
「GPT 写标题的形式基本是一样的,xx的xx,作家起标题在形式上来讲就完备不一样。」同样也是小说家的慕明,也和研究中的专家评审有相同的意见,她剖析道,「比如这个 Don't tell mom,可能是一个类似小鬼当家的故事。人类作家能从已有的比如电影、小说中得到启迪来取名,人类的读者也能get到这种启迪,这基于的是作者和读者之间,共同阅读和不雅观影履历。」
从 2016 年起,慕明开始考试测验写科幻小说。去年她出版了自己的小说集《宛转环》,入选了 2023 年单读书店文学奖,选篇《涂色天下》曾得到第 31 届中国科幻银河奖,去年改编为短片,收录至由 B 站出品的《嫡生存指南》系列剧集中。
在写字之前,她在谷歌微软写代码。慕明本科毕业于北大智能科学系,后来去了宾夕法尼亚大学研究机器学习,再后来顺理成章地做了工程师。
慕明
科幻阅读一贯是她的爱好,包括科普。她对技能的理解,也让她频年夜众更早打仗 GPT 所天生的「文学」。
她回顾起 2017 年,「还没有 GPT3.5 的时候,有一些更早的考试测验,比如微软小冰的诗集,还有陈楸帆的《人生算法》里放了一段由 AI 天生的文章。」
在那时,AI 写作还是一个小圈子里的新鲜玩意,是试验品——只管在当时,就已经有了令职业作家感叹的成果。
2023 年,慕明的事情开始涉足剧本创作。虽然已经写了好几年小说了,但她在剧本写作方面没有任何履历。她给自己找了一位「同事」,也便是 ChatGPT。
最开始慕明也担心过,ChatGPT 是不是真的能够胜任,在向影视行业的朋友咨询理解之后,她开始和这位「新同事」互助写剧本:由她供应核心创意,再通过 prompt 让 ChatGPT 修正,并且反复迭代。
短片《涂色天下》剧照
这个过程当中,事务型写作里让人避之不及的「幻觉」,反而成了让慕明更意外的东西:在她的小说《铸梦》里有一段场景,写的是一只人偶在宴会上起舞,送进Mid-journey中生图之后,反复扩图几次,模型给出了意外贴合故事设定的「理解」:宴会的舞台是在水下的,人偶和人隔着一个反光的水面,也像极了二者之间相互映照的关系。
那些经历被她称之为「顿悟时候」。
高层事情,还是人做的比较好
看上去,慕明跟这位「同事」互助的不错。进入 2024 年后,各家模型不断迭代,有了更长的高下文空间,有了更敏捷准确的反应。
但慕明与 AI 的互助却放慢了速率。
剧本和短片事情告一段掉队,慕明回归到科幻小说写作,把有限的韶光花在自己更器重的创作类型上。虽然剧本写作也要「讲故事」,长篇小说却须要截然不同的技能——而目前 AI 并不敷以胜任。
「最开始从事剧本或做图等事情时,我以为 AI 是我的导师或领路人。但现在回到写作方面,我能清楚地意识到它的局限性。」
现在在慕明眼中,大模型工具更像是一个「搭子」。有点履历,有点聪明,但都不多,「最大的浸染是能够督匆匆我每天一起事情。」
她认为大模型确实有抽象和提炼的能力,但是在文学性强的作品面前,「这个能力还是比较弱的。」
「让大模型来做阅读总结,可能会好些。比如说论文,本身的格式就非常明确,篇幅也不会特殊长,是很构造化的长文本,标出来了这块是结论、这块是实验方法、这块是数据剖析。」
但是小说不是那么构造明确的东西,她提到自己用过一个美国的赞助写作软件sudowrite,能够根据详细的需求天生段落,「比如 describe,便是在写到某一段的时候,作者须要一个描述,输入 prompt 进去就会得到一个天生的描述。」
Sudowrite 界面
这也是现在许多 AI 写作助手产品的思路:拆解写作中涉及的步骤,然后由作者提出需求,天生一个可以用来添补的段落。
只是这种做法能起到的效果也很有限,「我们可以举个极度的例子,比如一部 100 万字的长篇小说,光是把每个场景都拆分出来,这个事情量都已经很大了。假设这些场都由 AI 来天生,这个问题会变得很繁芜。」
先拆解、再添补的做法,一定程度上也是一种「拉表格」思路:每行是一个需求点,每列是一个办理方案,须要新的办理方案,就再开一列。
但是小说并不是这样写的。
「写小说最困难的还是整体的构造,这个构造包括情节,也包括人物性情的转变,」慕明说,「还包括了全体叙事办法的选择,视角等等。这些大框架或者说高层的事情,现在看来还是人做的比较好。」
是大模型演习的还不足吗?参数不足多?架构不足好?
「Transformer 架构本身是有问题,比如 attention token length 不足长,这是算法本身的局限。但模型利用的语料也会产生一些影响,只是由于它是大模型,利用了大量语料,很难评估某个特定语料对其表现的影响程度。」
AI 所不拥有的
归根到底,大模型在利用的,是一套截然不同的「写作思路」。
慕明从 2016 年开始写小说,第一阶段的学习是从喜好的作家入手,不雅观察剖析,把研究出来的写作技巧和原则,通过仿写利用到自己的创作中。
最初她很是受到刘宇昆和特德·姜的影响,「刘宇昆善于利用 confluence 的技巧,合流。而特德·姜更长于推演出抽象的观点,他会创作出一部思辨意味很浓的小说,跟传统小说不同,但是依然有很强的叙事动力。」
特德·姜
后来她的阅读范围越来越宽广:勒古恩、阿特伍德等作者的作品,体量足够大,足以完成天下不雅观的培植,同时又建立在一个足够有故事性的题材之上。
大量摄入之后,便是不断地写,然后参加比赛,得到反馈,思考,调度。「我会开始思考,我投的比赛或者碰着的读者,是否和我写作时想象的读者同等?或者我的读者是否从我这里得到了他们想要的东西?如果不一样,怎么填补这个差距?是须要去找不同类型的读者?还是要调度语调或者故事的形式?」
慕明学习写作的过程,有一个明确的阶段划分,不同的阶段有不同的目标任务——换个角度想,AI 也是一个善于按照操持、逐步实现的思维模式,不是吗?
「AI 在过程划分方面的能力是比人类更强,尤其是在给定了框架的情形下。但是我想强调一点:在学习方面,如果比拟我的履历来说,我的意图是明确的。」
慕明所指的,是 AI 并不拥有主不雅观能动的意图。这包括两方面:一个是作者的写作过程中的意图,也便是写作的发展路线,一个是详细作品中的意图,也便是详细作品的主旨。
「意图」这是美国哲学家丹尼尔·丹尼特提出的观点,德国生物学家维尔纳·西费尔在《叙事本能》里,用这个观点来阐明人脑是如何利用「意图」来理解自己的生活。另一个主要的观点是「前景化」:在海量的信息里,如何凸显和前置某一些特定的信息,实现把稳力的勾引,和信息的排布。
「我知道我喜好这个作家,以是我要去多读类似的东西;我想这个可能对我写某个东西很有帮助,那我就去再看看更多的例子。对付我来讲,每个阶段的意图都还比较清晰。这个跟大模型可能不太一样,意图是很人为、主不雅观的。」
现阶段基于大模型的写尴尬刁难象,包括泛用型 chatbot 所供应的写作赞助做事,都建立在用户作为主体,而 bot 只作为实行,它不能也无法拥有自己的意图,更难以实现有侧重的处理信息。
这天然限定了模型在故事创作方面的发挥:那些基于「幻觉」所偶尔冒出来的段落、灵感,并不敷以支撑完成一个有篇幅、有走向的故事。
这就导致,AI 写尴尬刁难象要么是在堆砌素材,无限流似地天生、叠加、拼接在一起;要么是在无序地编织一个故事。那些人类可以轻松感知到的、由情节和角色推动的故事进程,在 AI 这,成了偶尔得之的「幻觉」之笔。
这样组织信息的办法,显得过于随意了。「在当代小说中,所有材料都须要一种组织办法,」慕明说,「可能不是传统的线性组织。但是细节和素材,都须要去环绕故事的主题,或者内查究事。」
「文学里有一个著名的说法叫契科夫之枪:如果你在小说开头写了一把枪,那么它一定是有浸染的,后面一定要开出来。在文学中,这种处理信息的能力或者方向,扮演着非常主要的角色。」
契科夫之枪,原意为:如果在第一幕写了一把枪,在第三幕须要让这把枪开火
故事是生活的一部分
透过小说,慕明想象过一种她心中的人工智能:和面前基于大措辞模型不太一样的一种。
她更认同由神经学家达马西奥提出的心智模型:外部环境刺激情绪,感想熏染将感情反应带入意识,整合完成后,即时的自我意识天生了,长期的履历和影象会连续整合,从而形成连续的自我意识和身份。
达马西奥代表作《感想熏染与认知》
一种相对「老派」的路线,达马西奥的理论依然把感情和感想熏染作为基点——而这正好是文学创作的根基。
「对我来说,当我有了某种感想熏染——比如我以为一个东西很故意思——我就想写故事,把它更清楚地表述出来,让更多人知道。这是一个写作的动力。」
事实上,很多的文学创作常常也是出于一种明确而激烈的感情:无力、心碎、愤怒、悲哀,等等等等。
这些感情并非凭空冒出来,而是在人经历过事情之后,被引发出来。而反复经历,反复卷入一桩又一桩的事宜当中,便是命运。
余华曾经说过,AI 能够表达人类的想法,却无法表达命运的想法。
文学性的写作是一个如此有整体性、有机的过程,它建立在经历与体验之上,由感情和感想熏染引发,在纷杂的讯息中找出最得当的故事作为用具,再把统统和盘托出。
这项工程悄悄静地发生在作者们的脑海里,顶多只听得见敲击键盘的响动,可是其本身浩瀚又繁芜,遣词造句不过是个中的一个步骤而已。
慕明末了引用了一段诺贝尔文学奖得主奥尔加·托卡尔丘克的获奖词,她相信,每一个想要弄懂自己生活的人,都在「书写」自己的故事:
「哪怕当我们阅读那些最形式主义的、词句简洁的故事时,我们也不能不问:为什么会这样? 这是什么意思?这有什么意义?这会带来什么后果?我们的思维很有可能在不断地给予百万个环绕着我们的刺激的阐明时,以一种‘故事’的办法进化了,以至于我们在入睡时,也一贯在一直地连续我们的讲述。
以是,故事是一种在韶光中编织起无限量信息,打开它们向过去、现在、未来的通路,把握住它们的每一次再现,并将它们安顿在因果种别中的一种办法。理智和情绪都参与个中。故事最早的创造之一便是命运,这一点不足为奇。命运虽然让我们以为恐怖和不人性,但它将秩序和稳定带入现实。」