郑夺想要做一个集思维导图和笔记功能为一体的文字处理软件,并且要求它内嵌一个大语言模型人工智能助手。
如今智能手机还在概念研发阶段,笔记本电脑也远未普及,不管什么软件,肯定做不到随时随地记笔记。
但只是针对文字工作者,尤其是作家、作者群体,方便他们打开电脑就能记笔记,收集写作素材、记录突然想到的创意,还是很简单的。
其次,光记些零零散散的点肯定不够,还要帮他们很方便地把点连成线,把线织成网,把网丰满细节,最后变成完整、成熟的文章。
这个过程就是重现人类学习、思考,再产出作品的过程,是“婴儿”模仿的对象,能让亿万使用者都来给“婴儿”当老师。
除此之外,“婴儿”的学习也要有“考试”,根据“考试”结果和“老师”们的对错判断及满意度,来不断纠正、优化“婴儿”的学习方向。
这就要让这个软件能够根据用户提供的目标和素材,通过它自己的领会,完成任务、输出“小作文”。
就比如,用户输入:“描写一个男人的外貌,突出他很高很帅,但这个人表里不一,心里其实藏了很多阴谋诡计,要用一百个字以内,把这种外表美、内心丑的外在表现书写到位。”
或者输入:“根据我过去收集的‘文学史趣事’的所有笔记内容,生成一个议论文大纲,并帮我拟一个贴切的标题。”
就和后来大行其道的ChatGPT一样。
但这个目标不是马上就能实现的,“婴儿”目前的智能水平还远远做不到,不会一上来就输出让人满意的答案。
这就需要大量人工参与对它的训练。
所以,它也会给出一些有趣的小任务,让用户去挑战。
比如:文本分类、命名实体识别、情感分析、问答系统、机器翻译、摘要生成、文本生成、语义角色标注、关系抽取、对话系统。
有些是AI来做,人来判断对错,就如给笔记归类。
有些是AI问问题,人来回答。
就如同《完蛋了!我被大模型包围了!》那个游戏里的内容。
这样一个文字软件,集笔记、思维导图、WORD、ChatGPT核心功能于一体,在2022年之后,涌现出很多。
现在是2002年,郑夺现在就要。
开发出来之后,主要会面向专业的文字工作者,尤其是作家们,因为他认为,文学语言,始终比日常语言更具数学归纳性,更适合高度抽象化并延展使用,用来训练“婴儿”更高效。
而且文学创作者的创意并不像普通大众那样“天马行空”,他们是带着镣铐跳舞,更遵循叙事逻辑和语言范式,是规范化的胡思乱想,在现实和超现实之间的跳跃,既大胆,又有规律可循。
这才是更利于“婴儿”掌握虚构能力的优质的模仿对象。
当然,软件也不排斥普通人使用,日常语言的投喂也是有必要的,毕竟日常口语量大管饱,人多、话多,同样有优势。
对于AI的训练,素材量的多少同样也是一个决定性的指标。
所以,郑夺决定,将这个软件免费且开源,让更多开发者和使用者都参与进来,迅速扩充数据量。
不过,开源的只是文字软件,不是“婴儿”。就像大荣公司管理系统和杜义的分子模拟软件一样,只是个躯壳,没有灵魂。
“婴儿”哪怕暂时还是弱智水平,也是当前世界上最先进的人工智能。
它是集合了截止2023年之前,世界上最先进的一批人工智能和算法专家的智慧结晶,由郑夺整合起来,创造的产物。
那些智慧,都是他从上千人的过去和未来的数据包里读取来的。
但这还不够,还需要更多的智慧凝聚于其中。
一边要继续完善,一边也要疯狂训练。
经过两人反复的讨论,尹文杰把思路整理了一下,说:“所以,我们这个软件,至少有三个大板块。
“一个记笔记和写文稿,就类似TXT文本那样的,稍微再丰富一点就行,对排版的要求低,重点是打字、插注释、划重点,不用像WORD里面那么多功能。
“第二个是思维导图,树状图、网状图、流程图、时间线、洋葱图、主从表述、韦恩图、鱼骨图等等等等吧!
“第三个就像个QQ对话框,你问什么,软件就给回答。也可以软件出题,让你来回答,图文并茂。
“这个东西做成开源的,但只开表面的,真正的‘灵魂’,在我