周瑞表示,要不是他实力雄厚,深不可测,当天晚上就得露馅.
他是有那金刚钻,才敢揽这瓷器活,但似乎现在问题不在钻好不好,而是更潜移默化的事情上。
深夜,李文倩和韩子茵都睡下了,周瑞躺在大床上,却睁着眼睛。
脑子里纷繁涌动。
他没有用强大的分析能力,而是纯粹依靠感情在思考。
终极目标没有变,但最好还是先稳一手.
说白了,是他还没有想到妥善的办法。
沉思之间,他想起了自己的【时间管理大师】词条,目前进度已经来到了,不知道入手后会不会有帮助?
不.
周瑞下意识摇了摇头。
贪心要有贪心的胆量,也要有贪心的担当
他不想用【词条】的力量,来处理自己的感情,尤其不想用外挂力量,去影响那些真心对自己的姑娘。
哪怕用常规方法会很难.也应该如此。
――――――
一夜无话,第二天一早,周瑞和韩子茵、李文倩一起下楼。
李文倩率先上了保姆车,她去华文传媒录歌,而韩子茵则和周瑞一起步行。
一个去复大内的研究所,一个去智能大厦。
这么短的路程,就没有太多安保人员候着,自然也没见到“新人”米娅,之前几天跟着周瑞不着家,一个姑娘家多少有些疲惫,林托就放她休息了一天。
十字路口,韩子茵挥挥手,朝着马路对面走去,周瑞目送她走进校园,才转身离开。
到了智能大厦,周瑞却没有去自己办公室,而是去了B栋的开明智能。
这里是开明智能的第二栋办公楼,也早已经满员,大部分都是后加入的普通员工,所以周瑞很少过来。
他现在除了太一天工,集团下属各企业,大多都是通过甘媛和秘书处管理。
不过这次来是有特殊目的。
一路不少人驻足和大老板打招呼,大部分普通员工并没有机会见到他,不乏一脸紧张的。
周瑞微笑着和每个路过的员工颔首,电梯里这样的静止空间,还会主动打趣两句。
“今年年终抽奖,有不少比亚蒂汉做奖品,看你们手气了。”
叫不出名字的男员工兴奋道:“谢谢老板,我到时候试一试,刚好想换车了。”
周瑞点点头,在七楼走出了电梯。
其实他什么都不做也可以,就这么沉默着坐一趟电梯,但一趟沉默寡言板着脸的电梯,就可能人让打工人心惊胆战一天,没有必要。
B栋7楼,周瑞左拐右拐,在一个角落的工位,找到了此行的目标。
人类数学天赋之巅,安德烈费迪南德菲利普康托尔。
不过这家伙目前路子比较歪,没研究数学,而是在研究数学模型应用于编程。
还是那句话,他们都还年轻,包括哈尔西,根据自己的兴趣走几年歪路没关系,别走错路就行。
安德烈正在噼里啪啦打着键盘,身边还围着两个人,三人一起凑在屏幕前。
周瑞个子高,没打扰他们,而是越过三人肩膀朝里看去。
界面并不是编程页面,而是一个对话框。
输入内容:“如何把大象放进冰箱里。”
回答内容:“一般情况下,大象无法放入冰箱,但我有一个与此有关的冷笑话,你愿意听么?”
输入内容:“给我一个沪上一日游的行程推荐,要求尽可能省钱。”
回答内容:“建议不去,最省钱。”
周瑞看了一会儿,觉得有趣,拍了拍安德烈的肩膀。
安德烈转头看到周瑞,兴奋的说道:“老板!这就是我们完成的‘自然语言大模型1.0’。”
他大胡子兴奋的抖动着,开心的像是个七十岁的孩子。
关于络腮胡,周瑞私下里问过,毕竟沪上不像西伯利亚那么寒冷干燥,大胡子实在不方便,不过安德烈的说法是,为了遮掩脖子上的两道伤疤。
那是棕熊留下的。
周瑞笑着点点头:“我正为此而来,已经看了一会儿了,非常有趣,给我介绍一下情况。”
安德烈人品还是比较朴实的,没有独自揽功,而是先介绍了一下“团队”,其实就四个人,其中一个还是网友。
这里的三个人是最主要的工作者,那个网友主要是提供一些建议。
眼前的两个分别叫宋进和苏向北。
两人见到周瑞有些紧张,赶紧解释道:“安德烈完成了大模型90%的工作,我们只是在编程上帮他实现功能,做一些苦力.”
这个大模型的重点,不是编程的复杂程度,而是基于统计学的模型设计,之后就是不断训练,让模型“学习进步”。
所以如果说“功劳权重”,确实是安德烈首功。
他们俩人本就是因为一时兴起,才帮助安德烈在搞这个东西。
但实际上手后,安德烈的恐怖天赋展露无遗,他们感觉完全是被安德烈的一根腿毛带着飞起来的。
安德烈拍了拍两人的肩膀:“没有你们,我肯定完成不了这么多工作,别自谦伙计。”
安德烈和他们说话,用的居然是俄语,之后周瑞问了才知道,另外两个都是俄国留学过回来的。
至于兴趣相投,指的是这两个是公司唯一能接受伏特加的人被安德烈视做异国他乡的手足亲朋.
另外还有一位网友,也提供了一些建议,安德烈说是太一天工的,名字叫什么街还是什么爹,周瑞估摸着还是这家伙中文水平搞错了,也就没细问。
周瑞:“用英语说吧,这个自然语言大模型,现在到什么程度了?”
安德烈说:“目前是第二版,最早的Beta版,我们用了开明智能的已有的交互数据库进行了数万次预训练,1.0版则是从互联网选定了一些内容进行训练,也进行了几万次。”
能够这么快速出现“1.0”,也和开明智能多年积累的交互数据库有关。
上一代产品起,开明智能的无人机已经采用了“中心化处理”的方式,为普通无人机提供交互能力,不过路线上更接近于用固定模式处理特定需求,类似于Siri。
只不过处理中心本身,是强大的“机械智能网络”,才显得在硬件控制上很有灵性。
安德烈:“自然语言大模型的核心,一个是基于统计学的数学模型,另一个则是基于自然语言的训练内容,抛出问题,给出回答,提问者反馈,继续优化”
“如果数据量和训练次数足够庞大,在交互上可以做到与真人无异。”
“因为开明智能的交互库以中文为主,所以它目前也是这样,对了,我们还对文本反馈做了优化,可以生成表格、统计图等。”
周瑞微微点头,思路上和前世基本一致,无非就是训练规模还没彻底跑起来.
不知道大模型的水平是更高还是更低
应该高一些,安德烈的天赋是系统认证的,他理应能够做出一些对于整个人类文明来说都算“惊艳”的事情,即便现在不如,持续优化后也应该能超出。
“它能承担有创造性的工作么?”
安德烈思索片刻后说道:“所有信息都是基于人类社会提供,所有结果都是基于数学模型优化,我不觉得这属于创造性。”
“我举个例子,比如我提问午饭应该吃什么,给个建议,它会可以给我许多内容,如果我要求这个建议长达1000字,它甚至能写一篇文章出来推荐我吃哪些东西,但这并不是创造性。”
一旁的宋进补充道:
“类似的还有比如炒股,如果允许它抓取股市历史信息进行采样,那么它会给出许多关于购买哪支股票的建议,甚至生成表格,嵌入工具可能还能帮助买卖,也许真的能帮到炒股者,但这本质上还是信息检索和统计,然后用‘如同人一般’的口吻表达,听起来像是给了一个创造性的建议,但其实也不是。”
“它抓取范围可以比大部分人的知识边际大许多倍,所以显得很神奇,但在专业领域和前沿领域,它更像一个一眼会被看穿的门外汉.因为这些部分可以抓取的训练内容太少了,越前沿、越专业,它越傻,越大众,越机械,它越聪明。”
周瑞点点头。
见识越少,越觉得大模型神奇,见识足够少.它能颠覆世界!
每个版本都能!
不过,这并不意味“自然语言大模型”没有价值,无论实用价值还是商业价值,都有很大的潜力。
周瑞凑上前去:“我来试试。”
想了想,输入了一个问题:“‘午餐肉’晚上吃叫什么?”
画面上出现了三个点.
安德烈三人额头上也出现了三滴汗.
半晌后,屏幕上回答:“晚上午餐肉,晚上午餐肉是午餐肉的一种.”
然后巴拉巴拉几十个字。
在周瑞看来,显然是超纲了,在用废话掩饰。
然后继续输入到:“学法律的为什么不叫法师而叫律师?”
回答:“法师是一种特殊职业,拥有较高的输出和薄弱的生存力”
然后巴拉巴拉又是一大堆。
周瑞:“一个半小时,是几个半小时?”
回答:“一个半小时是一个半小时”
周瑞转头看向三人:“嗯看来需要训练的东西还有很多”
安德烈不知道从哪里开始吐槽.就刚才三个问题,他这个中文渣人类都答不出来,何况一个1.0版本的大模型。
不过还是说道:“确实,它现在还太弱了,不过想要增强它需要海量的抓取库和算力,算力又包括硬件和电力.这种投入是极大的,光靠我们三人不现实。”
“想达到理论上限,保守估计,可能需要专门成立分公司,并且投入数以亿计的资金来构建算力底座,再开放外界的使用权来让普通用户参与到训练中.烧掉许多电力”
周瑞不置可否的点点头,就还是前世的老路,堆算力无非就是安德烈的这个模型可能性价比更高罢了。
有价值,但没意思,比起机械智能差远了。
周瑞正在思索之际,却听见安德烈道:
“不过我们的第四成员,提供了一个天才般的想法,他建议将大模型做成分布式运算,植入机械智能中,我们在全球有数千万各类智能设备!这些都可以视为训练者!”
“让机械智能!来训练人工智能!效率可比人类用户一个一个提问要迅速多了!直接将节省80%的成本。”
“机械智能控制硬件,人工智能进行交互,那么体现出来的效果,恐怕真的会如同科幻作品里的‘仿生人’一样.”
【在阅读模式下不能自动加载下一页,请<退出阅读模式>后点击下一页阅读。】