你在电脑上无意敲了一个中文字符:「我」。紧随其后的光标有节奏跳动着。
你呆呆看着「我_」这组符号毫无头绪或者思维天马行空。比如「我」是谁?「我」像一个好人。或者「我」想你了。
答案万千。话语就是你内心深处想要的表达。初代类人思维模式就这样应运而生:解决「我_」中的下一个字符问题。
我_ (初始状态)
我于城主有上了在权在上扔人主产是中_ (无规划生成下一个字符)
我们通过数学计算生成下一个字符简单,如何选择下一个字符让语句通顺又符合人类思维逻辑并非易事。技术人员将全人类所有开源文字作品收集到「巨型语料库」,用以计算下一个字符如何选择更符合语言逻辑与义贯,即总结归纳广泛语义逻辑的「概率」。我们解决好这个「概率」问题,机器生成的语言便愈加流畅与类人。
科技快速发展,初代人工智能亦有大跨步。解决下一个字符的单一计算能力逐步升级到多台计算机分布式综合巨量计算(视频、音频、文字,万物皆可)。机械生成线性思维开始转化为结构性问题解决。起初这类人工智能看上去并不聪明。技术人员通过大模型训练与修改标签让其变得趋近完美。
ChatGPT一经面世就引发全球热议。生成式人工智能在文本写作、知识问答、艺术创作、文案策划、代码编辑、语义抽取等方面的高能表现让人喜忧参半。
喜是科学技术为人类世界带来了新的革新。相较决策性人工智能(机器客服、自动驾驶类似)的单一规则判断,生成式人工智能更具创造力。其本体编辑能力与外接数据源插件工具对于人类工作效率提升大有裨益。
忧是科学技术对人类世界带来了新的冲击。生成式人工智能运用的「巨型语料库」对于版权与隐私的侵犯;生成式人工智能对于行业的影响充满未知数;我们的工作会不会被人工智能替代?人类是否会被人工智能所控制?
深入认识生成式人工智能的概念和原理,我们才会不惑。生成式人工智能目前仍然需要依靠人类生产的「巨型语料库」,其本质还是巨量计算。分布式计算节点只有递进而无记忆(虽然有人将机器训练回溯称为记忆),它擅长通过信息数据计算形成广泛的思维通则,缺乏现实场景多模态(视觉、听觉、触觉、感觉等)转换,更不言人类顶级的哲学与信仰。
字符「我_ 」没有被上帝点亮。
再者,生成式人工智能还面临现实安全规管(两种路线争论)。有效加速主义者认为科学技术进步将解决人类目前面临的大多数问题;超级对齐主义者认为强大的人工智能系统行为应该与人类价值观和利益保持一致。
作为用户呢?我们是否应该人机有效结合,学会对生成式人工智能使用最小化明显与直接的发问,提升生成文本准确率与质效,同时亦不乏判断精神。毕竟人类容易对80%的泛化趋对回答过高评价,正确答案往往只在人们心里。
人工智能提供了更多工具与干货,我们还需要更多生命颗粒感。
至于未来?让我们一起做有「AI」的人吧。(文/王宜楷)
发表回复