成都索客科技有限公司 >> 焦点>>

上海市数据科学重点实验室主任肖仰华:大模型不能只会开放闲聊

上海市数据科学重点实验室主任肖仰华:大模型不能只会开放闲聊 本章共8字, 更新于: 2024-12-16 03:06:15
【家电资讯-家电新闻 - 行业新闻,上海市数作者:编辑】

  自ChatGPT上线来,据科国际国内各大厂商纷纷跟进,学重肖仰闲聊投入了巨大研发资源来研发类似大模型。点实人工智能的验室发展,尤其到了通用人工智能阶段,主任可谓热点纷呈。模型

  作为人工智能产业发展过程中的开放里程碑事件,ChatGPT代表通用人工智能技术的上海市数成熟,宣告人类社会技术进步有可能进入快速增长期,据科甚至一个指数发展期。学重肖仰闲聊在类ChatGPT大模型领域,点实中国尚处于起步阶段,验室需做进一步战略规划并统筹发展。主任就相关问题,模型《瞭望东方周刊》近日专访了上海市数据科学重点实验室主任、复旦大学教授肖仰华,探讨我国大模型产业的发展路径。

  知识底座

  《瞭望东方周刊》:通用大模型一定程度上刷新了我们对人工智能领域的认知,如何理解它带来的变革?或者说大模型有哪些能力?

  肖仰华:大模型是人类文明所积累的海量知识容器,其所具备的通识能力,就是开放世界的理解能力。现在跟ChatGPT聊天,聊任何行业、学科的问题,它都能给出一个看起来不错的答案,虽然其仍可能犯一些事实错误、一些逻辑错误,但基本不会太偏离问题主旨——比如问出生日期却答出生地点。它还具备一定的“自知之明”能力,对于超出范围或者伦理敏感的问题,会拒绝回答。大模型这种对人类开放世界的理解力,已达到甚至超越普通人的水平。传统人工智能产品的“智障”问题已基本解决,这种开放世界的理解能力,对垂直领域(垂域)的认知非常关键,因为垂域应用是建立在通用大模型的通用认知能力基础之上的。

  大模型有组合创新能力。我们在指令学习阶段让它学了A任务、B任务,它以后有可能泛化出求解A+B任务的能力。这种组合泛化,以前做不到,今天能做到,通用大模型让“举一反三”成为可能。

  大模型有忠实的指令理解和执行能力,尤其是超大模型。只要给它指令、要求、约束、规范、规则,它就一定能够按照要求一步步完成任务。这本质上是一种情境化生成能力。我甚至认为,大模型智能本质就是情境化生成能力,因为大模型在提示越来越丰富时,生成的效果越来越好。

  大模型有复杂任务的分解能力和规划能力。现实中很多场景都是复杂任务,需要一步一步求解,先做什么,再做什么,按照顺序进行合理编排,这就是规划能力。

  大模型还有强大的符号推理能力。以前人们只是把大模型当做知识容器来看待,只期望其提供需要的知识。但今天不得不承认大模型也一定程度上具备类似知识库(知识图谱)所具备的推理能力,比如常识推理、数值推理等能力,当然这方面能力还需要进一步提升。

  《瞭望东方周刊》:为什么说单有通用大模型不足以解决行业领域很多问题,需要发展垂域大模型?

  肖仰华:因为具有上述能力,通用大模型好比是一个宽广的知识底座,但仍然缺乏专业知识的深度,缺乏专业领域复杂应用的长程推理能力。ChatGPT这类大模型本质上只是实现了在开放环境下的人机对话,或者叫开放闲聊,但开放闲聊并不能帮我们解决实实在在的工作场景中的复杂决策任务,比如要做设备故障排查、疾病诊断,都是严肃复杂的决策场景。在这些场景中需要丰富的专业知识、复杂的决策逻辑、宏观态势的研判能力、综合任务的拆解与规划能力、复杂约束的取舍能力、未见事物的预见能力、不确定场景的推理推断能力等。

  大模型的开放闲聊过程中可能存在两个问题:一是“幻觉”问题。与ChatGPT聊天,有时它说得头头是道,但仔细分析,会发现它正在胡编乱造一些不存在的事实。同时因为其语言风格一本正经,让普通人很容易相信它,即便是领域专家要从它有板有眼的文本中识别虚构和错误也是一件不易的事。

  二是缺乏领域“忠实度”的问题。解决任何专业领域的问题都要求大模型不要自己根据通识去自由发挥,而要严格遵循这个领域的规范、用符合这个领域的知识体系来回答问题。但是我们去尝试了一些通用大模型,发现如果不做一些调教优化,它总是会超出你给定的领域文档自由发挥,进而犯错。

  所以,一个基本的判断是:单单利用现在的通用大模型不足以解决行业很多问题。实际应用需要的是事实正确、忠实于领域知识与文本的垂域大模型。从这个判断出发,当下我们要发展面向垂域的大模型,要发展通用大模型的外围插件,要采取大模型和知识图谱、传统知识库相结合的策略。

  赶上差距

  《瞭望东方周刊》:面对ChatGPT所引发的通用人工智能产业变革,国内企业应该如何抓住大模型产业机会?

  肖仰华:大模型绝不是宣传文案的噱头。我们正在见证由通用人工智能所带来的前所未有的技术革命。通用人工智能是人类历史上第一次关于智能本身的革命。历次技术突破都是人类智能的产物,而唯独通用人工智能是“智能”本身的革命。

  大模型的诞生宣告了整个人工智能进入全新的重工业时代。回顾人类历史上的历次技术革命,多始于相对低级的手工作坊模式,经过漫长的发展周期,最终形成了成熟的重工业发展模式。重工业化的人工智能有三个鲜明的特征:大模型、大算力和大数据。

  5月23日,工作人员在贵州大学省部共建公共大数据国家重点实验室算力中心(刘续/摄)

  国外大模型产业已经形成了一个生态,而且发展非常迅速。反观国内,从表象上看热闹非凡、模型林立,但是剥开外壳从内里看,仍然有不少问题,不免让人担忧。

  一方面,几乎所有国内人工智能产业的重要企业与研发机构纷纷推出了自己的类ChatGPT大模型。这说明,大家都意识到大模型的战略意义,积极主动投入资源,这值得肯定。

  另一方面,国内大模型产业发展已经出现一些问题:一是技术路线同质化严重,很多大模型都是用ChatGPT喂养自己的大模型,或是在国外开源通用大模型基础上进行指令微调;二是数据生态不完善,中文数据生态尤其重要,但现在较为欠缺;三是算力掣肘;四是模型创新有限,现在很多国内大模型都基于国外的开源社区模型。

  总之,ChatGPT所引发的通用人工智能产业变革才刚刚开始,中国相关部门和企业要以深入的思考和扎实的实践抓住机遇,同时高度重视发展过程中出现的问题。

  《瞭望东方周刊》:具体来说,中国发展大模型产业目前面临哪些短板?

  肖仰华:大模型产业的发展取决于多个因素:其一是模型,模型好比内功,模型越大,潜力越强。其二是算力,这是大模型的核心竞争力,大模型竞争归根结底是算力的竞争。其三是数据,只有高质量的数据,才能喂养出高水平的大模型。不过,这几个问题都不是中国大模型产业的真正短板所在。

  与国际同行相比,当前我国大模型产业发展在数据上有优势,在算力方面有基础,模型本身也不存在什么技术秘密,真正的短板在于我们对大模型“炼制”工艺的掌握,包括数据配方、数据清洗和参数设置等等,这些从根本上决定了大模型的效果,是大模型产业发展的重要因素。这方面短期之内难以跟上或者超越,需要我们付出巨大代价进行摸索。

  实际上,上述的每一个具体模块,国内都知道怎么做,但是将它们整合在一起,总体效果和国外是存在差距的,不是0分和100分的差距,而是70分与100分的差距。我们要赶上最后这几十分,要不断试错、评测和改进。

  从大模型问题引申来看,应用和集成创新,一直是我们的强项。但是跟美国相比,我们缺少原始创新,原始创新甚至到了极度稀缺的程度。原始创新是怎么来的?可能来自科学家的奇思妙想,可能来自偏执甚至疯狂的想法。比如Open AI的CEO山姆·奥特曼(Sam Altman),他在2015年成立Open AI,2018年投入巨资研发大模型。而在2018年这个时间点,全世界没有多少科学家认为通用大模型这条路可以走通。

  将来我们要实现引领,就一定要不断优化科研文化和科研生态,鼓励思辨、鼓励质疑,激发原始创新。

  7月8日,2023世界人工智能大会在上海世博展览馆举行。蜜度信息,“文稿通”基于大模型的诗歌生成

  战略定力

  《瞭望东方周刊》:在大模型热潮之下,中国自己的大模型发展道路究竟该怎么走?

  肖仰华:国家有关部门要引导业界统一规划、合作协同、有序发展、健康发展。对此,我建议,可以从八个方面的应对措施推动我国大模型产业的发展:一是积极推动数据联盟(数据交易)的建设,促进优质数据的共享与传播;二是大力推动算力联盟建设,促进优质算力共享与协作;三是推动模型开源社区建设,完善国产大模型的开源生态;四是创新培养方式,培育大模型产业人才;五是建立大模型的诊断与应用评测体系,保障大模型产业健康发展;六是研究绿色可持续的大模型技术,降低大模型落地成本;七是积极探索大模型的应用模式,丰富大模型的应用场景;八是持续研究大模型训练与应用关键技术,完善大模型技术体系。

  尤其要注意,在这波大模型的发展热潮之下,不能为了追随ChatGPT,忽略了其他热点,错失了下一个机遇。我们一定要有战略定力,对不断出现的热点要有战略重视,但不能打乱既有部署。比如,很多传统小模型,该研究还得继续研究,数字化与智能化进程中的其他技术也得往前推进。

  在方向上,或者说,只有底座大模型与垂域应用相结合,才能最终创造价值。比如,医疗领域希望做能代替或部分解放医生的问诊机器人,投资领域希望有投资顾问机器人,司法领域希望有法律咨询机器人,这都属于垂域场景。在提升通用大模型能力的同时,也期待相关企业能在大模型垂域应用上有所作为,把大模型的通识能力更好地与垂域的专业知识、专家经验、行业解决问题的思维方式相结合,去解决现实中的复杂问题。我们既要重视通用大模型,更要重视垂域应用,重模型轻应用或者重应用轻模型,都是不可取的。

  中国市场巨大、数据丰富、应用场景丰富,完全可以用完善的应用生态来带动底座大模型的进步,走一条“农村包围城市”的路线。也就说,先把我们擅长的外围应用和技术生态做好,不断去补齐通用大模型在数据、算力、模型和工艺等方面的短板,并在这一过程中摸索有中国特色的大模型发展道路,形成独特优势,另辟大模型竞争赛道,进而形成核心竞争力,形成百花齐放、百家争鸣的繁荣生态。

  总之,国产大模型绝不能停留在类ChatGPT的开放闲聊,要尽快提升其解决千行百业实际问题的能力,切实把大模型发展成为推动我国各行业数字化转型与高质量发展的先进生产力。

分享



免责声明:家电资讯网站对《上海市数据科学重点实验室主任肖仰华:大模型不能只会开放闲聊》一文中所陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。

本网站有部分内容均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,本网站无法鉴别所上传图片或文字的知识版权,本站所转载图片、文字不涉及任何商业性质,如果侵犯,请及时通知我们,本网站将在第一时间及时删除,不承担任何侵权责任。联系QQ:411954607

本网认为,一切网民在进入家电资讯网站主页及各层页面时已经仔细看过本条款并完全同意。敬请谅解。




本书首发来自成都索客科技有限公司,第一时间看正版内容!

更多

编辑推荐榜

1孙广彬:2024中国光伏产值预计1.25万亿
2简约的现代时尚服装(现代简约风格服装店)
3时尚服装国风插画图(时尚服装绘画)
4《鬼泣5》能够出有DLC 但丁更开适下足玩耍
5文明交通 携手共创
6简约的现代时尚服装(现代简约风格服装店)
7开辟者:次世代PS战Xbox起码要等2020年 但愿拆载SSD
8时尚夏季服装搭配图片(时尚女装夏季上衣图片)
9千丝万缕话墩绣丨山东特殊教育职业学院与山东新奥然智联教育科技发展有限公司共建“墩绣工艺”校企合作项目
10三大年夜运营商第一批5G支散覆盖皆会降定 共19座
资讯快递
人气热销 言情热销

延迟退休已来,慧择快享福2号为客户规划养老提供保险新选择 导读: 延迟退休的方案已经出炉,之前议论纷纷的延迟退休已是板上钉钉的事情。其实对于我们来说,除了社保养老,商业养老险也是不错的选择,慧择快

马斯克接管专访自曝艰巨处境 特斯推股价暴跌9% 据Venturebeat报导,特斯推电动汽车公司尾席履止民伊隆·马斯克(Elon Musk)但愿您晓得,畴昔一年对他去讲是其职业逝世涯最易堪熬的一年,那也是他正在公家场开举止古怪的启事之一。事真的确如

全国最时尚服装(国内时尚服饰品牌) 全国最时尚服装国内时尚服饰品牌)来源:时尚服装网阅读:517中国十大名牌西装男士西装品牌十大排名如下:ZARA 品牌介绍:Inditex,SA旗下服饰品牌,成立于1975年。ZARA自创立以来致力于提

Insomniac表示《蜘蛛侠》PS4游戏预购表示没有错 漫威《蜘蛛侠》PS4游戏间隔收止日愈去愈远了,闭于该游戏的狂热氛围正在粉丝中也愈去愈稀稀,该游戏极有能够成为索僧最大年夜范围做品之一。现在该游戏的预购表示也相称没有错,Insomniac对玩家对那款游

变化中的信心,第十一届西岸艺术与设计博览会即将开幕 收藏资讯 作为第六届上海国际艺术品交易周“全球艺场•艺术上海”的重点项目之一,第十一届西岸艺术与设计博览会将于11月8日-10日在西岸艺术中心A、B馆)、西岸穹顶艺术中心、GATE M西岸梦中心、西岸漩心举办。

服装时尚插画时尚图片素材(时尚服装插画手绘图片) 服装时尚插画时尚图片素材时尚服装插画手绘图片)来源:时尚服装网阅读:473时尚相册插画-插画有哪些常见的画面风格1、比较常见的是采用夸张的手法造型,这一点在欧美风格中非常常见。2、常见的国潮风插画画面

加载更多

潜力大作 女生必读

1 三明:“中国绿都”深挖康养福利 作者:
21字
东南网9月12日报道(福建日报记者 马丹凤 通讯员 吴火招)近年来,三明依托资源禀赋,护好森林唱山歌,聚焦特色产业链“延链补链强链”,以发展全域森林康养产业为抓手,打造&ldq

1 国产大众时尚服装品牌(大众化的服装品牌) 作者:
213字
国产大众时尚服装品牌大众化的服装品牌)来源:时尚服装网阅读:660美特斯邦威旗下品牌AMPM AMPM是中国服饰巨头—美特斯邦威服饰股份有限公司旗下品牌之一,也是美特斯邦威在电子商务时代为更加贴合消费

1 ofo被曝退出海中市场:欧洲天区单车粉碎环境宽峻 作者:
8字
据媒体报导,共享单车企业ofo被曝退出多个海中市场,而正在欧洲天区投放的共享单车粉碎环境宽峻。日前,有动静称ofo正正在动足闭停澳大年夜利亚战好国、德国部分皆会的停业,本天的车辆正正在以3好圆一辆的低

1 最大年夜劣惠90%!Spike Chunsoft名做Steam版15做劣惠开启 作者:
2341字
Spike Chunsoft社来日诰日颁布收表,旗下登岸Steam的15部典范名做开启最大年夜劣惠90%的促销活动,此中闻名的《弹丸论破》等名做均正在其列。·8月17日~8月21日期间,Spike C

1 “16岁前不注册社交账号”这所中学发起倡议 作者:
6874字
这几天,杭州二中白马湖学校向全体师生,发出了一封《关于合理使用社交媒体倡议书》,建议同学们在16周岁之前,尽量远离社交媒体,不注册社交账号。这条倡议,很快就引起了大量讨论。关于未成年人使用社交媒体账号

1 电影《闪电侠》启动!去岁2月5日开机 作者:
9字
DC《闪电侠》独立电影爆出切当开机动静,据Discussing Film的报导DC挨算于去岁2月5日正在亚特兰大年夜开拍。电影版《闪电侠》的开辟之路一波多开,几经导演更替与足本重写,终究锁定《游戏之夜

1 时尚女孩的必备服装(时尚女孩的必备服装是什么) 作者:
1字
时尚女孩的必备服装时尚女孩的必备服装是什么)来源:时尚服装网阅读:627微胖女孩的时尚条纹穿搭分享、基础款纯色T好穿是没错,但出彩很难。微胖界藏肉的汹涌地带基本集中在手臂和腹部,除了遮盖,还能用上视觉

1 《樱桃小丸子》做者果乳腺癌往世 享年53岁 作者:
3字
日本闻名漫绘家《樱桃小丸子》本做者樱桃子,于本天时候2018年8月15日早晨8时29分,果乳腺癌与世少辞,享年53歳,丧礼已停止结束。台媒称,樱桃子教员于1984年以漫绘家的身份出讲,创做之《樱桃小丸

1 足球反腐案情一览:李铁为当国足主帅行贿 作者:
92字
足球反腐案情一览:李铁为当国足主帅行贿字体大小:A A2024-01-10 09:41:41编辑:竹青点击: 次北京时间1月9日消息,央视推出反腐大片《持续发力 纵深推进》,片中披露了足球领域腐败案细

1 《波斯王子》齐系列Steam促销 史低价没有容错过 作者:
34字
育碧民专来日诰日为大年夜家分享了《波斯王子》劣惠疑息,《波斯王子》Steam齐系列迎去3.3开,遁仄史低价,除《波斯王子5:遗记之沙》数字豪华版卖价为23元中,其他游戏卖价均为14元,别的那些游戏皆没