本文转载自:北风雪林(ID:beifengxuelin)
9月7日,腾讯混元大模型正式亮相,标志着我国互联网科技大厂陆续加入“大模型国家队”。
工业革命级别的超级能源“核聚变”永远都差着五十年,工业革命级别的超级材料“室温超导”也遥不可及。
在肉眼可见的未来,“人工智能”将开启人类下一次科技革命成为世界各大国的普遍共识。
人工智能并不是一个新概念,可是过去几十年,人类都没找到“人工智能”像蒸汽机或者“电灯泡”那样赋能所有行业的途径。
一项技术,要达到“引发科技革命”的级别,必须具备赋能各行各业,提升各行各业效率的能力。
直到去年美国Open AI公司发布大语言模型GPT,各大科技公司才明确“人工智能赋能各行各业”的最佳路径。
因此,自主学习大模型,成为中美等大国竞逐下一次科技革命的核心赛道。
美国发布GPT3.5,以及在几个月后发布“更加智能”的GPT4.0,证明美国在大模型领域占有“先发优势”。
不过在美国发布GPT之后,这十个多月的“大模型世界大战”堪称【百模大战】。
虽然美国OPENAI打响了第一枪,但随后除了美国谷歌跟进,这十几个月发布“新模型”的,绝大多数都是中国科技公司。
最近半年,在短视频平台,我们也能看到多家科技公司的“大模型推广广告”,他们基本上都打着“国产GPT”,完美替代的名号。
过去半年多,除了百度,360等互联网大厂都宣布进入大模型赛道,最引人关注的是中国互联网科技的巨头,腾讯和阿里都官宣各自的“大模型战略”。
美国的GPT与中国华为的盘古大模型,腾讯的混元大模型虽然都是在今年集中亮相,但是全球顶尖科技大厂都在更早就开始了大模型的“雏形研究”,像腾讯就从2021年开始先后推出了多个千亿、万亿参数的大模型。
中美开启研发的时间差不多,美国今年的“先发优势”则是过去几年美国“高科技脱钩断链”“先进芯片全面禁售”导致的。
因为中美的大模型竞争,本质上是“底层逻辑,算法,算力”的全方面对决。
最近美国商务部长雷蒙多访华,我们能够更加清醒的看懂美国科技政策。
在我们已经突破或者“不算尖端但依旧有高额利润”的科技领域,美国不希望“脱钩断链”,希望继续“做生意”,甚至要求我国政府给予“更宽松的赚钱环境”。
相反,在我们还在艰难攻关,以及美国明确“未来科技竞争核心领域”,美国的科技封锁与芯片禁售只会“更加残酷与无死角”。
通用大语言模型已经被中美科技界确认为“人工智能赋能各行各业”的最佳路径,那么与大模型相关的“底层框架,逻辑算法,算力”未来一定是美国科技封锁的重中之重。
过去半年多,国内科技企业“百模齐发”,我们却并没有“科技革命”的感觉,主要是两方面原因导致的。
第一个原因,就是过去的大模型“自研率太低”。
过去半年多,个别公司为了“抢进度”,尽快占领市场争夺用户,推出的大模型可以算是“美国开源模型套皮”。
“美国套皮”的优势,就是沿着美国的技术路径,用“同款技术”,可以快速上马“国产”大模型。
可是“套皮”模式的最大风险,就是一旦美国开始“掐脖子”,不仅国内这些平台“瞬间躺尸”,而且前期的巨额投资,前期的用户与数据都成为自己的软肋,只能向美国政府与芯片制造企业妥协“求饶”。
在中美争夺下一场科技革命的核心赛道,最核心的竞争力当然需要掌握在自己手里。
因此从这个月开始,以腾讯混元大模型、华为盘古大模型等为代表的新一代应用,宁愿慢一些,稳一些,也要做到“全链路自研”。
过去大半年,无论中美,宣传学习大模型的时候,重点强调学习时间与效率,以及抓取学习的数据库范围。
可如果用的是美国底层技术框架,美国算力芯片,那么美国按下“封锁按钮”的一刻,这些“亮眼的技术参数”都是浮云。
让人有些惊喜的是,过去大家印象中注重效率与市场,主抓软件与应用的腾讯,这次在大模型战略里,首要强调的却是“全链路自研”。
混元大模型宁愿晚发布半年到一年,也要从底层框架,逻辑算法,网络服务器全部“自主研发,自主生产”,损失了“先声夺人”,但是做到了“自力更生”。
所谓“全链路”,就是从模型算法到机器学习框架,再到AI基础设施全部走“自主路线”。
自主的好处,除了避免美国“掐脖子”,另一个好处是“更懂中国人与中国话”。
过去半年多,无论是美国GPT,还是国内各个大模型应用,都逃不开被“陷阱问题”打脸的窘迫场景。
因此网上一直有现阶段大模型不是人工智能,而是“人工弱智”的调侃。
美国大模型的基础算法与学习框架早已确定,当然不可能为“中文环境量身定做”。
相反,以腾讯为代表的“国产大模型”,因为学习框架自主,就可以针对“中文上下文”,可以将错误率降低30%~50%,也可以针对中文“陷阱问题”与“长篇上下文理解”展开针对性学习演练,这次9月7号的混元大模型现场演练,以及过去两天的“试用”,最鲜明的感受就是“混元不好忽悠了”。
过去半年多,大家经常用各个大模型的“陷阱问答”来玩梗,以至于忽略了“大模型准确性”的重要性。
实际上,大模型的“准确性”,是能否赋能各行各业的“生命线”。
如今市面上的大模型,都只能应用在容错率高,任务简单的休闲领域。
这些休闲领域答错一两个历史问题,或者前言不搭后语,都可以一笑置之,但是在工业领域或者安全领域,那就“谢绝使用”了。
可以想象,一个零件尺寸理解错误,或者材料加工参数不对,有可能造成重大工程装备“性能不足”。
在安全领域,一个“理解错误”,可能是无数人遭遇生命危险。
准确率无法提高,就注定大模型只能用来“玩”,可见适合中国语境的“提高准确率”自主学习模型多么重要。
过去半年多,大模型引发科技界沸腾,但是老百姓却很淡漠的第二个原因,是“落地场景严重不足”。
过去十几个月,从全网因为GPT的更新迭代陷入狂欢,到如今的新模型发布上不了热搜,是因为大家越来越有一个共识:大模型很有趣,很先进,但没啥用!
过去半年多,包括百度在内的科技公司,发布的多款大模型产品,最大的短板,就是没有“应用落地”的端口。
直到这个月,腾讯大模型的发布,大家才直观地感到,原来大模型应用还有这么多落地场景。
过去几年,相信许多人和我一样,已经习惯将微信作为支付,出行,外卖,网购,休闲阅读,游戏的入口。
这样的生活习惯,就让腾讯拥有与生俱来的,连接各行各业消费场景的能力。
比如在前天的发布会上,腾讯展示了腾讯会议、腾讯文档、腾讯广告等多个业务,在接入混元大模型后的实际应用情况。
如果说这次发布会,混元的用途还“偏商务”,那么腾讯游戏、腾讯金融科技、微信搜一搜、QQ浏览器等腾讯旗下50多个业务和产品也已经宣布接入大模型测试。
特别是游戏,微信搜一搜,QQ浏览器都是数亿级别的“用户入口”。
有数亿用户的“端口习惯”,50多个不同应用场景,足够给成百上千的细分产业赋能。
我们能清晰的感觉到,中美大模型赛道的对决,从“百模大战”阶段,进入“三大战役”决战阶段。
在这场决战里,相比较这款大模型的发布,腾讯展现的转型意义更加重大。
腾讯作为科技巨头,过去展现更多的是软件研发能力,与应用快速占据市场的敏锐商业嗅觉。
可是这次腾讯发布的混元大模型,无论是“全链路自研”还是“全场景打通”,展现的都是重资产研发以及追求市场的“长期主义”。
混元大模型的发布,标志着腾讯离开游戏与社交软件的舒适区,用“全链路自研”模式,将自己从轻科技公司,转型成重科技公司。
一个混元大模型,并不能确保我们赢得这场科技对决,但这背后体现的“转型”与“万业互联”,才是中国未来致胜的核心竞争力!
1、本文只代表作者个人观点,不代表星火智库立场,仅供大家学习参考; 2、如若转载,请注明出处:https://www.xinghuozhiku.com/370535.html