鋼鐵行業需要什麼樣的大模型?
2026-04-16 08:41:32
中國冶金報 中國鋼鐵新聞網
記者 樊三彩 報道
繼ChatGPT大模型後,國內智譜AI的ChatGLM、百度的文心一言、科大訊飛的星火等國產大模型如雨後春筍般湧現,被稱為“百模大戰”。在zai它ta背bei後hou,不bu僅jin是shi各ge家jia技ji術shu實shi力li的de比bi拚pin,也ye是shi應ying用yong場chang景jing落luo地di能neng力li的de較jiao量liang。令ling市shi場chang狂kuang熱re的de大da模mo型xing究jiu竟jing有you何he魔mo力li?當dang鋼gang鐵tie行xing業ye遇yu見jian大da模mo型xing,又you會hui碰peng撞zhuang出chu怎zen樣yang的de火huo花hua?近jin日ri,《中國冶金報》記者專訪了智譜AI CEO張鵬,圍繞當前的“大模型熱”進行了對話。
智譜AI於2019年由清華大學計算機係技術成果轉化而成立,於次年便開始了GLM預訓練架構的研發,是國內最早從事大模型相關研究的機構之一。“麵對‘大模型熱’,如果用一個詞來形容我的想法,那就是篤信。”張鵬指出,“信”當然就是相信這件事情,大模型一定是通往AGI(通用人工智能)的必經之路,能創造更大的價值;“篤”是一種踏實、審慎的態度,相信是基於對這件事情的理解和鑽研,而不是狂熱、沒有根基的。
從紙上談兵到實踐躬行,大模型為什麼這麼“熱”?
大模型的起源可以追溯到2017年,Transformer算法架構的誕生,開啟了大模型演化的曆史進程。雖然在接下來的幾年內,BERT、GPT-1、GPT-2也先後出現,甚至BERT在十多個自然語言理解任務上大大超過傳統算法的精度,但依舊沒有在業界引起太多的火花,直至2020年的到來。“這一年是大模型元年。”張鵬表示。
GPT-3的問世大大提高了模型的內容生成和邏輯推理能力,它在上下文學習和知識(常識)理解等方麵展現出驚人能力。隨後在全球範圍內掀起了一股基礎模型研究的熱潮,國外如 Meta、微軟、穀歌等,國內如清華大學、北京智源人工智能研究院、百度、華為、阿裏巴巴、智譜AI等,都競相追趕,提出包括Gopher、Chinchilla、PaLM、GLM-130B等在內的多個千億元級模型。
然ran而er,複fu雜za的de研yan發fa技ji術shu以yi及ji高gao昂ang的de訓xun練lian成cheng本ben,也ye讓rang不bu少shao人ren望wang而er卻que步bu。在zai當dang時shi,並bing不bu是shi所suo有you人ren都dou能neng夠gou看kan清qing技ji術shu發fa展zhan脈mai絡luo,而er大da模mo型xing對dui資zi金jin投tou入ru的de要yao求qiu很hen高gao,貿mao然ran投tou入ru風feng險xian頗po大da。“當時,我們邀請了一些學界的教授對未來技術的演進方向進行研討,大家都認為這是大模型到達了一個臨界點的信號,AI開始真正進入了可用階段。但是我們在尋找算力、模型工程問題等方麵遇到了很多困難,最後猶豫了很久才決定all in(全部投入)大模型,開始自研算法框架。”張鵬表示。
直至2022年底,ChatGPT發布才真的激起了“百模大戰”的開始,與過往的機器學習技術不同,ChatGPT不再是枯燥的技術理論,它能夠在各領域的應用場景反複驗證,人們才真正感受到大模型“智能湧現”的魅力。ChatGPT實現全球用戶破億僅用了短短兩個月,而電話用戶破億用了75年,手機用了16年,網站用了7年,此前用戶增長最快的應用TikTok也用了9個月。
百家爭鳴、百花齊放,對“大模型熱”要注意什麼?
ChatGPT的de發fa布bu激ji發fa了le更geng多duo機ji構gou和he公gong司si的de研yan發fa鬥dou誌zhi和he熱re情qing,眾zhong多duo資zi本ben紛fen紛fen投tou入ru到dao大da模mo型xing研yan發fa的de藍lan海hai之zhi中zhong,相xiang關guan部bu門men也ye關guan注zhu到dao了le這zhe一yi重zhong要yao的de技ji術shu創chuang新xin,給gei予yu了le非fei常chang多duo的de政zheng策ce支zhi持chi,進jin一yi步bu促cu進jin了le大da模mo型xing的de研yan發fa和he優you化hua升sheng級ji,形xing成cheng了le“百家爭鳴、百花齊放”的科技發展新態勢。這也讓已經積累了兩年技術實力的智譜AI從幕後走到了台前。
但麵對“大模型熱”絕不能盲目。大模型的開發和應用雖然會助推產業和經濟發展,但如果不加以合理管控,也會給產業安全帶來風險。一方麵是芯片的“卡脖子”問wen題ti。算suan力li是shi大da模mo型xing的de基ji礎chu之zhi一yi,如ru何he保bao證zheng算suan力li的de持chi續xu穩wen定ding供gong應ying是shi產chan業ye安an全quan必bi須xu關guan注zhu的de問wen題ti。另ling一yi方fang麵mian,產chan業ye所suo使shi用yong的de基ji座zuo模mo型xing是shi否fou安an全quan可ke控kong也ye是shi一yi個ge重zhong要yao的de問wen題ti。模mo型xing的de訓xun練lian數shu據ju是shi否fou安an全quan合he規gui,模mo型xing是shi否fou自zi主zhu可ke控kong,會hui不bu會hui像xiang“芯片進口”一樣遇到各種限製?這些都是影響產業長遠發展的重要問題。
麵mian對dui風feng險xian挑tiao戰zhan,張zhang鵬peng指zhi出chu,作zuo為wei一yi家jia創chuang業ye公gong司si,做zuo大da語yu言yan模mo型xing要yao有you很hen大da的de決jue心xin,除chu了le研yan究jiu層ceng麵mian上shang的de挑tiao戰zhan,還hai有you模mo型xing訓xun練lian工gong程cheng層ceng麵mian上shang涉she及ji到dao的de資zi源yuan投tou入ru、團隊、訓練數據等一係列的事情。在芯片問題上,智譜AI在(zai)研(yan)發(fa)之(zhi)初(chu)便(bian)製(zhi)訂(ding)了(le)國(guo)產(chan)硬(ying)件(jian)適(shi)配(pei)計(ji)劃(hua),目(mu)前(qian)已(yi)經(jing)與(yu)十(shi)餘(yu)家(jia)國(guo)產(chan)芯(xin)片(pian)廠(chang)商(shang)合(he)作(zuo),希(xi)望(wang)可(ke)以(yi)在(zai)全(quan)方(fang)位(wei)適(shi)配(pei)的(de)同(tong)時(shi),提(ti)升(sheng)模(mo)型(xing)在(zai)國(guo)產(chan)硬(ying)件(jian)上(shang)的(de)訓(xun)練(lian)推(tui)理(li)效(xiao)率(lv)。此(ci)外(wai),智(zhi)譜(pu)AI也選擇了從底層算法開始自研,以實現基座模型安全可控的目標。
“國產大模型與國外大模型之間的差距依然存在,但我們有信心去追趕這個差距,我們一直在不斷創新的路上。”張鵬表示。
傳統產業+大模型,如何放大應用價值?
當前,隨著人工智能的快速發展,大模型的應用已經逐漸從研究領域擴展到工業實踐中,形成工業大模型。從“通用”到“應用”,大模型正在叩響工業製造的大門。
從研發難度來看,無論是通用大模型,還是工業大模型,研發投入、核心人才和應用場景都是不可或缺的,也構成了市場的核心壁壘。而工業大模型對算法模型的有效性、高質量的數據、算suan力li的de支zhi撐cheng能neng力li有you極ji高gao要yao求qiu,模mo型xing的de優you化hua迭die代dai亦yi有you賴lai於yu資zi金jin和he人ren才cai的de持chi續xu投tou入ru。因yin此ci,大da模mo型xing的de實shi際ji落luo地di和he行xing業ye應ying用yong能neng力li成cheng為wei了le市shi場chang檢jian驗yan的de重zhong要yao標biao準zhun。
“工業大模型的普適性商業應用尚需探索。”張鵬認為,一是工業大模型需與其他數字化產品進一步整合,滿足工業企業對網絡、suanliyijishujuguanlideyitihuayaoqiu,shixianjimaijiyong。ershigongyeqiyeshiyongmenkanrengranjiaogao,biruxuyaojiyutishicijinxingyingyongkaifa,bawentijiejuedechangxianluojihexiangguananlirongrujinqu,shidamoxingnenganzhaoyushebuzhou、思考鏈路和回答格式來產生答案。三是工業各領域已存在大量工業軟件、工gong業ye互hu聯lian網wang平ping台tai,如ru何he利li用yong大da模mo型xing形xing成cheng協xie同tong生sheng態tai將jiang深shen刻ke影ying響xiang用yong戶hu感gan知zhi及ji產chan品pin生sheng命ming力li,允yun許xu並bing鼓gu勵li第di三san方fang開kai發fa者zhe基ji於yu工gong業ye大da模mo型xing開kai發fa插cha件jian是shi重zhong要yao路lu徑jing,如ruOpenAI正基於ChatGPT+插件加快構建自己的生態圈。
大(da)語(yu)言(yan)模(mo)型(xing)會(hui)重(zhong)塑(su)千(qian)行(xing)百(bai)業(ye)的(de)業(ye)態(tai),但(dan)需(xu)要(yao)在(zai)具(ju)體(ti)的(de)行(xing)業(ye)落(luo)地(di)方(fang)麵(mian)投(tou)入(ru)更(geng)多(duo)資(zi)源(yuan)。任(ren)何(he)一(yi)項(xiang)技(ji)術(shu)發(fa)展(zhan)到(dao)一(yi)定(ding)程(cheng)度(du)之(zhi)後(hou),都(dou)必(bi)然(ran)會(hui)產(chan)生(sheng)更(geng)多(duo)實(shi)際(ji)價(jia)值(zhi)。如(ru)何(he)實(shi)現(xian)價(jia)值(zhi),常(chang)見(jian)的(de)一(yi)種(zhong)說(shuo)法(fa)是(shi)並(bing)不(bu)需(xu)要(yao)通(tong)用(yong)的(de)基(ji)座(zuo)大(da)模(mo)型(xing),隻(zhi)需(xu)要(yao)小(xiao)的(de)、中量級的、合he適shi的de行xing業ye模mo型xing。但dan大da語yu言yan模mo型xing能neng力li突tu破po的de根gen本ben原yuan因yin在zai於yu,它ta對dui世shi界jie知zhi識shi的de學xue習xi和he建jian模mo,使shi得de它ta具ju備bei了le接jie近jin人ren的de理li解jie推tui理li和he更geng進jin階jie的de認ren知zhi能neng力li。張zhang鵬peng表biao示shi,最zui理li想xiang的de狀zhuang態tai是shi,行xing業ye模mo型xing並bing不bu是shi完wan全quan獨du立li於yu基ji座zuo模mo型xing和he通tong用yong模mo型xing,而er是shi生sheng長chang在zai基ji座zuo模mo型xing之zhi上shang,基ji於yu它ta進jin行xing進jin一yi步bu的de訓xun練lian和he微wei調tiao。
當前,我國傳統產業正麵臨智能化轉型,加入行業特色數據與知識、精準匹配真實應用場景的行業大模型,能夠極大地提升業務流程效率和水平,驅動產業轉型升級。鋼鐵工業具有生產流程連續、工藝體係複雜、產品中間態多樣化、大型高溫高壓設備集中、人員安全要求高等特征,屬於典型的流程型製造業,麵臨著嚴峻的資源、市場、環保、競爭等挑戰。“鋼鐵工業亟需通過大模型等先進技術及場景化創新應用,提升行業的綠色環保、安全保障水平和生產效率。”張鵬說。
對於大模型如何在鋼鐵行業應用,張鵬表示,可以打造鋼鐵工業人工智能解決方案,以具備通用基礎能力的AI大模型作為智能底座,結合行業知識和場景數據進行訓練和微調,從而有效應對碎片化和多樣化需求,並大幅縮減研發、定製、部署、調優等工程化過程中的人力、時間、費用等成本投入,也能解決好數據安全問題,促進人工智能在鋼鐵行業大規模應用,促進鋼鐵行業智能化升級。

來源:中國冶金報-中國鋼鐵新聞網
編輯:張雨恬
相關文檔
版權說明
【1】 凡本網注明"來源:中國冶金報—中國鋼鐵新聞網"的所有作品,版權均屬於中國鋼鐵新聞網。媒體轉載、摘編本網所刊 作品時,需經書麵授權。轉載時需注明來源於《中國冶金報—中國鋼鐵新聞網》及作者姓名。違反上述聲明者,本網將追究其相關法律責任。
【2】 凡本網注明"來源:XXX(非中國鋼鐵新聞網)"的作品,均轉載自其它媒體,轉載目的在於傳遞更多信息,並不代表本網 讚同其觀點,不構成投資建議。
【3】 如果您對新聞發表評論,請遵守國家相關法律、法規,尊重網上道德,並承擔一切因您的行為而直接或間接引起的法律 責任。
【4】 如因作品內容、版權和其它問題需要同本網聯係的。電話:010—010-64411649
【2】 凡本網注明"來源:XXX(非中國鋼鐵新聞網)"的作品,均轉載自其它媒體,轉載目的在於傳遞更多信息,並不代表本網 讚同其觀點,不構成投資建議。
【3】 如果您對新聞發表評論,請遵守國家相關法律、法規,尊重網上道德,並承擔一切因您的行為而直接或間接引起的法律 責任。
【4】 如因作品內容、版權和其它問題需要同本網聯係的。電話:010—010-64411649
地址:北京市朝陽區安貞裏三區26樓 郵編:100029 電話:(010)64442120/(010)64442123 傳真:(010)64411645 電子郵箱:
中國冶金報/中國鋼鐵新聞網法律顧問:大成律師事務所 楊貴生律師 電話: Email:
中國鋼鐵新聞網版權所有,未經書麵授權禁止使用 京ICP備07016269號 京公網安備11010502033228




























