鋼鐵行業需要什麼樣的大模型？

2026-04-16 08:41:32

中國冶金報中國鋼鐵新聞網

記者樊三彩報道

　　繼ChatGPT大模型後，國內智譜AI的ChatGLM、百度的文心一言、科大訊飛的星火等國產大模型如雨後春筍般湧現，被稱為“百模大戰”。在zai它ta背bei後hou，不bu僅jin是shi各ge家jia技ji術shu實shi力li的de比bi拚pin，也ye是shi應ying用yong場chang景jing落luo地di能neng力li的de較jiao量liang。令ling市shi場chang狂kuang熱re的de大da模mo型xing究jiu竟jing有you何he魔mo力li？當dang鋼gang鐵tie行xing業ye遇yu見jian大da模mo型xing，又you會hui碰peng撞zhuang出chu怎zen樣yang的de火huo花hua？近jin日ri，《中國冶金報》記者專訪了智譜AI CEO張鵬，圍繞當前的“大模型熱”進行了對話。

　　智譜AI於2019年由清華大學計算機係技術成果轉化而成立，於次年便開始了GLM預訓練架構的研發，是國內最早從事大模型相關研究的機構之一。“麵對‘大模型熱’，如果用一個詞來形容我的想法，那就是篤信。”張鵬指出，“信”當然就是相信這件事情，大模型一定是通往AGI（通用人工智能）的必經之路，能創造更大的價值；“篤”是一種踏實、審慎的態度，相信是基於對這件事情的理解和鑽研，而不是狂熱、沒有根基的。

　　從紙上談兵到實踐躬行，大模型為什麼這麼“熱”？

　　大模型的起源可以追溯到2017年，Transformer算法架構的誕生，開啟了大模型演化的曆史進程。雖然在接下來的幾年內，BERT、GPT-1、GPT-2也先後出現，甚至BERT在十多個自然語言理解任務上大大超過傳統算法的精度，但依舊沒有在業界引起太多的火花，直至2020年的到來。“這一年是大模型元年。”張鵬表示。

　　GPT-3的問世大大提高了模型的內容生成和邏輯推理能力，它在上下文學習和知識（常識）理解等方麵展現出驚人能力。隨後在全球範圍內掀起了一股基礎模型研究的熱潮，國外如 Meta、微軟、穀歌等，國內如清華大學、北京智源人工智能研究院、百度、華為、阿裏巴巴、智譜AI等，都競相追趕，提出包括Gopher、Chinchilla、PaLM、GLM-130B等在內的多個千億元級模型。

　　然ran而er，複fu雜za的de研yan發fa技ji術shu以yi及ji高gao昂ang的de訓xun練lian成cheng本ben，也ye讓rang不bu少shao人ren望wang而er卻que步bu。在zai當dang時shi，並bing不bu是shi所suo有you人ren都dou能neng夠gou看kan清qing技ji術shu發fa展zhan脈mai絡luo，而er大da模mo型xing對dui資zi金jin投tou入ru的de要yao求qiu很hen高gao，貿mao然ran投tou入ru風feng險xian頗po大da。“當時，我們邀請了一些學界的教授對未來技術的演進方向進行研討，大家都認為這是大模型到達了一個臨界點的信號，AI開始真正進入了可用階段。但是我們在尋找算力、模型工程問題等方麵遇到了很多困難，最後猶豫了很久才決定all in（全部投入）大模型，開始自研算法框架。”張鵬表示。

　　直至2022年底，ChatGPT發布才真的激起了“百模大戰”的開始，與過往的機器學習技術不同，ChatGPT不再是枯燥的技術理論，它能夠在各領域的應用場景反複驗證，人們才真正感受到大模型“智能湧現”的魅力。ChatGPT實現全球用戶破億僅用了短短兩個月，而電話用戶破億用了75年，手機用了16年，網站用了7年，此前用戶增長最快的應用TikTok也用了9個月。

　　百家爭鳴、百花齊放，對“大模型熱”要注意什麼？

　　ChatGPT的de發fa布bu激ji發fa了le更geng多duo機ji構gou和he公gong司si的de研yan發fa鬥dou誌zhi和he熱re情qing，眾zhong多duo資zi本ben紛fen紛fen投tou入ru到dao大da模mo型xing研yan發fa的de藍lan海hai之zhi中zhong，相xiang關guan部bu門men也ye關guan注zhu到dao了le這zhe一yi重zhong要yao的de技ji術shu創chuang新xin，給gei予yu了le非fei常chang多duo的de政zheng策ce支zhi持chi，進jin一yi步bu促cu進jin了le大da模mo型xing的de研yan發fa和he優you化hua升sheng級ji，形xing成cheng了le“百家爭鳴、百花齊放”的科技發展新態勢。這也讓已經積累了兩年技術實力的智譜AI從幕後走到了台前。

　　但麵對“大模型熱”絕不能盲目。大模型的開發和應用雖然會助推產業和經濟發展，但如果不加以合理管控，也會給產業安全帶來風險。一方麵是芯片的“卡脖子”問wen題ti。算suan力li是shi大da模mo型xing的de基ji礎chu之zhi一yi，如ru何he保bao證zheng算suan力li的de持chi續xu穩wen定ding供gong應ying是shi產chan業ye安an全quan必bi須xu關guan注zhu的de問wen題ti。另ling一yi方fang麵mian，產chan業ye所suo使shi用yong的de基ji座zuo模mo型xing是shi否fou安an全quan可ke控kong也ye是shi一yi個ge重zhong要yao的de問wen題ti。模mo型xing的de訓xun練lian數shu據ju是shi否fou安an全quan合he規gui，模mo型xing是shi否fou自zi主zhu可ke控kong，會hui不bu會hui像xiang“芯片進口”一樣遇到各種限製？這些都是影響產業長遠發展的重要問題。

　　麵mian對dui風feng險xian挑tiao戰zhan，張zhang鵬peng指zhi出chu，作zuo為wei一yi家jia創chuang業ye公gong司si，做zuo大da語yu言yan模mo型xing要yao有you很hen大da的de決jue心xin，除chu了le研yan究jiu層ceng麵mian上shang的de挑tiao戰zhan，還hai有you模mo型xing訓xun練lian工gong程cheng層ceng麵mian上shang涉she及ji到dao的de資zi源yuan投tou入ru、團隊、訓練數據等一係列的事情。在芯片問題上，智譜AI在(zai)研(yan)發(fa)之(zhi)初(chu)便(bian)製(zhi)訂(ding)了(le)國(guo)產(chan)硬(ying)件(jian)適(shi)配(pei)計(ji)劃(hua)，目(mu)前(qian)已(yi)經(jing)與(yu)十(shi)餘(yu)家(jia)國(guo)產(chan)芯(xin)片(pian)廠(chang)商(shang)合(he)作(zuo)，希(xi)望(wang)可(ke)以(yi)在(zai)全(quan)方(fang)位(wei)適(shi)配(pei)的(de)同(tong)時(shi)，提(ti)升(sheng)模(mo)型(xing)在(zai)國(guo)產(chan)硬(ying)件(jian)上(shang)的(de)訓(xun)練(lian)推(tui)理(li)效(xiao)率(lv)。此(ci)外(wai)，智(zhi)譜(pu)AI也選擇了從底層算法開始自研，以實現基座模型安全可控的目標。

　　“國產大模型與國外大模型之間的差距依然存在，但我們有信心去追趕這個差距，我們一直在不斷創新的路上。”張鵬表示。

　　傳統產業+大模型，如何放大應用價值？

　　當前，隨著人工智能的快速發展，大模型的應用已經逐漸從研究領域擴展到工業實踐中，形成工業大模型。從“通用”到“應用”，大模型正在叩響工業製造的大門。

　　從研發難度來看，無論是通用大模型，還是工業大模型，研發投入、核心人才和應用場景都是不可或缺的，也構成了市場的核心壁壘。而工業大模型對算法模型的有效性、高質量的數據、算suan力li的de支zhi撐cheng能neng力li有you極ji高gao要yao求qiu，模mo型xing的de優you化hua迭die代dai亦yi有you賴lai於yu資zi金jin和he人ren才cai的de持chi續xu投tou入ru。因yin此ci，大da模mo型xing的de實shi際ji落luo地di和he行xing業ye應ying用yong能neng力li成cheng為wei了le市shi場chang檢jian驗yan的de重zhong要yao標biao準zhun。

　　“工業大模型的普適性商業應用尚需探索。”張鵬認為，一是工業大模型需與其他數字化產品進一步整合，滿足工業企業對網絡、suanliyijishujuguanlideyitihuayaoqiu，shixianjimaijiyong。ershigongyeqiyeshiyongmenkanrengranjiaogao，biruxuyaojiyutishicijinxingyingyongkaifa，bawentijiejuedechangxianluojihexiangguananlirongrujinqu，shidamoxingnenganzhaoyushebuzhou、思考鏈路和回答格式來產生答案。三是工業各領域已存在大量工業軟件、工gong業ye互hu聯lian網wang平ping台tai，如ru何he利li用yong大da模mo型xing形xing成cheng協xie同tong生sheng態tai將jiang深shen刻ke影ying響xiang用yong戶hu感gan知zhi及ji產chan品pin生sheng命ming力li，允yun許xu並bing鼓gu勵li第di三san方fang開kai發fa者zhe基ji於yu工gong業ye大da模mo型xing開kai發fa插cha件jian是shi重zhong要yao路lu徑jing，如ruOpenAI正基於ChatGPT+插件加快構建自己的生態圈。

　　大(da)語(yu)言(yan)模(mo)型(xing)會(hui)重(zhong)塑(su)千(qian)行(xing)百(bai)業(ye)的(de)業(ye)態(tai)，但(dan)需(xu)要(yao)在(zai)具(ju)體(ti)的(de)行(xing)業(ye)落(luo)地(di)方(fang)麵(mian)投(tou)入(ru)更(geng)多(duo)資(zi)源(yuan)。任(ren)何(he)一(yi)項(xiang)技(ji)術(shu)發(fa)展(zhan)到(dao)一(yi)定(ding)程(cheng)度(du)之(zhi)後(hou)，都(dou)必(bi)然(ran)會(hui)產(chan)生(sheng)更(geng)多(duo)實(shi)際(ji)價(jia)值(zhi)。如(ru)何(he)實(shi)現(xian)價(jia)值(zhi)，常(chang)見(jian)的(de)一(yi)種(zhong)說(shuo)法(fa)是(shi)並(bing)不(bu)需(xu)要(yao)通(tong)用(yong)的(de)基(ji)座(zuo)大(da)模(mo)型(xing)，隻(zhi)需(xu)要(yao)小(xiao)的(de)、中量級的、合he適shi的de行xing業ye模mo型xing。但dan大da語yu言yan模mo型xing能neng力li突tu破po的de根gen本ben原yuan因yin在zai於yu，它ta對dui世shi界jie知zhi識shi的de學xue習xi和he建jian模mo，使shi得de它ta具ju備bei了le接jie近jin人ren的de理li解jie推tui理li和he更geng進jin階jie的de認ren知zhi能neng力li。張zhang鵬peng表biao示shi，最zui理li想xiang的de狀zhuang態tai是shi，行xing業ye模mo型xing並bing不bu是shi完wan全quan獨du立li於yu基ji座zuo模mo型xing和he通tong用yong模mo型xing，而er是shi生sheng長chang在zai基ji座zuo模mo型xing之zhi上shang，基ji於yu它ta進jin行xing進jin一yi步bu的de訓xun練lian和he微wei調tiao。

　　當前，我國傳統產業正麵臨智能化轉型，加入行業特色數據與知識、精準匹配真實應用場景的行業大模型，能夠極大地提升業務流程效率和水平，驅動產業轉型升級。鋼鐵工業具有生產流程連續、工藝體係複雜、產品中間態多樣化、大型高溫高壓設備集中、人員安全要求高等特征，屬於典型的流程型製造業，麵臨著嚴峻的資源、市場、環保、競爭等挑戰。“鋼鐵工業亟需通過大模型等先進技術及場景化創新應用，提升行業的綠色環保、安全保障水平和生產效率。”張鵬說。

　　對於大模型如何在鋼鐵行業應用，張鵬表示，可以打造鋼鐵工業人工智能解決方案，以具備通用基礎能力的AI大模型作為智能底座，結合行業知識和場景數據進行訓練和微調，從而有效應對碎片化和多樣化需求，並大幅縮減研發、定製、部署、調優等工程化過程中的人力、時間、費用等成本投入，也能解決好數據安全問題，促進人工智能在鋼鐵行業大規模應用，促進鋼鐵行業智能化升級。

來源：中國冶金報-中國鋼鐵新聞網

編輯：張雨恬

下一篇：安米哈薩克斯坦煤礦火災造成46人死亡

版權說明

【1】凡本網注明"來源：中國冶金報—中國鋼鐵新聞網"的所有作品，版權均屬於中國鋼鐵新聞網。媒體轉載、摘編本網所刊作品時，需經書麵授權。轉載時需注明來源於《中國冶金報—中國鋼鐵新聞網》及作者姓名。違反上述聲明者，本網將追究其相關法律責任。
【2】凡本網注明"來源：XXX（非中國鋼鐵新聞網）"的作品，均轉載自其它媒體，轉載目的在於傳遞更多信息，並不代表本網讚同其觀點，不構成投資建議。
【3】如果您對新聞發表評論，請遵守國家相關法律、法規，尊重網上道德，並承擔一切因您的行為而直接或間接引起的法律責任。
【4】如因作品內容、版權和其它問題需要同本網聯係的。電話：010—010-64411649