生成式 AI 幫助工程師挖掘隱藏在非結構化數據中的深層洞察
發布時間:2026-02-25 來源:轉載 責任編輯:lily
【導讀】生成式AI(GenAI)的(de)崛(jue)起(qi),不(bu)僅(jin)能(neng)將(jiang)分(fen)散(san)的(de)非(fei)結(jie)構(gou)化(hua)數(shu)據(ju)與(yu)結(jie)構(gou)化(hua)傳(chuan)感(gan)器(qi)數(shu)據(ju)深(shen)度(du)融(rong)合(he),更(geng)將(jiang)工(gong)程(cheng)師(shi)的(de)角(jiao)色(se)從(cong)繁(fan)瑣(suo)的(de)數(shu)據(ju)清(qing)洗(xi)中(zhong)解(jie)放(fang)出(chu)來(lai),轉(zhuan)向(xiang)更(geng)高(gao)階(jie)的(de)戰(zhan)略(lve)分(fen)析(xi)與(yu)決(jue)策(ce)。從(cong)塔(ta)塔(ta)汽(qi)車(che)利(li)用(yong)檢(jian)索(suo)增(zeng)強(qiang)生(sheng)成(cheng)(RAG)技術構建上下文感知的故障診斷助手,到哥本哈根大學通過圖論與大模型結合加速食品科學發現,GenAIzhengzhanxianchuchaoyuejichudaimabianxiedejudaqianli。raner,jinguanpujilvriyitisheng,xuduogongchengshirengshouxianyuchuantongyongfahuoduigongzuoliuzhenghededanyou,shangweichongfenwajueqizaiyucexingweihuhefuzaxitongfenxizhongdeshencengjiazhi。
您是否知道,生成式 AI(GenAI)可以幫助工程師在幾秒鍾內診斷汽車故障,甚至在設備出現問題之前預測潛在失效?GenAI 正在通過加速數據分析和算法開發,讓這些場景從設想走向現實,使工程師能夠充分發揮專業知識,挖掘可執行的洞察。
工程團隊每年都會產生數 TB 級的數據。根據 Gartner 的估算,其中多達 80% 屬於非結構化數據。服務記錄、研究論文和技術人員記錄中蘊含著關鍵的組織知識,但由於格式不一致,難以有效解析。GenAI 工具能夠幫助工程師整合結構化與非結構化數據,實現過去難以大規模開展的分析工作。對工程師而言,這意味著更快速的故障排查、更高效的設計流程以及更快的技術發現。
工程師在使用 GenAI 時的盲區
盡管 GenAI 在重塑工程工作方麵具有高度靈活性,但其能力與工程師日常使用方式之間仍存在差距。許多工程師仍將 GenAI 主要用於編寫基礎代碼或生成文檔,而不是將其應用於更高級的工程流程。
為更好地了解工程師對 GenAI 的態度及其實際應用情況,MathWorks 於 2025 年 12 月在社交媒體上進行了一項非正式投票。反饋結果揭示了多項重要洞察,包括:
-83% 的工程師至少每月使用一次 GenAI,其中最常見的應用場景是“編寫代碼”和“文檔與報告生成”。
-工程師對 GenAI 的最大擔憂是其與現有工作流程的整合(46%)。在擁有六年以上經驗的工程師中,這一比例更是升至 75%。
這些數據表明,大多數工程師已經在使用 GenAI,但尚未將其應用於戰略性工程任務。希望提升 GenAI 使用能力的工程師應考慮將其用於準備和分析非結構化數據。
利用服務手冊、工程文檔和維修記錄構建麵向技術人員的聊天助手
汽車故障排查通常需要在不同品牌和車型中診斷複雜問題。盡管大語言模型(LLM)包含大量公開的汽車知識,但它們缺乏細節豐富的品牌專屬信息。為彌合這一差距,塔塔汽車的工程師采用了一種名為檢索增強生成(RAG)的 GenAI 技術,將 LLM 的通用知識與內部專有數據結合,從而生成具有上下文針對性的建議。
工程師利用 RAG 開發了一個具備上下文感知能力的聊天助手,能夠檢索內部文檔並基於這些內容生成故障排查回複。他們使用 MATLAB® 構建了 RAG 工作流程,使其應用(稱為 ServiceSage)可以搜索服務手冊、工程文檔和維修記錄。當技術人員向 ServiceSage 提問時,問題會被轉化為 GenAI 能理解的數值表示,係統隨後查找最相關的文檔。由於 RAG 執行的是語義搜索,問題的具體措辭並不關鍵,它會根據相關概念進行推斷。相關文檔隨後被輸入 AI 模型,模型將其與通用知識結合,生成清晰、可理解的回答。
這(zhe)種(zhong)方(fang)法(fa)具(ju)有(you)成(cheng)本(ben)效(xiao)益(yi)且(qie)可(ke)擴(kuo)展(zhan),無(wu)需(xu)進(jin)行(xing)昂(ang)貴(gui)的(de)模(mo)型(xing)再(zai)訓(xun)練(lian),並(bing)能(neng)處(chu)理(li)大(da)量(liang)此(ci)前(qian)未(wei)被(bei)充(chong)分(fen)利(li)用(yong)的(de)文(wen)本(ben)數(shu)據(ju)。借(jie)助(zhu)該(gai)方(fang)法(fa),團(tuan)隊(dui)能(neng)夠(gou)快(kuai)速(su)識(shi)別(bie)根(gen)本(ben)原(yuan)因(yin),提(ti)供(gong)上(shang)下(xia)文(wen)相(xiang)關(guan)的(de)指(zhi)導(dao),並(bing)縮(suo)短(duan)維(wei)修(xiu)周(zhou)期(qi)。通(tong)過(guo) GenAI,工程師可以高效分析大量文本數據,並將其融入故障排查流程中。
利用全球與曆史科研資料推進食品科學發現
科學研究通常涉及跨越數十年、laiziduogediqudedalianglunwen,xiangyaoxitongshulimouyizhutidesuoyouyanjiuhuozhaochuqizhongqianzailianxi,ruowuxianjingongjujihubukeneng。gebenhagendaxuedeshipinkexueyanjiurenyuanzaifenxipangdaziliaoxunzhaozhutiguanlianshimianlinzheyitiaozhan。LLM 雖然能夠總結單篇文獻,但難以在海量數據中梳理整體關聯。為解決該問題,研究人員在使用 LLM 前,將 GenAI 與傳統技術相結合——如文本預處理與清洗、信息提取等——為非結構化文本建立結構。
哥本哈根大學團隊在整個流程中多次使用 GenAI,包括:
1清理並標準化了數千份格式不一致的 PDF 文件。
2在元數據缺失時自動生成關鍵字。
3將文本轉換為詞元(tokens),並標記異常長的詞語,以識別隱藏在文中的化學物質名稱。
4將論文拆分為段落和關鍵字後構建知識圖譜。圖譜中的每個節點代表一個段落或化學名稱,節點之間的連接則體現主題之間的關聯。
隨後,團隊使用 MATLAB 對該數據集應用圖論方法,識別各概念之間的關聯路徑。接著,他們將這些結構化的文本子集輸入 LLM,由模型生成摘要並解釋不同主題之間的關係——這(zhe)些(xie)關(guan)係(xi)若(ruo)由(you)人(ren)工(gong)分(fen)析(xi),可(ke)能(neng)需(xu)要(yao)數(shu)周(zhou)時(shi)間(jian)。最(zui)終(zhong),他(ta)們(men)構(gou)建(jian)了(le)一(yi)套(tao)能(neng)夠(gou)將(jiang)分(fen)散(san)研(yan)究(jiu)轉(zhuan)化(hua)為(wei)可(ke)執(zhi)行(xing)洞(dong)察(cha)的(de)流(liu)程(cheng),大(da)幅(fu)加(jia)速(su)了(le)食(shi)品(pin)科(ke)學(xue)研(yan)究(jiu)的(de)推(tui)進(jin)。
盡管 GenAI 帶來了顯著價值——研究人員通過該流程節省了數天的人工處理時間——但成功仍高度依賴人工判斷與手動工作。團隊在將數據輸入 GenAI 之前投入了數百小時進行實驗與數據準備。通過反複試驗,他們才確定將文本按段落進行切分最為有效,因為 GenAI 無法自動作出這種判斷。GenAI 的強大之處隻有在具備高質量數據和嚴謹工程方法的前提下才能充分發揮。
將維護數據轉化為前瞻性洞察
傳統的預測性維護(PdM)主要依賴傳感器的數值數據,用來跟蹤溫度、振動、yalidengbianhua,yibuzhuoshebeiguzhangqiandeyichangmoshi。xuduozuzhihaihuishoujiweihurizhihejishurenyuanjiludengwenbenxinxi,zhexieneirongnenggoutigongchuanganqiwufabuzhuodeguanjianbeijing,liruguzhangzhengzhuang、維修過程以及可能的根因判斷。

生成式 AI 幫助工程師處理來自設備日誌和服務記錄的非結構化數據,從而改進預測性維護流程。
文本信息並不能取代傳感器數據;工程師可以利用 GenAI 將其標準化,使其能夠與傳統信號協同使用。例如,GenAI 可以總結維護記錄、統一不一致的術語,或標注關鍵事件(如組件故障或重複出現的故障類型)。這些標注數據隨後可與時間序列傳感器數據對齊,為 PdM 模型的開發提供更清晰的目標與上下文。

生成式 AI 幫助技術人員將服務記錄與傳感器數據結合,以更快速、更準確地完成汽車故障診斷。
GenAI 還可以支持工程流程的其他環節。工程師可以使用它起草和優化用於數據清洗、特(te)征(zheng)工(gong)程(cheng)或(huo)探(tan)索(suo)性(xing)分(fen)析(xi)的(de)代(dai)碼(ma),也(ye)可(ke)以(yi)用(yong)它(ta)評(ping)估(gu)不(bu)同(tong)的(de)建(jian)模(mo)方(fang)法(fa)。然(ran)而(er),領(ling)域(yu)知(zhi)識(shi)在(zai)整(zheng)個(ge)過(guo)程(cheng)依(yi)然(ran)至(zhi)關(guan)重(zhong)要(yao)。隻(zhi)有(you)經(jing)驗(yan)豐(feng)富(fu)的(de)工(gong)程(cheng)師(shi)才(cai)能(neng)判(pan)斷(duan)特(te)征(zheng)是(shi)否(fou)具(ju)有(you)物(wu)理(li)意(yi)義(yi)、模型行為是否符合係統動力學,以及輸出結果是否反映真實的故障模式或隻是數據噪聲。
與所有 PdM 方法一樣,基於 GenAI 的de工gong作zuo流liu程cheng在zai部bu署shu前qian需xu要yao經jing過guo嚴yan格ge驗yan證zheng。一yi個ge在zai原yuan型xing或huo小xiao規gui模mo測ce試shi集ji中zhong表biao現xian良liang好hao的de模mo型xing,未wei必bi能neng夠gou應ying對dui真zhen實shi環huan境jing中zhong的de多duo變bian條tiao件jian。工gong程cheng師shi應ying使shi用yong具ju有you代dai表biao性xing的de數shu據ju集ji進jin行xing驗yan證zheng,對dui模mo型xing進jin行xing多duo工gong況kuang壓ya力li測ce試shi,並bing加jia入ru確que定ding性xing檢jian查zha以yi確que保bao其qi健jian壯zhuang性xing。這zhe些xie最zui佳jia實shi踐jian適shi用yong於yu所suo有you PdM 方法,無論是否包含 GenAI,再次強調成功的 PdM 不僅依賴先進工具,更依賴紮實的工程判斷。
工程師們仍隻觸及 GenAI 的表層
與任何工具一樣,GenAI 應在方法論指導下使用,而非被泛化應用於所有問題。當任務涉及大量非結構化數據,或需要處理語言驅動的輸入時,GenAI 的價值最為突出。工程師需要戰略性地整合 GenAI,拓展領域專業知識,並思考如何在自身的設計方法中切實應用這一工具。
總結
生成式AI雖(sui)已(yi)展(zhan)現(xian)出(chu)重(zhong)塑(su)工(gong)程(cheng)流(liu)程(cheng)的(de)強(qiang)大(da)能(neng)力(li),但(dan)目(mu)前(qian)大(da)多(duo)數(shu)應(ying)用(yong)仍(reng)停(ting)留(liu)在(zai)表(biao)層(ceng),尚(shang)未(wei)完(wan)全(quan)轉(zhuan)化(hua)為(wei)推(tui)動(dong)技(ji)術(shu)創(chuang)新(xin)的(de)核(he)心(xin)引(yin)擎(qing)。真(zhen)正(zheng)的(de)突(tu)破(po)不(bu)在(zai)於(yu)盲(mang)目(mu)依(yi)賴(lai)模(mo)型(xing)的(de)通(tong)用(yong)能(neng)力(li),而(er)在(zai)於(yu)將(jiang)GenAI戰略性地嵌入嚴謹的工程方法論中:tongguorengongpanduanzhidaoshujuyuchuli,liyonglingyuzhishiyanzhengmoxingshuchudewuliyiyi,bingjiangfeijiegouhuawenbendongchayuchuantongchuanganqishujuyoujijiehe。wulunshijiasuguzhangpaizhahaishiyouhuayucexingweihu,chenggongdeyaochishizhongzhangwozainaxienenggoujiayugongju、堅持嚴格驗證並具備深厚專業背景的工程師手中。

- 噪聲中提取真值!瑞盟科技推出MSA2240電流檢測芯片賦能多元高端測量場景
- 10MHz高頻運行!氮矽科技發布集成驅動GaN芯片,助力電源能效再攀新高
- 失真度僅0.002%!力芯微推出超低內阻、超低失真4PST模擬開關
- 一“芯”雙電!聖邦微電子發布雙輸出電源芯片,簡化AFE與音頻設計
- 一機適配萬端:金升陽推出1200W可編程電源,賦能高端裝備製造
- 築基AI4S:摩爾線程全功能GPU加速中國生命科學自主生態
- 一秒檢測,成本降至萬分之一,光引科技把幾十萬的台式光譜儀“搬”到了手腕上
- AI服務器電源機櫃Power Rack HVDC MW級測試方案
- 突破工藝邊界,奎芯科技LPDDR5X IP矽驗證通過,速率達9600Mbps
- 通過直接、準確、自動測量超低範圍的氯殘留來推動反滲透膜保護
- 車規與基於V2X的車輛協同主動避撞技術展望
- 數字隔離助力新能源汽車安全隔離的新挑戰
- 汽車模塊拋負載的解決方案
- 車用連接器的安全創新應用
- Melexis Actuators Business Unit
- Position / Current Sensors - Triaxis Hall




