寧波材料所在基于多語言大模型的事件分析方面取得進展
國際熱點事件頻繁爆發(fā),針對熱點事件的信息報道繁雜,導致信息分析的難度日益增加。傳統(tǒng)的人工信息分析不僅耗時長、成本高,還難以應對多語言、多文化背景下的信息變化。大模型技術(shù)的出現(xiàn)和廣泛使用,為信息分析人員在極短時間內(nèi)深入分析與處理海量多語言數(shù)據(jù)、迅速掌握重要主題事件全貌提供了可能。因此,如何利用大模型技術(shù)在錯綜復雜的國際熱點議題中生成高質(zhì)量的專題分析報告,已成為信息分析領(lǐng)域亟待攻克的重要課題。
中國科學院寧波材料技術(shù)與工程研究所計算機視覺技術(shù)團隊長期專注于大模型應用的前沿研究,團隊圍繞情報挖掘、深度分析到輔助決策的全鏈條研究,開發(fā)了多個具有實用價值的智能化解決方案。近期,團隊提出了一種基于知識圖譜驅(qū)動的多語言專題事件分析報告生成方法(“NimteRAG”大模型),有效攻克了傳統(tǒng)情報分析方法在處理海量多語言數(shù)據(jù)時面臨的語義關(guān)聯(lián)復雜、上下文感知缺失以及泛化能力受限等難題。其核心關(guān)鍵技術(shù)包括:采用哈希增強圖結(jié)構(gòu)索引,將多語言文本映射為緊湊的哈希編碼,以優(yōu)化存儲并加速檢索與關(guān)聯(lián)分析;設(shè)計雙層次檢索模式,靈活處理具體實體查詢和抽象概念查詢,生成層次清晰、連貫性強的報告;運用知識注入的增量學習方法,在保持模型通用知識的基礎(chǔ)上,有效學習并融入專題事件特定知識,顯著增強了模型的泛化性能。生成的報告內(nèi)容全面深入,包括事件整體情況的詳細梳理(涵蓋事件演化流程、各子事件及關(guān)鍵拐點)、事件的綜合分析(從多角度、多維度出發(fā),兼顧不同立場進行深入分析)以及事件發(fā)展預測(基于推理預判,展望事件的未來走向)。
12月27日,在國防科技大學外國語學院承辦的首屆“智擎杯”信息分析處理大賽中,課題組成員張曉露、谷曉靜、許根、王益杰憑借自主研發(fā)的“NimteRAG”大模型從全國124支參賽隊伍中脫穎而出,在專題事件分析報告智能生成關(guān)鍵技術(shù)賽道上獲得全國第五名。該項目獲得了寧波市“科創(chuàng)甬江2035“關(guān)鍵技術(shù)突破計劃(2024Z120)等的支持。

技術(shù)思路框架圖
(機器人與智能制造裝備技術(shù)實驗室?張曉露)
?