本報記者 王維東 于 佳 通訊員 陳天婧
“既能信息檢索,又能知識咨詢”“既能代碼編程,又能公文寫作”“既能查詢數據,又能輔助分析”……12月11日,勝利油田發布第二代“勝小利”油氣大模型,不少員工“不明覺厲”,紛紛用“震撼”“驚喜”來形容他們的體驗感受,甚至有人驚呼:“勝利版‘ChatGPT’來了!”
具有20多項技能
自2023年ChatGPT破圈以來,大模型在國內外呈現出百舸爭流的競發態勢。勝利油田搶占技術發展前沿,成立油氣人工智能課題組,進軍行業大模型建設,加快人工智能技術和油氣產業融合發展。
目前,“勝小利”油氣大模型具有油氣專業知識查詢、圖件查詢、生產信息查詢、工作進度查詢、生產異常分析、公文輔助寫作等20多項技能,顯著減少了員工查數據、查資料、查系統的煩瑣工作。
自然語言大模型是指基于深度學習技術訓練的大規模神經網絡模型,主要用于自然語言處理任務。這些模型具有巨大的參數量和強大的語言理解能力。“小模型AI,一個模型只能解決一個特定場景問題;而大模型AI能準確理解問題,自動調用各種數據、App,解決不同學科、不同場景的復雜問題,具有通用人工智能的巨大潛力?!庇蜌馊斯ぶ悄苷n題組負責人、勝利油田信息化技術服務中心技術總監王振介紹。
“石油知識的百科全書”
數據是大模型成長的養分,只有不停給大模型投喂海量數據進行訓練,才能保證準確性和生成效果。據悉,3.5版本的ChatGPT“學習”了上百億通用知識,參數量已達1750億,相當于3平方厘米大腦皮層的神經元量。
作為油氣專業大模型,“勝小利”在學習通用知識的基礎上,又強化學習了60萬條油氣勘探開發專業知識,完成了油藏工程、采油工程等石油相關專業本科基礎課程,被喻為“石油知識的百科全書”。目前,“勝小利”的參數量已達930億,每周接受2000條數據投喂。
通過對勘探開發數據、方案等資料的學習,“勝小利”可以良好地掌握油田的勘探開發、地質工程和生產過程等知識,幫助有需求的員工隨時、全面查詢油田發展歷史、開發現狀和未來趨勢,加快數據提取速度,提高了工作效能。勝利油田還利用油氣勘探開發基礎資料、研究成果等內容對大模型進行微調訓練,形成勘探開發應用模型,輔助科研人員編制方案,大幅度縮短研究周期和方案設計時間,全面提升勘探開發科學化決策水平。
2.0版本面向全油田開放
在王振眼里,“勝小利”猶如一個超級助理。經過大模型訓練后,“勝小利”可以在油氣行業不同崗位上發揮作用,提供知識問答、信息查詢、問題研判、方案編制等服務,全面助力油田數字化、智能化轉型。
當然,“勝小利”并非無所不能。對于超出認知范圍的問題,它雖然仍能給出一個答案,但并非是正確答案,說明“它已經覺醒了,但會產生幻覺,不知道自己不知道”。
為每一次交互節省3分鐘,是王振團隊追求的目標。據測試,相比傳統查數據庫、登錄系統的模式,“勝小利”每次交互可節省3分鐘。如果在全系統全面推廣,預計每日可節省交互時長2.5萬小時,僅人工效率提高方面,可創造200萬元/天經濟效益。
1.0版本的“勝小利”僅局限于內部小范圍進行測試,內測期間累計回答提問8000余次。而2.0版本的“勝小利”面向全油田開放,各單位和員工通過專業微調、強化訓練,能夠形成不同專業的應用大模型和個人定制專屬大模型,加快大模型應用的落地。
