2025“人工智能+”產(chǎn)業(yè)生態(tài)大會(huì)丨“銜遠(yuǎn)大觀”破解通用智能體“實(shí)習(xí)生困境”
2025年12月05日 18:39
12月1日—3日,由中國互聯(lián)網(wǎng)協(xié)會(huì)主辦的2025“人工智能+”產(chǎn)業(yè)生態(tài)大會(huì)在北京中關(guān)村國家自主創(chuàng)新示范區(qū)展示交易中心舉辦。本屆大會(huì)主題為“智賦鏈動(dòng) 生態(tài)共鳴”,旨在構(gòu)建以“政策解讀、技術(shù)展示、需求對(duì)接、成果轉(zhuǎn)化”于一體的綜合性生態(tài)平臺(tái),聚焦人工智能應(yīng)用生態(tài)協(xié)同中的熱點(diǎn)難點(diǎn),推動(dòng)產(chǎn)業(yè)各方務(wù)實(shí)交流。
大會(huì)期間,銜遠(yuǎn)科技 CTO 張開顏在“人工智能與智能體應(yīng)用論壇”,以《銜遠(yuǎn)大觀:基于強(qiáng)化學(xué)習(xí)的專家級(jí)智能體進(jìn)化平臺(tái)》為題,分享了他對(duì)于智能體技術(shù)創(chuàng)新與行業(yè)趨勢(shì)的洞察,并介紹了基于強(qiáng)化學(xué)習(xí)的專家級(jí)智能體進(jìn)化平臺(tái)——銜遠(yuǎn)大觀的核心技術(shù)、產(chǎn)品創(chuàng)新及應(yīng)用落地。

針對(duì)當(dāng)前通用智能體應(yīng)用落地難、長尾問題處理成本高等痛點(diǎn),銜遠(yuǎn)科技根據(jù)創(chuàng)始人周伯文教授提出的“通專融合”技術(shù)路線,構(gòu)建可支撐智能體持續(xù)進(jìn)化的“數(shù)字風(fēng)洞”。其核心解法體現(xiàn)為“大觀公式”,將專家能力拆解為基礎(chǔ)模型、仿真環(huán)境與強(qiáng)化學(xué)習(xí)三部分,強(qiáng)調(diào)環(huán)境是模型進(jìn)化的關(guān)鍵壁壘,并指出跨領(lǐng)域任務(wù)的強(qiáng)化學(xué)習(xí)可通過遷移學(xué)習(xí)促進(jìn)專業(yè)能力快速提升,體現(xiàn)通專融合的根本價(jià)值——既實(shí)現(xiàn)了廣度的平臺(tái)化,更實(shí)現(xiàn)了深度的專業(yè)價(jià)值挖掘。
在技術(shù)內(nèi)核層面,銜遠(yuǎn)自研三大引擎:一是具備課程學(xué)習(xí)能力的智能體模擬訓(xùn)練場,能夠合成海量邊緣任務(wù)案例,并依托生成式世界模型模擬環(huán)境狀態(tài);二是融合業(yè)務(wù)準(zhǔn)則驅(qū)動(dòng)生成式獎(jiǎng)勵(lì)與內(nèi)在獎(jiǎng)勵(lì)的自適應(yīng)反饋機(jī)制,可提供接近專家水準(zhǔn)的反饋信號(hào);三是基于過程獎(jiǎng)勵(lì)監(jiān)督與多智能體協(xié)同的高效強(qiáng)化學(xué)習(xí)引擎,即使對(duì)閉源模型也能通過上下文強(qiáng)化學(xué)習(xí)實(shí)現(xiàn)經(jīng)驗(yàn)庫優(yōu)化。這三者共同構(gòu)成智能體從體驗(yàn)、評(píng)估到進(jìn)化的閉環(huán)體系。
產(chǎn)品架構(gòu)上,基于“銜遠(yuǎn)大觀”系統(tǒng)構(gòu)建了三層平臺(tái),涵蓋數(shù)據(jù)管理、進(jìn)化引擎與專家智能體管理,并將智能體劃分為決策型(CIP)與執(zhí)行型(Syngents)兩類,打造企業(yè)“數(shù)字員工”的入職培訓(xùn)與終身學(xué)習(xí)中心。該平臺(tái)已在建筑、生信、供應(yīng)鏈等多個(gè)行業(yè)實(shí)現(xiàn)應(yīng)用落地,顯著提升任務(wù)效率與專業(yè)水平,推動(dòng)智能體從“演示可期”邁向“實(shí)戰(zhàn)可靠”。
基于這套平臺(tái),銜遠(yuǎn)科技已構(gòu)建了多個(gè)行業(yè)的專家級(jí) Agent。
在建筑行業(yè),與頭部央企合作構(gòu)建了“計(jì)劃編制 Agent”。它既能從“經(jīng)驗(yàn)驅(qū)動(dòng)”到“模型驅(qū)動(dòng)”,實(shí)現(xiàn)智能計(jì)劃編制;又能從“事后補(bǔ)救”到“事前預(yù)見”,實(shí)現(xiàn)智能風(fēng)險(xiǎn)預(yù)警。相比人工,計(jì)劃編制時(shí)間節(jié)省70%,工期延誤全面受控,并為某中型企業(yè)降本3300萬。
在生信行業(yè),與國家蛋白質(zhì)科學(xué)中心合作。所構(gòu)建的Agent能提出新的科學(xué)假設(shè),并自動(dòng)進(jìn)行蛋白質(zhì)組學(xué)數(shù)據(jù)分析。實(shí)測(cè)顯示,其分析速度比人工快10倍,且約有25–30%的自動(dòng)生成假設(shè),達(dá)到了研究生水平的原創(chuàng)性與合理性。
在供應(yīng)鏈領(lǐng)域,為行業(yè)頭部企業(yè)構(gòu)建了“國際物流多式聯(lián)運(yùn)路徑規(guī)劃 Agent”。它結(jié)合大模型對(duì)多源路況的實(shí)時(shí)感知,以及運(yùn)籌學(xué)求解器(Solver)的最佳路徑計(jì)算,將應(yīng)急物流規(guī)劃的時(shí)間從幾小時(shí)縮短到了幾分鐘。
針對(duì)價(jià)格預(yù)測(cè)任務(wù),我們構(gòu)建了“自動(dòng)機(jī)器學(xué)習(xí) Agent”。它能對(duì)預(yù)測(cè)模型進(jìn)行多輪自動(dòng)優(yōu)化。相比人類算法工程師,其模型預(yù)測(cè)準(zhǔn)確率提升了10%。

張開顏表示,數(shù)據(jù)終將耗盡,但環(huán)境可以無限生成數(shù)據(jù)。銜遠(yuǎn)大觀,能夠提供開箱即用的專家級(jí)智能體進(jìn)化平臺(tái)。誠摯邀請(qǐng)各行各業(yè)的專家,與銜遠(yuǎn)攜手合作,將各領(lǐng)域深厚的行業(yè) know-how,轉(zhuǎn)化為 Agent 的訓(xùn)練場,一起構(gòu)建真正專家級(jí)別的智能體。





