近日,中國(guó)科學(xué)院合肥物質(zhì)院智能所丁增輝研究員聯(lián)合華南理工大學(xué)靳戰(zhàn)鵬教授團(tuán)隊(duì),提出一種醫(yī)療大模型智能體決策框架FRAME。相關(guān)研究工作“FRAME: Feedback-Refined Agent Methodology for Enhancing Medical Research Insights”被第63屆國(guó)際計(jì)算語言學(xué)年會(huì)錄用。
探尋新的醫(yī)療洞見和決策方法是輔助醫(yī)學(xué)研究的前沿?zé)狳c(diǎn),大語言模型(LLM)的快速發(fā)展為該領(lǐng)域研究提供了重大機(jī)遇,但在知識(shí)整合與質(zhì)量保證方面仍面臨嚴(yán)峻挑戰(zhàn)。研究團(tuán)隊(duì)提出的FRAME (Feedback-Refined Agent Methodology)框架,旨在通過迭代式優(yōu)化和結(jié)構(gòu)化反饋來提升醫(yī)學(xué)洞見性能。該方法包含三大核心創(chuàng)新:一是構(gòu)建結(jié)構(gòu)化數(shù)據(jù)集:通過迭代優(yōu)化,將醫(yī)學(xué)文獻(xiàn)分解為核心研究要素,構(gòu)建精細(xì)化數(shù)據(jù)集;二是搭建“生成-評(píng)估-反思”三方智能體架構(gòu):集成了生成(Generator)、評(píng)估(Evaluator)和反思(Reflector)智能體,通過指標(biāo)驅(qū)動(dòng)的反饋循環(huán),逐步提升內(nèi)容質(zhì)量;三是形成綜合評(píng)估體系:結(jié)合了統(tǒng)計(jì)學(xué)指標(biāo)與人工基準(zhǔn),對(duì)生成內(nèi)容進(jìn)行全方位評(píng)測(cè)。
對(duì)比實(shí)驗(yàn)結(jié)果顯示,相較于傳統(tǒng)方法,FRAME框架在運(yùn)用多種大語言模型提升醫(yī)學(xué)洞見性能方面效果顯著,在DeepSeek V3上平均提升9.91%,在GPT-4o Mini上也取得了同等級(jí)別的改進(jìn)。同時(shí),人工評(píng)估也證實(shí)了利用FRAME智能生成的醫(yī)療決策質(zhì)量已能媲美人類水平,尤其在凝練未來研究方向方面表現(xiàn)突出。相關(guān)研究成果表明,所構(gòu)建的FRAME框架,能夠自動(dòng)生成高標(biāo)準(zhǔn)的醫(yī)學(xué)研究方案,高效輔助醫(yī)學(xué)研究。
智能所在讀博士生張一鳴與華南理工大學(xué)在讀博士生余承章(中心碩士畢業(yè)生)為論文共同第一作者,丁增輝研究員和靳戰(zhàn)鵬教授為共同通訊作者。該方向的研究在智能所首席科學(xué)家孫怡寧研究員的長(zhǎng)期指導(dǎo)和大力支持下開展,得到了運(yùn)動(dòng)健康中心的大力支持,獲得了國(guó)家重點(diǎn)研發(fā)計(jì)劃課題、合肥綜合性國(guó)家科學(xué)中心醫(yī)工融合醫(yī)療裝備創(chuàng)新研究平臺(tái)項(xiàng)目和安徽省科技重大專項(xiàng)等多個(gè)科研項(xiàng)目的持續(xù)資助。
據(jù)悉,國(guó)際計(jì)算語言學(xué)年會(huì)(Annual Meeting of the Association for Computational Linguistics,簡(jiǎn)稱ACL)是計(jì)算語言學(xué)與自然語言處理領(lǐng)域的頂級(jí)國(guó)際會(huì)議,由國(guó)際計(jì)算語言學(xué)協(xié)會(huì)主辦,每年舉辦一次,是中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)推薦的A類國(guó)際學(xué)術(shù)會(huì)議。
文章鏈接:https://arxiv.org/abs/2505.04649
圖 1:醫(yī)學(xué)智能體(FRAME)架構(gòu)
圖 2:數(shù)據(jù)集構(gòu)建過程概覽。