近日,廣東東陽光藥業(yè)股份有限公司(以下簡稱:東陽光藥)宣布接入Deepseek,啟動AI+全面戰(zhàn)略布局。
東陽光藥將從算力基礎(chǔ)設(shè)施建設(shè)、AI賦能藥物研發(fā)管線、AIDD智算模型構(gòu)建、再到AI產(chǎn)研生態(tài)圈的全方位、多維度探索中逐步形成“AI賦能產(chǎn)業(yè)落地實踐”的優(yōu)勢路徑。這一路徑不僅促進了創(chuàng)新研發(fā)的提質(zhì)增效,也逐漸在多場景中成功落地。
科研過程海量的文獻和專利閱讀是巨大挑戰(zhàn)。在科研數(shù)據(jù)收集獲取時,數(shù)據(jù)分散、格式雜亂,形成數(shù)據(jù)孤島;且知識更新速度快,獲取信息困難;靶點調(diào)研依賴于人工檢索、閱讀、篩選以及信息的提取與匯總,工作量巨大且效率較低。
此次東陽光藥與深勢科技的合作,將構(gòu)建新一代AI文獻與專利數(shù)據(jù)庫檢索、問答、分析管理大模型平臺——HEC-Finder。該平臺聚焦藥物研發(fā),為科研人員提供科學(xué)文獻的智能檢索、分析及關(guān)鍵信息提取等功能,助力研發(fā)效率提升。
圖1 HEC-Finder文獻閱讀問答示例
據(jù)介紹,該款多模態(tài)文獻研讀工具,底層訓(xùn)練了大量藥物研發(fā)相關(guān)科學(xué)文獻,通過整合文本、圖表和圖像等多種數(shù)據(jù)格式,提供全面的內(nèi)容解析與提取。在藥物開發(fā)領(lǐng)域幫助科研人員識別研究趨勢,從海量的文獻中提取有針對性的信息。
該平臺可以實現(xiàn)專利數(shù)據(jù)的自動化更新、精準(zhǔn)檢索和深度分析;快速提取化合物結(jié)構(gòu)和活性信息,提高研發(fā)效率;自動化快速判定結(jié)構(gòu)專利侵權(quán)情況,降低法律風(fēng)險。
圖2 HEC-Finder文檔信息抽取示例
通過私有化部署,保障核心數(shù)據(jù)資產(chǎn)安全,通過領(lǐng)域微調(diào),提升模型在特定領(lǐng)域的準(zhǔn)確性和適應(yīng)性。目前該平臺已上線并投入使用。
東陽光藥已將DeepSeek大模型全面接入 HEC-Finder平臺,充分釋放AI在文獻專利智能應(yīng)用的潛能。
未來,Deepseek大模型將更深入得應(yīng)用于東陽光藥AI4S各個科學(xué)研發(fā)領(lǐng)域,從而進一步加速管線項目研發(fā)效率提升并提高研發(fā)成功率。
來源:創(chuàng)新松山湖