在信息急劇增長(zhǎng)的時(shí)代,科研工作者們往往面臨著海量的文獻(xiàn)資料和繁瑣的數(shù)據(jù)處理任務(wù)。為了幫助大家更高效地進(jìn)行水科學(xué)領(lǐng)域的研究,北京大學(xué)環(huán)境科學(xué)與工程學(xué)院基于百度文心大模型推出了全新的水科學(xué)研究助手——WaterScholar!它基于強(qiáng)大的文獻(xiàn)數(shù)據(jù)庫(kù)和檢索增強(qiáng)技術(shù) RAG,讓您輕松查詢文獻(xiàn)、梳理引言、總結(jié)內(nèi)容、回答問(wèn)題,現(xiàn)已在星河社區(qū)上線,歡迎相關(guān)領(lǐng)域?qū)I(yè)人士與高校師生體驗(yàn)!
01
響應(yīng)科研需求,創(chuàng)新科技助力
水科學(xué)作為一門(mén)綜合性學(xué)科,涉及水文水循環(huán)、給排水、水環(huán)境化學(xué)、水污染控制、水生態(tài)修復(fù)與保護(hù)、水系統(tǒng)可持續(xù)管理、氣候變化等研究領(lǐng)域,與泥沙、礦物質(zhì)、鹽類、有機(jī)質(zhì)、溶解性氣體、重金屬、化學(xué)污染物、蛋白質(zhì)、藻類、浮游動(dòng)物、魚(yú)類、鳥(niǎo)類、水生植被等物質(zhì)或生命體關(guān)系密切,其研究?jī)?nèi)容廣泛而復(fù)雜,發(fā)表的相關(guān)文獻(xiàn)累積已超過(guò)1500萬(wàn)篇,并且每年正在以超百萬(wàn)量級(jí)的速度增長(zhǎng)。
水科學(xué)研究領(lǐng)域?qū)φ泶罅康目蒲形墨I(xiàn)的需求愈發(fā)強(qiáng)烈,然而,傳統(tǒng)的文獻(xiàn)檢索和信息整理方式往往耗時(shí)耗力,難以滿足深入挖掘潛在信息、梳理前沿進(jìn)展、探索問(wèn)題新方案等日益增長(zhǎng)的需求。水科學(xué)研究范式亟需拓展,尤其是文獻(xiàn)梳理、知識(shí)學(xué)習(xí)以及科研輔助。
因此,北京大學(xué)環(huán)境科學(xué)與工程學(xué)院劉永教授研究組攜手百度 AI,推出水科學(xué)研究助手WaterScholar,旨在通過(guò)智能化的方式,簡(jiǎn)化科研流程,提高研究效率,讓科研工作者們能夠更專注于研究本身,發(fā)掘更多有價(jià)值的科研成果。更多信息請(qǐng)前往官網(wǎng)介紹(
https://www.waterscholar.com)。
▎體驗(yàn)鏈接(請(qǐng)登錄后使用,多工具智能編排邀測(cè)中,分鐘級(jí)通過(guò)白名單審核)
https://aistudio.baidu.com/community/app/70479/webUI
02
輕松上手,知識(shí)速成
WaterScholar 基于飛槳星河社區(qū)(AI Studio)平臺(tái)開(kāi)發(fā),底層大模型為文心大模型。目前階段實(shí)現(xiàn)的主要功能為查詢水相關(guān)領(lǐng)域文獻(xiàn)、圍繞關(guān)鍵詞撰寫(xiě)引言、總結(jié)概括簡(jiǎn)化內(nèi)容、根據(jù)文獻(xiàn)回答問(wèn)題,希望能為對(duì)水科學(xué)研究領(lǐng)域感興趣的用戶提供幫助,包括研究人員、學(xué)生、工程師等。
■ 功能1:查詢水相關(guān)領(lǐng)域文獻(xiàn)
功能描述: 根據(jù)提供的關(guān)鍵詞信息在數(shù)據(jù)庫(kù)中檢索相關(guān)的文獻(xiàn)信息,并生成相應(yīng)的文本文件;
返回結(jié)果: 返回查詢到的文獻(xiàn)內(nèi)容、下載鏈接和提示信息。
■ 功能2:圍繞關(guān)鍵詞撰寫(xiě)引言
功能描述: 根據(jù)傳入的關(guān)鍵詞撰寫(xiě)水科學(xué)領(lǐng)域的英文引言,引言長(zhǎng)度在800-1200詞之間,內(nèi)容包括研究問(wèn)題的重要性、相關(guān)研究進(jìn)展、存在的問(wèn)題或不足、以及將要開(kāi)展的研究?jī)?nèi)容;
返回結(jié)果: 返回撰寫(xiě)好的英文引言內(nèi)容和提示信息。
■ 功能3:總結(jié)概括簡(jiǎn)化內(nèi)容
功能描述: 根據(jù)傳入的文獻(xiàn)摘要內(nèi)容進(jìn)行總結(jié),并去除無(wú)關(guān)信息,返回簡(jiǎn)要介紹;
返回結(jié)果: 返回總結(jié)后的文獻(xiàn)摘要內(nèi)容和提示信息。
■ 功能4:根據(jù)文獻(xiàn)回答問(wèn)題
功能描述: 根據(jù)文檔內(nèi)容回答提供的問(wèn)題;
返回結(jié)果: 返回根據(jù)文檔內(nèi)容回答問(wèn)題的結(jié)果和提示信息。
03
技術(shù)方案:文獻(xiàn)數(shù)據(jù)庫(kù)+RAG
智能處理更高效
WaterScholar 的強(qiáng)大功能得益于其背后的兩大核心:文獻(xiàn)數(shù)據(jù)庫(kù)和 RAG 技術(shù)。首先,數(shù)據(jù)庫(kù)基于在線文獻(xiàn)數(shù)據(jù)集(英文),獲取到水科學(xué)領(lǐng)域的關(guān)鍵文獻(xiàn)清單。其中文獻(xiàn)來(lái)自于水科學(xué)領(lǐng)域數(shù)千種學(xué)術(shù)期刊和會(huì)議,數(shù)量超過(guò)300萬(wàn)篇,信息包含題目、摘要、作者、時(shí)間、研究對(duì)象、研究問(wèn)題與方法等。通過(guò)語(yǔ)義相似性匹配等智能搜索算法從文獻(xiàn)摘要信息中快速準(zhǔn)確地找到與用戶關(guān)鍵詞相關(guān)的文獻(xiàn)列表,處理為可下載的文件鏈接。鏈接分為兩部分:文獻(xiàn)清單與文獻(xiàn)摘要,提供豐富的研究素材,用戶可下載文件并在本地閱讀與使用。其次,RAG(Retrieval-Augmented Generation)是一種將檢索技術(shù)與語(yǔ)言生成技術(shù)相結(jié)合的創(chuàng)新方法,旨在提高搜索結(jié)果的準(zhǔn)確性和多樣性,實(shí)現(xiàn)對(duì)文獻(xiàn)內(nèi)容的深度理解和智能處理。它能夠自動(dòng)提取文獻(xiàn)中的關(guān)鍵信息,生成高質(zhì)量的引言和總結(jié),并根據(jù)用戶的需求提供有針對(duì)性的回答,提高了工作效率,降低人為因素導(dǎo)致的誤差和遺漏。
WaterScholar 充分發(fā)揮了北大環(huán)境學(xué)院在專業(yè)領(lǐng)域的資源優(yōu)勢(shì)和百度文心大模型的技術(shù)優(yōu)勢(shì)。首先,文心大模型的解析調(diào)度模塊可根據(jù)用戶輸入確定是否使用工具 API 及解析參數(shù)取值,并發(fā)出啟用服務(wù)命令;WaterScholar 收到請(qǐng)求后提取 API 需要的參數(shù),完成文獻(xiàn)查詢、結(jié)果處理、文件生成等功能,并將其摘要緩存在服務(wù)器端;工具服務(wù)完成處理后,以 json 格式返回由摘要緩存、用戶需求、prompt 模板形成的數(shù)據(jù);文心大模型匯總結(jié)果并按要求智能生成答案。
04
團(tuán)隊(duì)介紹
劉永
北京大學(xué)教授、環(huán)境科學(xué)與工程學(xué)院院長(zhǎng)
國(guó)家環(huán)境保護(hù)河流全物質(zhì)通量重點(diǎn)實(shí)驗(yàn)室副主任
主要研究方向?yàn)楹?流域過(guò)程與調(diào)控,主持國(guó)家水專項(xiàng)、973計(jì)劃青年項(xiàng)目等,發(fā)表 SCI 論文150余篇,出版第1作者專著5部;獲中國(guó)青年科技獎(jiǎng)、中國(guó)生態(tài)環(huán)境十大科技進(jìn)展等,兼任教育部科技委委員、Limnology and Oceanography 副主編等。
蔣青松
北京大學(xué)環(huán)境科學(xué)與工程學(xué)院助理研究員
主要研究方向?yàn)榱饔蚩茖W(xué)與機(jī)器學(xué)習(xí)算法,發(fā)表論文17篇,以第一作者申請(qǐng)授權(quán)軟件著作權(quán)6項(xiàng),出版專著2部;獲國(guó)家青年自然科學(xué)基金項(xiàng)目資助。
05
常見(jiàn)問(wèn)題解答,讓您更放心使用
為了讓大家更好地使用 WaterScholar,整理一些常見(jiàn)的問(wèn)題和解答:
■ Q1: WaterScholar 與相似產(chǎn)品有何不同?
本項(xiàng)目開(kāi)展的 WaterScholar 將更加聚焦于水體研究領(lǐng)域,雖然涉及眾多自然學(xué)科,但主體圍繞水體進(jìn)行知識(shí)問(wèn)答或引言梳理,提供更加專業(yè)性的事實(shí)依據(jù)和知識(shí)生成服務(wù)。
■ Q2: 文獻(xiàn)如何實(shí)現(xiàn)匹配與排序?
目前 WaterScholar 通過(guò)后端程序?qū)崿F(xiàn)云端數(shù)據(jù)庫(kù)的訪問(wèn),根據(jù)用戶查詢文獻(xiàn)時(shí)輸入的關(guān)鍵詞與數(shù)據(jù)庫(kù)中的文獻(xiàn)摘要計(jì)算文本相似性,按照相似性得分高低排序,并返回前20篇文獻(xiàn)。
■ Q3: 文獻(xiàn)來(lái)源是否真實(shí)可靠?
文獻(xiàn)全部來(lái)自于 SCI 數(shù)據(jù)庫(kù),保留了含有摘要的300余百萬(wàn)篇文獻(xiàn),信息來(lái)源真實(shí)可靠;包含的信息還包括年份、題目、作者、DOI 鏈接、期刊、關(guān)鍵詞、引用數(shù)、研究領(lǐng)域等。
■ Q4: WaterScholar是否支持多種語(yǔ)言?
目前,WaterScholar 主要支持中文和英文,其中查詢文獻(xiàn)時(shí)建議使用英文關(guān)鍵詞進(jìn)行檢索,使專業(yè)術(shù)語(yǔ)的語(yǔ)義匹配更準(zhǔn)確;后續(xù)逐步增加對(duì)其他語(yǔ)言的支持。
■ Q5: 我是否可以修改生成的提示詞?
生寫(xiě)一段質(zhì)量較好的答案需要復(fù)雜的提示詞,包括對(duì)文字長(zhǎng)短、內(nèi)容要點(diǎn)、格式等方面的約束。目前已經(jīng)在工具中準(zhǔn)備了必要的提示詞,但用戶可以明確提出自己重點(diǎn)關(guān)心的問(wèn)題,大模型據(jù)此關(guān)鍵要點(diǎn)進(jìn)行引言梳理。
■ Q6: WaterScholar 生成的引言和總結(jié)是否可以直接用于論文?
WaterScholar 生成的引言和總結(jié)是基于文獻(xiàn)內(nèi)容的智能提取和整理,可以作為論文的參考素材。但建議您在使用前進(jìn)行修改和完善,以確保符合論文的專業(yè)要求和風(fēng)格。
■ Q7: 使用 WaterScholar 是否免費(fèi),訪問(wèn)需要國(guó)外 VPN?
WaterScholar 完全免費(fèi),在國(guó)內(nèi)聯(lián)網(wǎng)條件下直接使用即可。
■ Q8: 如何提交使用反饋意見(jiàn)?
可進(jìn)入問(wèn)卷星(
https://www.wjx.cn/vm/t2VFw02.aspx),完成問(wèn)卷需花費(fèi)一分鐘左右,感謝您提出寶貴意見(jiàn)!
06
未來(lái)優(yōu)化升級(jí)計(jì)劃
隨著人工智能技術(shù)發(fā)展和科研需求的不斷變化,該項(xiàng)目將在北大環(huán)境學(xué)院以及相關(guān)領(lǐng)域推廣試用,持續(xù)優(yōu)化 WaterScholar 的功能與性能。主要計(jì)劃如下:
(1)完善文獻(xiàn)數(shù)據(jù)庫(kù),補(bǔ)充中文期刊文獻(xiàn)數(shù)據(jù),增加更多的學(xué)術(shù)資源和數(shù)據(jù)支持;
(2)緊跟技術(shù)發(fā)展,增加大語(yǔ)言模型對(duì)長(zhǎng)文本的支持能力;
(3)加強(qiáng) RAG 技術(shù)的研究和應(yīng)用,將目前的段落級(jí)別匹配提升為語(yǔ)句級(jí)別識(shí)別,提高智能處理的準(zhǔn)確性和效率;
(4)升級(jí) WaterScholar 為 AI Agent 模式,增加數(shù)據(jù)分析、多角色交互、調(diào)用外部工具等功能;
(5)優(yōu)化工具訪問(wèn)速度。
相信 WaterScholar 將成為水科學(xué)研究領(lǐng)域不可或缺的重要工具,為科研工作者們提供更加便捷、高效的服務(wù)。誠(chéng)邀廣大科研工作者們前來(lái)體驗(yàn) WaterScholar 的魅力,攜手推動(dòng)水科學(xué)研究的進(jìn)一步發(fā)展!請(qǐng)前往星河社區(qū)平臺(tái)使用,開(kāi)啟您的智能科研之旅吧!
百度飛槳星河社區(qū)通過(guò)提供各類教育資源,包括課程、算力支持、開(kāi)發(fā)工具與平臺(tái)、合作交流機(jī)會(huì)等多方面的服務(wù),有力推動(dòng)了各個(gè)高校不同專業(yè)領(lǐng)域的“AI+”應(yīng)用發(fā)展。高校研究者和開(kāi)發(fā)者可基于文心大模型進(jìn)行模型訓(xùn)練、工具開(kāi)發(fā)、智能體開(kāi)發(fā)等,建設(shè)教學(xué)、科研、管理等場(chǎng)景的應(yīng)用。歡迎感興趣的高校與我們聯(lián)系,填寫(xiě)以上問(wèn)卷或發(fā)送郵件至paddle-up@baidu.com。