梁文鋒,男, [3]1985年出生于廣東省湛江市,浙江大學(xué)畢業(yè),擁有信息與電子工程學(xué)系本科和碩士學(xué)位。杭州幻方科技有限公司、DeepSeek創(chuàng)始人。 [1-2] 2008年起,梁文鋒開始帶領(lǐng)團(tuán)隊(duì)使用機(jī)器學(xué)習(xí)等技術(shù)探索全自動(dòng)量化交易。2015年,幻方量化正式成立。2019年,其資金管理規(guī)模突破百億元;同年,梁文鋒在當(dāng)年的金牛獎(jiǎng)?lì)C獎(jiǎng)儀式上發(fā)表主題演講《一名程序員眼里中國量化投資的未來》。2020年開始,幻方的AI超級(jí)計(jì)算機(jī)“螢火一號(hào)”正式投入運(yùn)作。2021年,幻方投入十億建設(shè)“螢火二號(hào)”。2023年7月,幻方量化宣布成立大模型公司DeepSeek,正式進(jìn)軍通用人工智能領(lǐng)域。2024年5月,DeepSeek發(fā)布了DeepSeekV2;同年12月27日,DeepSeek-V3面世。2025年1月20日, DeepSeek正式發(fā)布DeepSeek-R1模型;同日,梁文鋒參加了中共中央政治局常委、國務(wù)院總理李強(qiáng)主持召開專家、企業(yè)家和教科文衛(wèi)體等領(lǐng)域代表座談會(huì),并在會(huì)上發(fā)言。 [1-2] 中文名梁文鋒 國 籍中國 出生日期1985年 [1] 畢業(yè)院校浙江大學(xué) [1] 就職企業(yè)DeepSeek [2] 杭州幻方科技有限公司 [2] 主要成就DeepSeek創(chuàng)始人 [1-2] 性 別男 [3] 目錄 1早年經(jīng)歷 2從業(yè)經(jīng)歷 3家庭關(guān)系 4主要貢獻(xiàn) 5社會(huì)活動(dòng) 早年經(jīng)歷 播報(bào) 編輯 1985年,梁文鋒出生于廣東省湛江市 [1-2],在廣東一個(gè)五線城市長大。 [4]2002年,17歲的梁文鋒考入浙江大學(xué)電子信息工程專業(yè),屬于電子工程系人工智能方向。 [1-2] [4] 在校期間,他對金融市場產(chǎn)生了濃厚的興趣。特別在2008年全球金融危機(jī)之際,他帶領(lǐng)團(tuán)隊(duì)探索了機(jī)器學(xué)習(xí)技術(shù)在全自動(dòng)量化交易中的應(yīng)用潛力。 [5] 本科畢業(yè)后,在浙大攻讀碩士研究生,畢業(yè)論文題目是《基于低成本PTZ攝像機(jī)的目標(biāo)跟蹤算法研究》, [1-2] [4]2010年,獲得信息與通信工程碩士學(xué)位。 [5] 從業(yè)經(jīng)歷 播報(bào) 編輯 2008年起,梁文鋒開始帶領(lǐng)團(tuán)隊(duì)使用機(jī)器學(xué)習(xí)等技術(shù)探索全自動(dòng)量化交易。 [1-2]2013年,他與浙大同學(xué)徐進(jìn)共同創(chuàng)立了杭州雅克比投資管理有限公司。 [5] 2015年,成立了杭州幻方科技有限公司,致力于通過數(shù)學(xué)和人工智能進(jìn)行量化投資。當(dāng)年的市場波動(dòng)中,幻方依靠先進(jìn)的高頻量化策略取得了很好的成績。 [2] [5] 2016年是幻方的重要轉(zhuǎn)折點(diǎn)。 [5]10月21日,幻方量化推出第一個(gè)AI模型,實(shí)現(xiàn)了所有量化策略的AI化轉(zhuǎn)型。到2017年底,幾乎所有的量化策略都采用AI模型計(jì)算。 [4-5] 2018年,幻方正式確立了以AI為核心的發(fā)展戰(zhàn)略。隨著業(yè)務(wù)的快速擴(kuò)展,算力瓶頸逐漸顯現(xiàn)。 [5]2019年,梁文鋒帶領(lǐng)團(tuán)隊(duì)自主研發(fā)了“螢火一號(hào)”訓(xùn)練平臺(tái),總投資近2億元,搭載了1100塊GPU; [1]同年,梁文鋒在當(dāng)年的金牛獎(jiǎng)?lì)C獎(jiǎng)儀式上發(fā)表主題演講《一名程序員眼里中國量化投資的未來》 [2]。2020年開始,幻方累計(jì)投資超億元、占地面積相當(dāng)于一個(gè)籃球場的AI超級(jí)計(jì)算機(jī)“螢火一號(hào)”正式投入運(yùn)作,號(hào)稱可以匹敵4萬臺(tái)個(gè)人電腦的超級(jí)算力。 [2] 2021年,“螢火二號(hào)”的投入增加到10億元,搭載了約1萬張英偉達(dá)A100顯卡; [2]幻方的資產(chǎn)管理規(guī)模突破千億大關(guān),躋身國內(nèi)量化私募領(lǐng)域的“四大天王”之列。 [1] 2023年5月,梁文鋒宣布做通用人工智能(AGI)。7月,幻方量化宣布成立大模型公司DeepSeek,即杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司,正式進(jìn)軍通用人工智能領(lǐng)域。 [2] [4] 2024年5月,DeepSeek發(fā)布了DeepSeekV2。DeepSeek-V2的API定價(jià)為每百萬tokens輸入1元、輸出2元,價(jià)格僅為GPT-4 Turbo的百分之一。 [2] [5]同年12月27日,DeepSeek-V3面世,并公布了長達(dá)53頁的訓(xùn)練和技術(shù)細(xì)節(jié)。 [2] 2025年1月20日, DeepSeek正式發(fā)布DeepSeek-R1模型。 [1-2] 家庭關(guān)系 播報(bào) 編輯 父親是小學(xué)老師。 [4] 主要貢獻(xiàn) 播報(bào) 編輯 2019年,梁文鋒帶領(lǐng)團(tuán)隊(duì)自主研發(fā)了“螢火一號(hào)”訓(xùn)練平臺(tái),總投資近2億元,搭載了1100塊GPU。兩年后,“螢火二號(hào)”的投入增加到10億元,搭載了約1萬張英偉達(dá)A100顯卡。 [1-2] 2021年,在梁文鋒參與的論文中提到,他們正在部署的螢火二號(hào)系統(tǒng),“配備了1萬張A100GPU芯片”,在性能上接近DGX-A100(英偉達(dá)推出的人工智能專用超級(jí)計(jì)算機(jī)),但成本降低了一半,同時(shí)能耗減少了40%。 [2] 2021年,幻方的資產(chǎn)管理規(guī)模突破千億大關(guān),躋身國內(nèi)量化私募領(lǐng)域的“四大天王”之列。 [1-2] 2023年,他宣布將正式進(jìn)軍通用人工智能領(lǐng)域,并創(chuàng)辦了深度求索DeepSeek,專注于做真正人類級(jí)別的人工智能。 2023年7月,幻方量化宣布成立大模型公司DeepSeek,正式進(jìn)軍通用人工智能領(lǐng)域。梁文鋒為創(chuàng)始人。 [2] 2024年5月,DeepSeek發(fā)布混合專家語言模型DeepSeek-V2。同年12月,DeepSeek-V3問世,這款性能優(yōu)越且性價(jià)比極高的大語言模型,被硅谷同行譽(yù)為“來自東方的神秘力量”。 [1] 社會(huì)活動(dòng) 播報(bào) 編輯 2025年1月20日,梁文鋒參加了中共中央政治局常委、國務(wù)院總理李強(qiáng)主持召開專家、企業(yè)家和教科文衛(wèi)體等領(lǐng)域代表座談會(huì),并在會(huì)上發(fā)言。 [1-2] 百度百科內(nèi)容由網(wǎng)友共同編輯,如您發(fā)現(xiàn)自己的詞條內(nèi)容不準(zhǔn)確或不完善,歡迎使用本人詞條編輯服務(wù)(免費(fèi))參與修正。立即前往>> 詞條圖冊更多圖冊 梁文鋒 (1張) 參考資料 1DeepSeek創(chuàng)始人梁文鋒參加總理座談會(huì),這家杭州公司藏不住了.錢江晚報(bào) [引用日期2025-01-21] 2量化巨頭幻方創(chuàng)始人梁文鋒參加總理座談會(huì)并發(fā)言,他還創(chuàng)辦了“AI界拼多多”.澎湃新聞 [引用日期2025-01-23] 3“85后”廣東小伙,緣何成為李強(qiáng)總理“座上賓”?.新浪財(cái)經(jīng) [引用日期2025-01-27] 4這家杭州科技公司創(chuàng)始人 為何成為總理的“座上賓”?.杭州網(wǎng) [引用日期2025-01-27] 5DeepSeek創(chuàng)始人梁文鋒參加總理座談會(huì),這家杭州科技公司有多厲害.錢江晚報(bào) [引用日期2025-01-27]
DeepSeek,全稱杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司,成立于2023年7月17日,是一家創(chuàng)新型科技公司,專注于開發(fā)先進(jìn)的大語言模型(LLM)和相關(guān)技術(shù)。 [4]注冊地位于浙江省杭州市拱墅區(qū)環(huán)城北路169號(hào)匯金國際大廈西1幢1201室,法定代表人為裴湉。 [7] DeepSeek的經(jīng)營范圍包括技術(shù)服務(wù)、技術(shù)開發(fā);軟件開發(fā)等。 [7]2024年1月5日,發(fā)布DeepSeek LLM,這是深度求索的第一個(gè)大模型。 [10]2024年1月25日,發(fā)布DeepSeek-Coder。 [10]2024年2月5日,發(fā)布DeepSeekMath。 [10]2024年3月11日,發(fā)布DeepSeek-VL。 [10]2024年5月7日,發(fā)布DeepSeek-V2。 [10]2024年6月17日,發(fā)布DeepSeek-Coder-V2。 [10]2024年9月5日,DeepSeek 官方更新 API 支持文檔,宣布合并 DeepSeek Coder V2 和 DeepSeek V2 Chat 兩個(gè)模型,升級(jí)推出全新的 DeepSeek V2.5 新模型。 [8]2024年12月13日,發(fā)布用于高級(jí)多模態(tài)理解的專家混合視覺語言模型——DeepSeek-VL2。 [10]2024年12月26日晚,AI公司深度求索(DeepSeek)正式上線全新系列模型DeepSeek-V3首個(gè)版本并同步開源。 [1-2]12月30日,中信證券研報(bào)指出,DeepSeek-V3的正式發(fā)版引起AI業(yè)內(nèi)廣泛高度關(guān)注,其在保證了模型能力的前提下,訓(xùn)練效率和推理速度大幅提升。中信證券研報(bào)評價(jià)DeepSeek-V3,“DeepSeek新一代模型的發(fā)布意味著AI大模型的應(yīng)用將逐步走向普惠,助力AI應(yīng)用廣泛落地;同時(shí)訓(xùn)練效率大幅提升,亦將助力推理算力需求高增。我們持續(xù)看好AI產(chǎn)業(yè)鏈的加速落地機(jī)遇,建議重點(diǎn)關(guān)注AI應(yīng)用、AI Infra、AI算力三大主線。”