從百度文心一言、阿里巴巴通義萬(wàn)相,到華為云盤(pán)古大模型、京東言犀大模型、中國(guó)移動(dòng)九天大模型……今年以來(lái),ChatGPT持續(xù)火爆,掀起人工智能大模型應(yīng)用熱潮,科技廠商爭(zhēng)先涌入,大模型新產(chǎn)品進(jìn)入“井噴”階段。據(jù)不完全統(tǒng)計(jì),目前全國(guó)已經(jīng)發(fā)布了106個(gè)大模型。
8月21日,新華社客戶(hù)端推送了蘇州工業(yè)園區(qū)人工智能產(chǎn)業(yè)專(zhuān)題調(diào)研成果。
調(diào)研發(fā)現(xiàn),當(dāng)前,蘇州工業(yè)園區(qū)以國(guó)家新一代人工智能創(chuàng)新發(fā)展試驗(yàn)區(qū)核心區(qū)建設(shè)為引領(lǐng),加強(qiáng)重點(diǎn)場(chǎng)景應(yīng)用突破、牽引行業(yè)生態(tài)集聚,依托AI大模型加速千行百業(yè)的智能化改造和數(shù)字化轉(zhuǎn)型,在為國(guó)內(nèi)大模型突破發(fā)展不斷貢獻(xiàn)代表性樣本的過(guò)程中,全力打造一流的AI大模型應(yīng)用創(chuàng)新高地。在園區(qū),從通用大模型、專(zhuān)用垂直領(lǐng)域模型到企業(yè)級(jí)GPT產(chǎn)品工具研發(fā)應(yīng)用,從語(yǔ)言計(jì)算、芯片設(shè)計(jì)到科技信息服務(wù),以大數(shù)據(jù)驅(qū)動(dòng)的通用大模型和以知識(shí)驅(qū)動(dòng)的垂直行業(yè)專(zhuān)業(yè)模型深度融合,形成多個(gè)應(yīng)用標(biāo)桿。
思必馳:DFM-2樹(shù)立語(yǔ)言大模型“新標(biāo)桿”
《中國(guó)人工智能大模型地圖研究報(bào)告》顯示,自然語(yǔ)言處理是目前大模型研發(fā)最活躍的重點(diǎn)領(lǐng)域,數(shù)量達(dá)49個(gè),占比超過(guò)60%。然而,通用語(yǔ)言大模型在行業(yè)應(yīng)用中面臨真實(shí)性存疑,私域知識(shí)難包含、不準(zhǔn)確,判別式任務(wù)精度及時(shí)效性不足等問(wèn)題,再加上模型訓(xùn)練所需數(shù)據(jù)量巨大,在實(shí)際應(yīng)用中還存在成本高、速度慢等缺陷。
思必馳科技股份有限公司(以下簡(jiǎn)稱(chēng)“思必馳”)聯(lián)合創(chuàng)始人、首席科學(xué)家俞凱認(rèn)為,行業(yè)語(yǔ)言計(jì)算大模型在解決這些問(wèn)題方面更具優(yōu)勢(shì),因其既具備情境理解、指令學(xué)習(xí)等通用智能及知識(shí),又能夠在行業(yè)場(chǎng)景落地中實(shí)現(xiàn)個(gè)性化知識(shí)技能定制、小型化低成本部署、全鏈路低延遲交互等,通過(guò)大模型與對(duì)話式語(yǔ)言技術(shù)的聯(lián)動(dòng),能夠?yàn)橛脩?hù)帶來(lái)更優(yōu)質(zhì)的體驗(yàn)。
思必馳DFM-2發(fā)布會(huì)現(xiàn)場(chǎng)
作為國(guó)內(nèi)最早開(kāi)啟對(duì)話式人工智能系列技術(shù)研發(fā)的公司之一,思必馳在對(duì)話式語(yǔ)言基礎(chǔ)大模型領(lǐng)域技術(shù)積累豐厚,2021年提出Dialogue Foundation Model(DFM)模型,率先實(shí)現(xiàn)集理解、生成、表征三大能力為一體;2022年發(fā)布DialogZoo數(shù)據(jù)集,是目前國(guó)際上最全的公開(kāi)對(duì)話研究數(shù)據(jù)集合平臺(tái);今年7月正式發(fā)布百億參數(shù)行業(yè)語(yǔ)言計(jì)算大模型DFM-2,在通用場(chǎng)景28項(xiàng)任務(wù)上做到行業(yè)領(lǐng)先。
據(jù)介紹,作為具有通用智能的行業(yè)語(yǔ)言大模型,DFM-2既具備常識(shí)問(wèn)答、內(nèi)容生成、數(shù)學(xué)計(jì)算和代碼生成等通用智能能力,又與全鏈路綜合對(duì)話技術(shù)聯(lián)動(dòng),可以實(shí)現(xiàn)具體的場(chǎng)景化落地,滿(mǎn)足行業(yè)個(gè)性化需求,有效解決技術(shù)廠商的通用型技術(shù)與B端企業(yè)高度靈活的個(gè)性化需求無(wú)法匹配的行業(yè)痛點(diǎn)。
以物聯(lián)網(wǎng)領(lǐng)域?yàn)槔悄芙K端存在算力各異、需求分散、場(chǎng)景龐雜、定制需求多、完整交互體驗(yàn)要求高等特點(diǎn),這決定了通用人工智能技術(shù)很難在復(fù)雜多變的智能終端和應(yīng)用場(chǎng)景中落地。思必馳基于通用人工智能技術(shù)不斷發(fā)展完善自身的產(chǎn)品標(biāo)準(zhǔn)化能力和規(guī);ㄖ颇芰,能夠支持客戶(hù)自主構(gòu)建個(gè)性化語(yǔ)音交互解決方案,滿(mǎn)足不同場(chǎng)景復(fù)雜個(gè)性化需求,實(shí)現(xiàn)人工智能的柔性定制,大大提升標(biāo)準(zhǔn)化軟硬件產(chǎn)品的“非標(biāo)交付”效率。
為進(jìn)一步滿(mǎn)足市場(chǎng)的多元化需求,思必馳將全鏈路智能對(duì)話系統(tǒng)定制開(kāi)發(fā)平臺(tái)(DUI)與DFM-2大模型相結(jié)合,推出DUI 2.0,完成對(duì)話式AI全鏈路技術(shù)升級(jí)。目前,DUI 2.0已在智能汽車(chē)、智能家居、政務(wù)服務(wù)、醫(yī)療健康、科學(xué)研究等領(lǐng)域得到應(yīng)用,例如思必馳自研的汽車(chē)語(yǔ)音助手天琴系統(tǒng),會(huì)議辦公類(lèi)軟硬件產(chǎn)品“麥耳會(huì)記”、AI轉(zhuǎn)寫(xiě)麥克風(fēng)音箱M6、AI追蹤雙目語(yǔ)音攝像頭C60等均已上市并得到廣泛應(yīng)用。
俞凱表示,未來(lái),思必馳將緊抓科技部“語(yǔ)言計(jì)算國(guó)家新一代人工智能開(kāi)放創(chuàng)新平臺(tái)”建設(shè)機(jī)遇,持續(xù)深入應(yīng)用場(chǎng)景,基于DFM-2大模型能力及相關(guān)技術(shù)成果,與專(zhuān)有場(chǎng)景深度結(jié)合,打造更具行業(yè)特色的專(zhuān)用模型,賦能千行百業(yè)。
智慧芽:“AIGC+搜索引擎”打造科技創(chuàng)新信息服務(wù)“智能助手”
科技情報(bào)是科技創(chuàng)新不可或缺的戰(zhàn)略資源。研究表明,科研人員充分利用專(zhuān)利情報(bào),能節(jié)約科研經(jīng)費(fèi)40-50%,節(jié)省科研時(shí)間60-70%。隨著科學(xué)研究范式發(fā)生深刻變革,傳統(tǒng)的科技信息服務(wù)已無(wú)法滿(mǎn)足實(shí)際創(chuàng)新需求,且海量數(shù)據(jù)的人工處理成本極高,制約了科技創(chuàng)新效率進(jìn)一步提升。
“大語(yǔ)言模型等人工智能相關(guān)技術(shù)的突破,極大提升了科技創(chuàng)新信息獲取效率,將催生全新形態(tài)的產(chǎn)品服務(wù)。”智慧芽信息科技(蘇州)有限公司(以下簡(jiǎn)稱(chēng)“智慧芽”)創(chuàng)始人兼CEO張濟(jì)徽說(shuō)。實(shí)際上,將GPT大模型技術(shù)引入科技創(chuàng)新信息服務(wù)領(lǐng)域,需要具備一系列條件,如要有覆蓋面足夠廣泛的研發(fā)數(shù)據(jù)庫(kù),建立專(zhuān)門(mén)針對(duì)該領(lǐng)域的數(shù)據(jù)分析算法模型,形成相對(duì)完備的產(chǎn)品矩陣以滿(mǎn)足研發(fā)人員的多元化需求等。
智慧芽專(zhuān)利數(shù)據(jù)庫(kù)服務(wù)界面
其中,數(shù)據(jù)資源是核心要素。1.76億+全球?qū)@麛?shù)據(jù)、1.6億+科技文獻(xiàn)數(shù)據(jù),260萬(wàn)+科研資助信息、86萬(wàn)+投資信息,6.1萬(wàn)+全球新藥數(shù)據(jù)、4.4萬(wàn)+靶點(diǎn)數(shù)據(jù)……作為科技創(chuàng)新信息服務(wù)商,智慧芽多年來(lái)積累的海量專(zhuān)利文獻(xiàn)數(shù)據(jù)、科研信息數(shù)據(jù)和生物醫(yī)藥數(shù)據(jù),為訓(xùn)練類(lèi)GPT大模型奠定了扎實(shí)的數(shù)據(jù)基礎(chǔ)。在算法層面,智慧芽運(yùn)用深度學(xué)習(xí)、自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)以及預(yù)訓(xùn)練語(yǔ)言模型等技術(shù),在海量全球多語(yǔ)言技術(shù)文本中進(jìn)行自動(dòng)化、智能化的數(shù)據(jù)分析與文本挖掘,并實(shí)現(xiàn)深層次語(yǔ)義分析。
今年以來(lái),智慧芽將大模型技術(shù)引入科技創(chuàng)新信息服務(wù)領(lǐng)域,計(jì)劃于年內(nèi)推出基于知識(shí)產(chǎn)權(quán)與研發(fā)創(chuàng)新場(chǎng)景開(kāi)發(fā)的大語(yǔ)言模型“智慧芽GPT”,并同步上線專(zhuān)利檢索專(zhuān)家、技術(shù)交底書(shū)助手、技術(shù)研發(fā)助理等功能,幫助研發(fā)人員自動(dòng)編寫(xiě)復(fù)雜檢索式、自動(dòng)撰寫(xiě)技術(shù)交底書(shū),且能夠?qū)υ捠浇獯鹧邪l(fā)人員的技術(shù)問(wèn)題。
“當(dāng)前,科技創(chuàng)新信息服務(wù)仍停留在工具階段,不能稱(chēng)之為強(qiáng)大助手。例如大部分專(zhuān)利數(shù)據(jù)庫(kù)本質(zhì)上就是專(zhuān)利領(lǐng)域的搜索引擎,返回的是大量技術(shù)文檔而非直接答案,很難滿(mǎn)足用戶(hù)復(fù)雜、結(jié)構(gòu)化的需求。”張濟(jì)徽說(shuō),智慧芽的目標(biāo)是打造“AIGC+搜索引擎”新模式,當(dāng)用戶(hù)提出問(wèn)題后,該應(yīng)用可快速理解用戶(hù)意圖,并從相關(guān)搜索結(jié)果中給出經(jīng)處理的總結(jié)性回答。未來(lái),通過(guò)調(diào)用智慧芽底層的產(chǎn)品能力,用戶(hù)僅需通過(guò)一個(gè)聊天框輸入問(wèn)題就能快速得到想要的答案,為科技創(chuàng)新信息服務(wù)打造真正強(qiáng)大的“智能助手”。
異格技術(shù):借力企業(yè)級(jí)GPT產(chǎn)品推動(dòng)芯片研發(fā)設(shè)計(jì)跑出“加速度”
一邊,借助公用大模型,自研企業(yè)辦公工具和知識(shí)庫(kù),輔助員工進(jìn)行代碼開(kāi)發(fā)、技術(shù)手冊(cè)編寫(xiě)等;一邊,積極研發(fā)部署內(nèi)部私有大模型,實(shí)現(xiàn)對(duì)內(nèi)部代碼的生成、審查、注釋等功能,顯著提升研發(fā)效率……位于蘇州工業(yè)園區(qū)的蘇州異格技術(shù)有限公司(以下簡(jiǎn)稱(chēng)“異格技術(shù)”)專(zhuān)注于國(guó)產(chǎn)高端FPGA芯片的研發(fā)與設(shè)計(jì),該企業(yè)幾年前便著手布局大模型等AI技術(shù)工具在芯片設(shè)計(jì)領(lǐng)域的應(yīng)用,今年更是引入專(zhuān)業(yè)高層次人才,并成立單獨(dú)部門(mén)專(zhuān)項(xiàng)負(fù)責(zé)相關(guān)技術(shù)研發(fā),初步成效開(kāi)始顯現(xiàn)。
高性能芯片設(shè)計(jì)比較復(fù)雜,需要花費(fèi)大量的時(shí)間和人力成本。在設(shè)計(jì)過(guò)程中,任何一個(gè)錯(cuò)誤都可能導(dǎo)致大量時(shí)間和資源的浪費(fèi),甚至導(dǎo)致整個(gè)項(xiàng)目的失敗。“把大模型技術(shù)引入芯片設(shè)計(jì)領(lǐng)域,能夠大幅減少研發(fā)過(guò)程中一部分重復(fù)且繁雜的工作,縮短產(chǎn)品開(kāi)發(fā)周期,還可以幫助設(shè)計(jì)師整合通信、控制和信號(hào)處理等不同領(lǐng)域知識(shí),以實(shí)現(xiàn)更高效和創(chuàng)新的設(shè)計(jì)。”異格技術(shù)相關(guān)部門(mén)負(fù)責(zé)人說(shuō)。
目前,異格技術(shù)正在嘗試將大模型技術(shù)應(yīng)用于芯片驗(yàn)證中,對(duì)部分公開(kāi)協(xié)議代碼的研發(fā)已經(jīng)實(shí)現(xiàn)明顯的效率提升。該企業(yè)還利用公用大模型API構(gòu)建了飛書(shū)機(jī)器人,實(shí)現(xiàn)對(duì)公用大模型信息交互的安全管控,飛書(shū)機(jī)器人中內(nèi)置各種角色,支持語(yǔ)言對(duì)話、圖像生成等功能,極大提升員工辦公效率。
在使用公用大模型基礎(chǔ)上,異格技術(shù)嘗試構(gòu)建內(nèi)部知識(shí)庫(kù),對(duì)代碼或文檔進(jìn)行深層次分析,包括頂層架構(gòu)、代碼細(xì)節(jié)設(shè)計(jì)到算法、數(shù)據(jù)結(jié)構(gòu),通過(guò)整合公司內(nèi)部的文檔和API參考,使開(kāi)發(fā)人員更方便查找所需內(nèi)部信息,提高開(kāi)發(fā)效率。
“下一步,我們計(jì)劃研發(fā)采用FPGA芯片的AIGC大模型企業(yè)級(jí)私有化部署方案。該方案專(zhuān)注對(duì)模型進(jìn)行優(yōu)化壓縮(量化、剪枝等)以更適配FPGA芯片,同時(shí)更好滿(mǎn)足金融、通信、邊緣計(jì)算等領(lǐng)域應(yīng)用需求。”異格技術(shù)相關(guān)部門(mén)負(fù)責(zé)人說(shuō)。
278平方公里不算寬廣的土地上,大模型技術(shù)與各細(xì)分場(chǎng)景的融合應(yīng)用,正以極高的密度涌現(xiàn)并逐步走向“深水區(qū)”。
目前,一大批園區(qū)企業(yè)正基于原有人工智能技術(shù)和行業(yè)數(shù)據(jù)積累,積極布局通用大模型、專(zhuān)用垂直領(lǐng)域模型以及企業(yè)級(jí)GPT產(chǎn)品工具研發(fā)和應(yīng)用等大模型賽道,推動(dòng)技術(shù)創(chuàng)新、場(chǎng)景落地和生態(tài)建構(gòu)。如美能華智借助大模型技術(shù)及互聯(lián)網(wǎng)海量中英文語(yǔ)料,開(kāi)發(fā)企業(yè)級(jí)大語(yǔ)言模型——星語(yǔ)大語(yǔ)言模型,并推出星語(yǔ)專(zhuān)家系統(tǒng)、小星助手兩款應(yīng)用產(chǎn)品,服務(wù)范圍涉及政務(wù)、金融、跨境物流、醫(yī)療健康等多個(gè)領(lǐng)域。企查查發(fā)布全球首款商查大模型——企查查“知彼阿爾法”,百圖生科研發(fā)生命科學(xué)大模型驅(qū)動(dòng)的AIGP(AI Generated Protein)平臺(tái),清睿教育發(fā)布教育領(lǐng)域清睿ArynGPT大模型等。
AI大模型應(yīng)用同時(shí)帶動(dòng)算力需求猛增。據(jù)統(tǒng)計(jì),園區(qū)僅30家人工智能核心企業(yè)的算力需求就達(dá)到172 PFLOPS。依托國(guó)科數(shù)據(jù)中心這一亞洲首家按照國(guó)際數(shù)據(jù)中心行業(yè)最高等級(jí)(Tier IV)標(biāo)準(zhǔn)設(shè)計(jì)和建設(shè)的第三方專(zhuān)業(yè)數(shù)據(jù)中心,該區(qū)正加快構(gòu)建多云互聯(lián)、算力互聯(lián)新模式,與華為云等主流云服務(wù)商以及上海超算中心、昆山超算中心、合肥先進(jìn)計(jì)算中心等加強(qiáng)合作,充分利用本地自建算力單位,提升算力調(diào)度能力,實(shí)現(xiàn)算力資源的橫向擴(kuò)展,滿(mǎn)足企業(yè)算力需求。
為進(jìn)一步推動(dòng)大模型的應(yīng)用推廣,搶抓AIGC新賽道,園區(qū)將以國(guó)家新一代人工智能創(chuàng)新發(fā)展試驗(yàn)區(qū)核心區(qū)建設(shè)為引領(lǐng),加強(qiáng)垂直領(lǐng)域攻關(guān),實(shí)現(xiàn)重點(diǎn)場(chǎng)景應(yīng)用突破,豐富行業(yè)應(yīng)用生態(tài),緊跟大模型相關(guān)技術(shù)發(fā)展趨勢(shì),加速匯聚高端資源,堅(jiān)持以產(chǎn)業(yè)創(chuàng)新為引領(lǐng)、科技創(chuàng)新為動(dòng)力、開(kāi)放創(chuàng)新為支撐,通過(guò)AI大模型應(yīng)用創(chuàng)新高地建設(shè),為開(kāi)放創(chuàng)新的世界一流高科技園區(qū)增添更多動(dòng)力。
<愛(ài)上你,愛(ài)上新江南網(wǎng):loginbisaqq.com www.xjnnet.net,loginbisaqq.com歡迎您!>聲明:
本文僅代表作者個(gè)人觀點(diǎn),與新江南網(wǎng)無(wú)關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,請(qǐng)讀者僅作參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容,新江南網(wǎng)號(hào)系信息發(fā)布平臺(tái),新江南網(wǎng)僅提供信息存儲(chǔ)空間服務(wù)。如有侵權(quán)請(qǐng)出示權(quán)屬憑證聯(lián)系管理員(yin040310@sina.com)刪除!
閱讀推薦
新聞爆料
圖片精選
點(diǎn)擊排行