App下載

新范式:AIGC推動(dòng)的數(shù)據(jù)要素產(chǎn)業(yè)價(jià)值促進(jìn)創(chuàng)新

百林哲 2024-08-08 17:42:36 瀏覽數(shù) (1263)
反饋

引言

大模型的發(fā)展與數(shù)據(jù)要素的價(jià)值創(chuàng)造互為因果,LLM正推動(dòng)著數(shù)據(jù)要素以“激發(fā)AGI”的全新范式創(chuàng)造價(jià)值。如何有效地整合規(guī)模化、高質(zhì)量的數(shù)據(jù)以用于大型模型的訓(xùn)練,不僅是推進(jìn)大模型發(fā)展的窗口,也將成為進(jìn)一步發(fā)掘數(shù)據(jù)要素潛在價(jià)值的關(guān)鍵動(dòng)力。遵循技術(shù)發(fā)展的規(guī)律和市場(chǎng)的原則,將有助于各企業(yè)篩選并確定發(fā)展通用大模型與行業(yè)特定大模型的獨(dú)特路徑。


01 從人工智能發(fā)展歷程,看數(shù)據(jù)要素價(jià)值創(chuàng)造



自2022年末至2024年初,GPT以其卓越的表現(xiàn)引起了廣泛關(guān)注。隨著Sora的誕生,短時(shí)間內(nèi)智能的極限被不斷突破。我們目睹了數(shù)據(jù)價(jià)值的極大增強(qiáng):大型模型通過吸收海量數(shù)據(jù),掌握了人類的語(yǔ)言模式、邏輯推理,在諸如文本創(chuàng)作、多語(yǔ)種翻譯、情緒識(shí)別、復(fù)雜問題解構(gòu)與執(zhí)行等眾多領(lǐng)域取得了翻天覆地的成就,甚至能夠在視頻制作中模擬物理動(dòng)作,因此,被譽(yù)為“世界模擬器”。數(shù)據(jù)不單是構(gòu)建這些復(fù)雜模型的根基,更是推進(jìn)它們持續(xù)進(jìn)化的源泉。

 

在美國(guó)20世紀(jì)70年代的一場(chǎng)語(yǔ)音識(shí)別競(jìng)賽中,展現(xiàn)了兩種截然不同的設(shè)計(jì):一種是借助于人類豐富的知識(shí),深入挖掘?qū)θ祟愓Z(yǔ)言的理解,通過手工編寫的規(guī)則來(lái)描述語(yǔ)音與語(yǔ)言的結(jié)構(gòu),例如將音節(jié)組合成單詞,或根據(jù)上下文確定單詞的發(fā)音。另一種是依賴于海量的數(shù)據(jù),采用統(tǒng)計(jì)從大量語(yǔ)音中提取特征,基于數(shù)據(jù)的新方法展現(xiàn)出其優(yōu)越性,特別是在處理龐大、復(fù)雜和多變的語(yǔ)音數(shù)據(jù)時(shí),新方法能夠更好地適應(yīng)不同的口音、方言和噪音環(huán)境。這場(chǎng)比賽的結(jié)果直接引發(fā)了自然語(yǔ)言處理技術(shù)路徑的重大轉(zhuǎn)變,統(tǒng)計(jì)學(xué)與計(jì)算能力逐漸崛起為該領(lǐng)域的主導(dǎo)。

 

2004年,DARPA挑戰(zhàn)賽。第一年的比賽宛如一場(chǎng)慘烈的車禍現(xiàn)場(chǎng),被人們戲稱為“沙漠潰敗”。然而,僅僅一年半后,第二次賽事便再度啟動(dòng),展現(xiàn)出兩種截然不同的技術(shù)路線:一種是依托于人類豐富的經(jīng)驗(yàn)和總結(jié),例如預(yù)先探查沙漠路徑,為車輛設(shè)計(jì)特殊程序以突破路途中的障礙物;另一種則是依賴于龐大的數(shù)據(jù),通過機(jī)器學(xué)習(xí)來(lái)學(xué)習(xí)道路特征進(jìn)行導(dǎo)航和脫障,同時(shí)加強(qiáng)對(duì)道路數(shù)據(jù)的實(shí)時(shí)采集,使無(wú)人車能夠“隨機(jī)應(yīng)變”。這一次,依舊是依賴數(shù)據(jù)的第二條技術(shù)路線取得了勝利。從沙漠賽道到城市街道,從基本導(dǎo)航到復(fù)雜的交通規(guī)則遵守,這些挑戰(zhàn)賽成為無(wú)人駕駛技術(shù)發(fā)展的重要里程碑。

 

2016年,AlphaGo憑借數(shù)百萬(wàn)局人類棋手的對(duì)局?jǐn)?shù)據(jù)進(jìn)行訓(xùn)練,掌握了高水平的棋局策略和模式。然而,第二個(gè)版本AlphaGo Zero卻完全依賴于自我對(duì)弈生成的數(shù)據(jù)進(jìn)行迭代訓(xùn)練,從而獲得了超越人類棋手的知識(shí)和經(jīng)驗(yàn),達(dá)到了前所未有的圍棋境界。這每一次不同類型的比賽,都是算法從統(tǒng)計(jì)、機(jī)器學(xué)習(xí)發(fā)展到深度學(xué)習(xí)的過程,也是算力從單片機(jī)發(fā)展到GPU的過程,更是人類經(jīng)驗(yàn)逐步讓渡于海量數(shù)據(jù)的過程,同時(shí)也是人類帶著數(shù)據(jù)沖擊機(jī)器智能新上限的過程。

 

我們目睹了數(shù)據(jù)要素在各行各業(yè)中通過投入替代、價(jià)值倍增以及資源優(yōu)化三種方式創(chuàng)造價(jià)值,發(fā)揮著至關(guān)重要的作用?;仡櫲斯ぶ悄艿陌l(fā)展歷程,我們可以看到算法從統(tǒng)計(jì)學(xué)習(xí)、機(jī)器學(xué)習(xí)逐步演化為深度學(xué)習(xí),計(jì)算能力也從單片機(jī)發(fā)展至GPU,這一系列變革反映了人類經(jīng)驗(yàn)向海量數(shù)據(jù)的過渡,同時(shí)也是人類攜帶數(shù)據(jù)挑戰(zhàn)機(jī)器智能極限的歷程。從依賴經(jīng)驗(yàn)到主要從數(shù)據(jù)中挖掘規(guī)律,從專注于解決單一問題到促進(jìn)AGI的發(fā)展,這些轉(zhuǎn)變不僅體現(xiàn)了數(shù)字要素的價(jià)值,更要求我們以全新視角重新評(píng)估其重要性。

 

在近日,蘿卜快跑引起了廣泛關(guān)注,其在一些城市的實(shí)踐雖顯示出些許遲鈍于道路路況的反應(yīng),但總體表現(xiàn)證明了其實(shí)施的可行性。隨之,將有越來(lái)越多的網(wǎng)約車司機(jī)面臨由無(wú)人駕駛技術(shù)所替代的局面,這仿佛重現(xiàn)了農(nóng)業(yè)機(jī)械取代農(nóng)民的傳統(tǒng)耕作,移動(dòng)支付淘汰傳統(tǒng)支付方式的歷史場(chǎng)景。

 

展望未來(lái)20年,車路網(wǎng)云的新時(shí)代將為近地空中飛行打開無(wú)盡的發(fā)展空間與可能性。在未來(lái)的世界里,或許我們將見證如同電影中描繪的場(chǎng)景:地面行駛著無(wú)人駕駛汽車,而低空則被各型飛行器占據(jù)。諸如空中出租車和無(wú)人配送等新型服務(wù)模式的涌現(xiàn),預(yù)示著未來(lái)城市交通將向三維空間延伸。

 

隨著車路網(wǎng)云技術(shù)的不斷進(jìn)步,那些掌握著最新一代城市交通技術(shù)、人工智能技術(shù)、云計(jì)算技術(shù)的國(guó)家,其發(fā)展效率必將提升至新的高度。技術(shù)的升級(jí)正推動(dòng)整個(gè)社會(huì)效率的持續(xù)提升,這一趨勢(shì)勢(shì)不可擋。同時(shí),這也見證了數(shù)據(jù)要素通過投入替代、價(jià)值倍增和資源優(yōu)化等方式,發(fā)揮了巨大的作用。這也是中國(guó)在過去二十年里邁向數(shù)字化生活和生產(chǎn)方式的根本動(dòng)力。

 

02 算力和數(shù)據(jù)是基礎(chǔ)設(shè)施層的關(guān)鍵,中國(guó)正加速挖掘數(shù)據(jù)價(jià)值


圖:智算中心的基礎(chǔ)架構(gòu)

 

在數(shù)字化的新時(shí)代,數(shù)據(jù)已化身為重要的生產(chǎn)資料,而算力則成為處理這些數(shù)據(jù)的強(qiáng)勁引擎。伴隨著人工智能、大數(shù)據(jù)、云計(jì)算等前沿技術(shù)的飛速進(jìn)步,算力與數(shù)據(jù)的關(guān)鍵作用愈發(fā)顯著,它們共同構(gòu)筑了當(dāng)代信息社會(huì)的基礎(chǔ)設(shè)施層。在這樣的大背景下,中國(guó)正致力于深化數(shù)據(jù)價(jià)值的挖掘,推動(dòng)經(jīng)濟(jì)與社會(huì)向數(shù)字化方向的全面轉(zhuǎn)型。



圖:中國(guó)通用算力規(guī)模與預(yù)測(cè)

 

算力、存儲(chǔ)、網(wǎng)絡(luò)構(gòu)建智算中心作為基礎(chǔ),智算中心的基于最新AI理論和領(lǐng)先的AI計(jì)算架構(gòu),算力技術(shù)與算法模型是其中的核心關(guān)鍵,算力技術(shù)以AI芯片、AI服務(wù)器、AI集群為載體,而當(dāng)前算法模型的發(fā)展趨勢(shì)以AI大模型為代表。


智能算力規(guī)模正在快速增長(zhǎng),復(fù)雜的模型和大規(guī)模的訓(xùn)練需要大規(guī)模的高算力支持,這不僅需要消耗大量計(jì)算資源,而且對(duì)算力的速度、精度、性能也提出更高要求。


AI生態(tài)加速收斂,大模型技術(shù)逐步收斂,生態(tài)走向聚合,模型更收斂、框架更歸一。為了開發(fā)更高性能的 AI大模型需要更強(qiáng)的算力平臺(tái),算力底座技術(shù)門檻將提高,未來(lái)訓(xùn)練核心依賴集群系統(tǒng)能力。



圖:算力底座技術(shù)門檻提高

 

算力,作為數(shù)據(jù)處理的核心能力,其發(fā)展水平直接關(guān)系到一個(gè)國(guó)家的科技創(chuàng)新能力和產(chǎn)業(yè)競(jìng)爭(zhēng)力。中國(guó)在算力建設(shè)方面投入巨大,不僅在超級(jí)計(jì)算機(jī)領(lǐng)域取得了顯著成就,連續(xù)多年位居全球超算TOP500的數(shù)量首位,而且在云計(jì)算、邊緣計(jì)算等領(lǐng)域也展現(xiàn)出強(qiáng)勁的發(fā)展勢(shì)頭。通過構(gòu)建高性能的算力平臺(tái),中國(guó)為各行各業(yè)提供了強(qiáng)大的數(shù)據(jù)處理能力,支撐起復(fù)雜的數(shù)據(jù)分析和模型訓(xùn)練需求。

 

數(shù)據(jù)的價(jià)值在于其能夠被有效利用,政府高度重視數(shù)據(jù)資源的整合與開放,推動(dòng)公共數(shù)據(jù)資源的開發(fā)利用,鼓勵(lì)企業(yè)間的數(shù)據(jù)共享與合作。通過建立數(shù)據(jù)交易市場(chǎng)、完善數(shù)據(jù)治理體系,國(guó)內(nèi)逐步釋放數(shù)據(jù)的潛在價(jià)值,促進(jìn)數(shù)據(jù)資產(chǎn)化、服務(wù)化。同時(shí),也在積極探索數(shù)據(jù)隱私保護(hù)和安全使用的法律法規(guī),確保數(shù)據(jù)價(jià)值的挖掘在合法合規(guī)的框架內(nèi)進(jìn)行。

 

在應(yīng)用層面,中國(guó)將算力和數(shù)據(jù)的優(yōu)勢(shì)轉(zhuǎn)化為實(shí)際的生產(chǎn)力。無(wú)論是在智能制造、智慧城市建設(shè),還是在金融科技、醫(yī)療健康等領(lǐng)域,數(shù)據(jù)驅(qū)動(dòng)的決策和智能化的服務(wù)逐漸成為常態(tài)。例如,通過大數(shù)據(jù)分析,金融機(jī)構(gòu)能夠更準(zhǔn)確地評(píng)估風(fēng)險(xiǎn),提供個(gè)性化的金融產(chǎn)品;而智能制造則通過實(shí)時(shí)數(shù)據(jù)監(jiān)控和分析,優(yōu)化生產(chǎn)流程,提高產(chǎn)品質(zhì)量和生產(chǎn)效率。

 

未來(lái),隨著5G網(wǎng)絡(luò)的普及和IOT技術(shù)的發(fā)展,數(shù)據(jù)的產(chǎn)生和應(yīng)用將更加廣泛。中國(guó)將繼續(xù)加大對(duì)算力和數(shù)據(jù)基礎(chǔ)設(shè)施的投入,推動(dòng)技術(shù)創(chuàng)新和產(chǎn)業(yè)升級(jí),構(gòu)建更加完善的數(shù)據(jù)生態(tài)系統(tǒng)??傊?,算力和數(shù)據(jù)是現(xiàn)代社會(huì)不可或缺的基礎(chǔ)設(shè)施,加速挖掘數(shù)據(jù)價(jià)值,它們是推動(dòng)經(jīng)濟(jì)增長(zhǎng)和社會(huì)進(jìn)步的關(guān)鍵資源。

 

03 AGI的發(fā)展遵循擴(kuò)展定律

 

AGI?的發(fā)展不僅體現(xiàn)在技術(shù)的進(jìn)步上,?還涉及到算力的持續(xù)提升和模型規(guī)模的演進(jìn)升級(jí)。?隨著AI變得越來(lái)越流行和易于獲取,?研究想法的增長(zhǎng)無(wú)疑加速了技術(shù)的發(fā)展。尤其是在算力層面,即便面對(duì)著摩爾定律的放緩趨勢(shì),片內(nèi)互聯(lián)技術(shù)的突破仍為單個(gè)芯片設(shè)計(jì)的規(guī)模拓展與能效提升開辟了新的工程成就之路。?這些技術(shù)進(jìn)步為AGI的發(fā)展提供了強(qiáng)大的基礎(chǔ)。

?

擴(kuò)展定律,作為人工智能產(chǎn)業(yè)內(nèi)部破解困局的共識(shí):通過運(yùn)用更龐大的模型架構(gòu),配備更強(qiáng)大的計(jì)算能力,從更廣泛的數(shù)據(jù)集中挖掘更深層次的隱含知識(shí)與普遍適用的能力。從GPT 1演進(jìn)至GPT 3的過程中不斷探索實(shí)驗(yàn),當(dāng)參數(shù)規(guī)模增加至百倍之多,訓(xùn)練數(shù)據(jù)集增至五十倍之際,GPT 3.5展現(xiàn)了能力的“涌現(xiàn)”:全球逾億用戶蜂擁而至,驗(yàn)證了該模型能夠以近乎類人的方式理解上下文和進(jìn)行對(duì)話交流;同時(shí),此模型還展現(xiàn)出了更高級(jí)的泛化能力和思維鏈能力,能夠?qū)τ谖粗榫匙龀龊侠淼耐茢啵?fù)雜問題分解為簡(jiǎn)易任務(wù),逐步解決。由此塑造出的AGI(人工通用智能)初步形態(tài):一個(gè)基礎(chǔ)且通用的大型模型能夠進(jìn)行內(nèi)容創(chuàng)作,能夠革新程序編碼、文檔編輯等多樣化工具軟件的使用體驗(yàn),能夠“轉(zhuǎn)生為”機(jī)器人,借助具身智能加快機(jī)器人研發(fā)的步伐,并且改變了科學(xué)研究的傳統(tǒng)范式,促成了生物醫(yī)學(xué)、材料科學(xué)、工業(yè)仿真等多個(gè)領(lǐng)域的新突破。

 


 

中國(guó)的LLM型路線見證著數(shù)據(jù)要素的作用,比如阿里巴巴通義千問,自2023年8月以來(lái),其連續(xù)發(fā)布了7B、14B、72B及200B參數(shù)版本,隨著參數(shù)規(guī)模的壯大,模型的能力亦顯著提高。AI研究了幾十年,唯一有效的東西便是scaling law(尺度定律),就是不斷放大數(shù)據(jù)、算力和算法這幾樣生產(chǎn)要素。

 

 AGI正逐漸成為推動(dòng)社會(huì)進(jìn)步和產(chǎn)業(yè)革新的關(guān)鍵力量,技術(shù)不斷進(jìn)步,從最初的專家系統(tǒng)到機(jī)器學(xué)習(xí),再到深度學(xué)習(xí)的興起,AI技術(shù)已經(jīng)取得了顯著的成就。隨著計(jì)算能力的增強(qiáng)、大數(shù)據(jù)的積累和算法的創(chuàng)新,AGI成為了科技發(fā)展的下一個(gè)里程碑。AGI的發(fā)展背景是復(fù)雜多元的,涉及技術(shù)進(jìn)步的內(nèi)在邏輯、經(jīng)濟(jì)社會(huì)的外在需求、倫理法律的約束條件以及國(guó)際競(jìng)爭(zhēng)合作的大環(huán)境。未來(lái),AGI的發(fā)展將在這些因素的共同作用下不斷推進(jìn),同時(shí)也需要全社會(huì)的智慧和努力來(lái)確保其健康、有序和有益的發(fā)展。

 

此外,AI規(guī)模法則的提出預(yù)示著計(jì)算資源的可持續(xù)增長(zhǎng)與成本的持續(xù)降低,從而為AGI的發(fā)展奠定了物理上的可能性。OpenAI首席執(zhí)行官山姆·奧特曼所提出的AI時(shí)代摩爾定律——宇宙中的智能數(shù)量每18個(gè)月翻一番,進(jìn)一步凸顯了AI技術(shù)發(fā)展的速率與規(guī)模。

 

在模型方面,隨著算力的不斷強(qiáng)化,基于大模型的AGI智能能力已遠(yuǎn)超傳統(tǒng)適用于特定場(chǎng)合的中小型AI模型。一旦完備的通用AI得以實(shí)現(xiàn),其將在AI+各種場(chǎng)景下展現(xiàn)廣泛的應(yīng)用潛力,同時(shí)算法的逐步確立也為AI技術(shù)的持續(xù)優(yōu)化開辟了新的可能性。這種相互作用的關(guān)系促進(jìn)了AGI技術(shù)的不斷前進(jìn)與發(fā)展。AGI的進(jìn)步無(wú)疑遵循著擴(kuò)展的原則,通過算力的系統(tǒng)提升與模型規(guī)模的逐步升級(jí),推動(dòng)著AGI技術(shù)的迅猛前行。

 

04 AGI領(lǐng)域應(yīng)用層創(chuàng)新發(fā)展

 

OpenAI的聯(lián)合創(chuàng)始人伊爾亞·蘇茨克維,在一次深入的訪談中,曾以一句精辟而抽象的話語(yǔ)概括了人工智能模型的本質(zhì):“The models just want to learn!”此言并非賦予了模型以生命般的學(xué)習(xí)欲望,而是揭示了模型被設(shè)計(jì)的初衷——從浩如瀚海的數(shù)據(jù)中自動(dòng)汲取隱含的規(guī)則與經(jīng)驗(yàn),借助算法的巧思與算力的增強(qiáng),不斷優(yōu)化學(xué)習(xí)的效率,拓寬學(xué)習(xí)的邊界。

 

AGI市場(chǎng),猶如一座宏偉的大廈,其結(jié)構(gòu)復(fù)雜而有序,主要分為基礎(chǔ)設(shè)施層、模型層、中間層以及應(yīng)用層。大模型在應(yīng)用層的探索與創(chuàng)新,如同點(diǎn)亮了這座大廈的璀璨燈塔,為AI領(lǐng)域帶來(lái)了前所未見的機(jī)遇。隨著計(jì)算能力的飛躍提升,數(shù)據(jù)量的激增,以及算法的持續(xù)優(yōu)化,大模型已悄然嶄露頭角,在自然語(yǔ)言處理(NLP)、計(jì)算機(jī)視覺、語(yǔ)音識(shí)別等多個(gè)領(lǐng)域展現(xiàn)出了強(qiáng)大的能力。這些顯著的進(jìn)步,使得大模型在追尋人工通用智能(AGI)的道路上,愈發(fā)展現(xiàn)出全球領(lǐng)先的潛力。

 

AGI,這片神奇的土地,以其無(wú)限的可能性與挑戰(zhàn),吸引著無(wú)數(shù)探索者。它要求模型不僅能在某一領(lǐng)域內(nèi)專精,更要具備跨領(lǐng)域的知識(shí)表示與推理能力,如同一位博學(xué)多才的智者,能自如地穿梭于不同的領(lǐng)域,應(yīng)對(duì)各種挑戰(zhàn)。同時(shí),AGI還需具備自適應(yīng)學(xué)習(xí)的能力,猶如生命體一般,能根據(jù)不同的任務(wù)與環(huán)境,靈活地調(diào)整學(xué)習(xí)的策略與參數(shù)。

 

然而,真正的智能不僅僅是邏輯的推理與知識(shí)的積累,更是情感的理解與社交的互動(dòng)。因此,大模型在追求AGI的道路上,還需賦予其情感與社交智能,使其能夠更加深刻地理解人類的情感,適應(yīng)人類社會(huì)的需求。

 

在智能的征途上,倫理與道德的指引不可或缺。大模型在實(shí)現(xiàn)AGI的旅途中,必須植入倫理與道德的判斷能力,確保其在決策的每一步都能遵循人類的價(jià)值觀與道德規(guī)范,成為維護(hù)人類福祉的守護(hù)者。人機(jī)協(xié)作與交互,是AGI融入人類社會(huì)的重要橋梁。大模型應(yīng)具備與人類協(xié)作與交互的能力,能在人類的生產(chǎn)、生活中提供智能化的服務(wù)與支持,成為人類智慧的延伸,生活的益友。

 

因此,大模型在應(yīng)用層的探索與創(chuàng)新,為AGI的實(shí)現(xiàn)注入了蓬勃的生機(jī)。通過算法的不斷優(yōu)化、應(yīng)用領(lǐng)域的持續(xù)拓展、智能水平的日益提升,大模型正穩(wěn)步邁向AGI的高峰,為社會(huì)帶來(lái)更為廣泛、更為深入的智能化服務(wù),開啟一個(gè)嶄新的智能時(shí)代。



                    圖:AGI市場(chǎng)的四層結(jié)構(gòu)示意圖

 

應(yīng)用行業(yè)現(xiàn)狀

· 營(yíng)銷和零售:?AGI應(yīng)用顛覆營(yíng)銷領(lǐng)域,?推動(dòng)營(yíng)銷效率提升和體驗(yàn)優(yōu)化。?

· 金融:?金融行業(yè)整體處于AGI應(yīng)用探索期,?逐漸向產(chǎn)品測(cè)試期邁進(jìn)。?

· 企業(yè)應(yīng)用:?AGI應(yīng)用覆蓋企業(yè)全流程,?注重效率、?知識(shí)管理和流程優(yōu)化。?

· 教育:?集中在應(yīng)用探索和產(chǎn)品測(cè)試階段,?學(xué)生側(cè)應(yīng)用速度快、?探索程度深。

 

05 通用大模型與行業(yè)大模型并駕齊驅(qū),小模型市場(chǎng)需求更大




在大模型的演進(jìn)之路上,每一次通用大模型的力量提升,皆如潮水般席卷,對(duì)散落的應(yīng)用與解決方案形成無(wú)可匹敵之勢(shì);大模型所蘊(yùn)含的通用智能之價(jià)值,勢(shì)必超越那些零散場(chǎng)景應(yīng)用的總和。然而,在AI的廣袤天地中,通用大模型與行業(yè)大模型各承其妙,各有千秋。通用大模型,猶如璀璨星辰,于眾多領(lǐng)域與任務(wù)中展現(xiàn)卓越性能;行業(yè)大模型,則如精密的鐘表,針對(duì)特定行業(yè)或領(lǐng)域精準(zhǔn)調(diào)校,專業(yè)定制。盡管通用大模型在諸多領(lǐng)域捷報(bào)頻傳,但行業(yè)大模型仍不可或缺,當(dāng)應(yīng)用場(chǎng)景對(duì)反應(yīng)速度有極高要求時(shí),我們或許更需依賴一個(gè)更為小型的模型。這類模型雖不具備大模型的普適智能,卻在特定垂直場(chǎng)景中展現(xiàn)出無(wú)可比擬的優(yōu)勢(shì)。此時(shí),對(duì)模型進(jìn)行精細(xì)調(diào)整,滿足定制化需求,追求實(shí)時(shí)性與高效率,將行業(yè)數(shù)據(jù)注入其中,打造出規(guī)模更小、垂直更深的行業(yè)模型,方能滿足市場(chǎng)那更為龐大的需求。

 

在通用大模型的雄厚基礎(chǔ)之上,行業(yè)大模型得以筑建。這些通用模型,蘊(yùn)含著深邃的知識(shí)儲(chǔ)備與卓越的泛化能力,不僅為行業(yè)大模型奠定了堅(jiān)實(shí)的知識(shí)根基,并極大地提升了互動(dòng)體驗(yàn)的豐富度;同時(shí),它們還大幅降低了從零起步訓(xùn)練模型所需的海量數(shù)據(jù)和計(jì)算資源,顯著提高了行業(yè)大模型開發(fā)及其應(yīng)用的效率和成效。經(jīng)由對(duì)通用大模型實(shí)施提示工程、檢索增強(qiáng)生成、精調(diào)、持續(xù)預(yù)訓(xùn)練/后訓(xùn)練等手段,模型能夠更精準(zhǔn)地適應(yīng)特定數(shù)據(jù)集或任務(wù)需求,進(jìn)而衍生出行業(yè)大模型的特定版本(即模型有變),或賦予其行業(yè)大模型所具備的功能(即模型不變)。。如今,市場(chǎng)上涌現(xiàn)的眾多行業(yè)大模型,如金融、法律、教育、傳媒、文旅等領(lǐng)域,大多基于Llama、SD、GLM、Baichuan等國(guó)內(nèi)外廣為人知的開源大模型而構(gòu)建。

 

在專業(yè)領(lǐng)域內(nèi),大型模型往往需根據(jù)特定數(shù)據(jù)集與任務(wù)進(jìn)行精細(xì)調(diào)整或定制開發(fā)。針對(duì)B端客戶群體,每一家企業(yè)均有其獨(dú)樹一幟的商業(yè)運(yùn)作、數(shù)據(jù)資產(chǎn)及業(yè)務(wù)流程,對(duì)于大型模型所寄望解決的關(guān)鍵問題亦各具特色,個(gè)性化需求普遍可見。因此,供應(yīng)商所提供的行業(yè)大型模型不單是產(chǎn)品與工具的集合,更包含必要的定制化服務(wù)與支援,甚至于需要客戶的積極參與和共同建設(shè)??梢赃@般理解:行業(yè)大型模型中的產(chǎn)品宛如“待裝修之房屋”,客戶必須依據(jù)各自用途進(jìn)行“內(nèi)部裝潢”方能真正滿足其需求。例如,借助TI平臺(tái)之力,構(gòu)建了行業(yè)大模型的精選商鋪,推出了MaaS服務(wù),為客戶提供了一系列周全的行業(yè)大模型解決方案,覆蓋模型預(yù)訓(xùn)練、精細(xì)調(diào)整及智能應(yīng)用開發(fā)等多個(gè)方面。

 

 

行業(yè)大模型需

重視全生命周期的安全保障機(jī)制

 

在大型模型的數(shù)據(jù)處理流程中,相較于傳統(tǒng)模型,其復(fù)雜度更高,諸多不可控的因素孕育著不容輕視的安全隱患,涉獵數(shù)據(jù)隱私保護(hù)、推理過程安全、內(nèi)容審查安全、版權(quán)防護(hù)等諸多方面。這便迫切需求一套系統(tǒng)化的安全防御機(jī)制,對(duì)于行業(yè)大型模型而言,此需求尤為顯著。安全廠商倡導(dǎo)的大型模型安全框架,針對(duì)模型全生命周期內(nèi)的各類安全風(fēng)險(xiǎn),提供了原則與方法上的指導(dǎo),覆蓋內(nèi)生安全及應(yīng)用安全兩個(gè)維度,助力體系解決大型模型在生產(chǎn)研發(fā)過程中遇到的基礎(chǔ)設(shè)施、數(shù)據(jù)、模型、算法等各層面的安全風(fēng)險(xiǎn),以及不合理應(yīng)用可能觸發(fā)的決策失控風(fēng)險(xiǎn)等。在此之中,針對(duì)大型模型生產(chǎn)研發(fā)過程中內(nèi)在的安全問題,應(yīng)由大型模型研發(fā)團(tuán)隊(duì)與安全團(tuán)隊(duì)共同聚焦,通過安全評(píng)估等機(jī)制確保大型模型的應(yīng)用能夠達(dá)成安全目標(biāo)。總而言之,將安全舉措具體實(shí)施于研發(fā)、訓(xùn)練、測(cè)試、部署發(fā)布等每一個(gè)環(huán)節(jié),同時(shí),也是業(yè)界共識(shí),旨在提升大型模型的安全水平,其中可采納的措施包括prompt安全評(píng)估、紅藍(lán)對(duì)抗演練、源代碼的安全防護(hù)、基礎(chǔ)設(shè)施漏洞的安全防護(hù)等多種方式。

 

 

 

2024CSDI 9月20-22日

共話科技應(yīng)用元年

 

正值LLM時(shí)代,智能軟件研發(fā)的技術(shù)、范式和工具都發(fā)生了巨大的變化。無(wú)論是依賴于深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)和大數(shù)據(jù)技術(shù)。還是軟件研發(fā)的范式從傳統(tǒng)的規(guī)則驅(qū)動(dòng)和專家系統(tǒng)轉(zhuǎn)變?yōu)閿?shù)據(jù)驅(qū)動(dòng)和模型驅(qū)動(dòng)。大量的智能軟件研發(fā)工具和框架應(yīng)運(yùn)而生。數(shù)據(jù)成為了智能軟件研發(fā)的核心。智算資源的需求與訓(xùn)練部署復(fù)雜的模型,開發(fā)者需要利用高性能的硬件(如GPU、TPU等)和分布式計(jì)算技術(shù)(如云計(jì)算、集群計(jì)算、數(shù)據(jù)庫(kù)等)。這些技術(shù)應(yīng)用便是IT企業(yè)探尋與研究的必選題。

 

2024CSDI峰會(huì)將以數(shù)智+躍遷為主旨,于9月20-22日深圳召開,攜國(guó)內(nèi)眾多頂尖優(yōu)秀企業(yè),面向技術(shù)管理者和一線技術(shù)帶頭人。抽絲剝繭:以業(yè)務(wù)與新興技術(shù)應(yīng)用為導(dǎo)向的:大數(shù)據(jù)開放架構(gòu)、AIGC產(chǎn)品創(chuàng)新、智能化開發(fā)、LLM智能終端創(chuàng)新、LLM數(shù)據(jù)智能、多模態(tài)LLM、大模型規(guī)?;瘧?yīng)用、云架構(gòu)生態(tài)、質(zhì)量工程效能、組織戰(zhàn)略、智能化開發(fā)、安全LLM等先進(jìn)數(shù)字技術(shù)進(jìn)行全面解析,幫組企業(yè)構(gòu)建和借鑒適合自身的技術(shù)應(yīng)用與業(yè)務(wù)實(shí)踐。


微信圖片_20240808153746_compressed


總結(jié)

科技浩瀚星海中,數(shù)據(jù)要素的創(chuàng)新如同璀璨星辰,與科技發(fā)展交織成一張推動(dòng)技術(shù)進(jìn)步的巨網(wǎng)。智能研發(fā)與應(yīng)用創(chuàng)新之舟,正乘著這股浪潮,破浪前行,其航向呈現(xiàn)出多元化的航跡、跨界融合的風(fēng)帆以及可持續(xù)發(fā)展的舵盤。在技術(shù)與市場(chǎng)這對(duì)孿生潮汐的影響下,企業(yè)們?nèi)缤腔鄣暮胶<?,將不同領(lǐng)域的技術(shù)與知識(shí)匯于一爐,鍛造出更具競(jìng)爭(zhēng)力的產(chǎn)品與應(yīng)用之錨。

 

AI的洪流、大數(shù)據(jù)的海洋,云計(jì)算的蒼穹下,先進(jìn)數(shù)字化技術(shù)如星辰般璀璨,AI Agent作為自主決策和任務(wù)執(zhí)行的智能體,在金融,醫(yī)療,制造業(yè),展現(xiàn)出卓越的效能。它運(yùn)用大型語(yǔ)言模型(LLM)作為羅盤,理解復(fù)雜的語(yǔ)言指令,生成自然流暢的語(yǔ)言回應(yīng),極大地提升了人機(jī)交互的航速與平穩(wěn)。

 

物聯(lián)網(wǎng)(IOT)應(yīng)用則如精細(xì)的藍(lán)圖,通過捕捉精準(zhǔn)的產(chǎn)品數(shù)據(jù),為研發(fā)的精準(zhǔn)優(yōu)化。

 

數(shù)字員工在AGI應(yīng)用市場(chǎng)將形成人才匯聚效應(yīng),不僅高效完成自動(dòng)化和智能化任務(wù),更將深度參與企業(yè)決策,提供精準(zhǔn)數(shù)據(jù)支持和智能建議,助力企業(yè)提升競(jìng)爭(zhēng)力。




微軟、阿里巴巴、小米、騰訊、華為、360、平安集團(tuán)、渣打銀行、工商銀行、招商銀行、隨行付、易方達(dá)、長(zhǎng)亮科技、南方電網(wǎng)、廣州銀聯(lián)、穆迪信息、拍拍貸、宇信集團(tuán)、投哪兒金融、天維信息、薩摩耶、華泰證券、招商證券、國(guó)信證券、陸金所、廣發(fā)基金、中國(guó)銀聯(lián)、恒天軟件、天陽(yáng)宏業(yè)、中數(shù)通、電信規(guī)劃設(shè)計(jì)院、oppo、步步高、vivo、愛立信、百富計(jì)算機(jī)、廈門航空、福建聯(lián)迪、網(wǎng)易、星網(wǎng)視易、升騰科技、視睿電子、飛利浦、金山軟件、金山游戲、歐特克、順豐、深信服、歡聚時(shí)代、虎牙、珠海健康云、優(yōu)視科技(UC)、52TT、天翼云、凱米網(wǎng)絡(luò)、電信設(shè)計(jì)院、ADmaster、博思軟件、網(wǎng)宿科技、珍愛網(wǎng)、金蝶、唯品會(huì)、中國(guó)聯(lián)通、中國(guó)移動(dòng)、傳動(dòng)數(shù)碼、無(wú)限極、中電、珠海網(wǎng)博、中軟、同盾科技、杭州順網(wǎng)、藍(lán)凌軟件、長(zhǎng)園深瑞、中南民航、遠(yuǎn)光軟件、廣聯(lián)達(dá)、中國(guó)電信、傳音、利通、物理研究所等。

0 人點(diǎn)贊