新聞中心
Information Centre
首頁
產品
解決方案
關于我們
服務支持
聯系我們
Information Centre
時間:2024-01-17 16:12:54
近日,《“數據要素×”三年行動計劃(2024—2026年)》(以下簡稱《行動計劃》)正式發布。《行動計劃》由國家數據局會同中央網信辦、科技部、工業和信息化部等共17個部門聯合印發,這是國家數據局揭牌兩個多月以來會同相關部門聯合印發的首個文件。該文件從2023年12月15日向社會征求意見到當月29日相關媒體吹風會舉行,再到2024年1月4日印發實施,歷時僅20天,可謂迅速、高效。
《行動計劃》提出一個引人矚目的表述——“數據要素×”,大力部署實施“數據要素×”行動并列出重點推進的12個領域,要求充分利用中國海量數據資源、豐富應用場景等優勢,以數據流引領技術流、人才流、物資流等,實現知識擴散、價值倍增,催生新產業、新模式,為推動高質量發展、推進中國式現代化提供有力支撐。《行動計劃》明確提出到2026年底數據要素應用總體目標,其中包括打造300個以上示范性強、顯示度高、帶動性廣的典型應用場景,數據產業年均增速超過20%。
實現科創效能倍增
科學技術是第一生產力,是先進生產力的集中體現和主要標志;創新是引領發展的第一動力,是推動生產力發展的關鍵因素。在《行動計劃》中,“科技創新”被列為“數據要素×”應用的12個重點領域之一。由此可見,數據要素被賦予實現科技創新效能倍增,推動社會生產力更快發展的重大使命。
《行動計劃》鮮明地提出以“數據驅動”科技創新,要求“充分依托各類數據庫與知識庫,推進跨學科、跨領域協同創新,以數據驅動發現新規律,創造新知識,加速科學研究范式變革”。
在中國工程院院士王堅看來,以“數據要素×”實現科技創新效能倍增,與當今時代“數據驅動型創新”特點高度契合。王堅把20世紀形成的傳統創新模式稱為“電氣化驅動創新”。正是在電氣化的強有力推動下,與激光、互聯網、計算機等有關的科技發明不斷涌現,塑造了人們的生產生活方式和社會面貌,可以說20世紀是電氣化驅動科技創新的世紀。進入21世紀,以美國數據科學專家、圖靈獎得主詹姆斯·格雷為代表的科學家提出“數據密集型科學發現”,凸顯數據對科技創新的重大價值。
那么數據是如何驅動科技創新的呢?對此,王堅解釋,科學家可以根據相關數據,提出新的假設,并借助高性能計算技術、人工智能技術等,對假設進行驗證,從而獲得新的科學發現。
與王堅的上述看法類似,中國科學院院士、北京科學智能研究院院長鄂維南認為,在當今大數據時代,科研環境從依靠圖書館、電子顯微鏡等傳統基礎設施轉變為以大數據、人工智能為代表的新型基礎設施。
對《行動計劃》提到的“加速科學研究范式變革”,中國科學院院士、復旦大學校長金力表示,傳統的科研范式經歷了4個階段演化:從通過實驗描述自然現象的“實驗范式”,到通過模型或歸納進行研究的“理論范式”,再到應用計算機仿真模擬解決學科問題的“計算范式”,再到通過大數據分析研究事物內在關系的“數據范式”。今天,隨著數據資源不斷增長和需要求解的科學問題日益復雜,科學研究的第五范式應運而生,就是在“數據范式”基礎上,引入了智能技術,強調人的決策機制與數據分析的融合,將數據科學和計算智能有效地結合起來,利用AI技術學習、模擬、預測和優化自然界和人類社會的各種現象和規律,以解決各種科研問題,從而推動科學發現和創新,這就是科學研究“人工智能驅動范式”(AI For Science)。
2022年底以來, 以ChatGPT為代表的生成式人工智能大模型大放異彩。科學研究“人工智能驅動范式”迫切需要類似ChatGPT的人工智能大模型提供支撐。為此,《行動計劃》提出打造服務于中國科技創新事業的人工智能大模型并作出相關部署,要求“以科學數據支持大模型開發,深入挖掘各類科學數據和科技文獻,通過細粒度知識抽取和多來源知識融合,構建科學知識資源底座,建設高質量語料庫和基礎科學數據集,支持開展人工智能大模型開發和訓練”。
對科學研究“人工智能驅動范式”的前景,金力進行了樂觀展望,認為這一范式是實現科技原始創新的利器,比如,在大數據支撐下,人工智能在生命科學領域可以高效、精準地預測蛋白質結構。無獨有偶,在近日舉行的一個論壇上,國家數據局局長劉烈宏在演講中也舉了這個例子。他說,長期以來,如何準確、快速確定蛋白質三維空間結構一直是一個難題,而基于海量、多元生物數據構建起的人工智能算法模型,能在幾天甚至幾分鐘預測出以前要花費數十年才能得到的、具有高置信度的蛋白質結構,顛覆了生命科學領域的研究范式。
科學數據重在應用,《行動計劃》指明了科學數據兩大應用方向:一是聚焦科研本身,以科學數據助力前沿研究,面向基礎學科,提供高質量科學數據資源與知識服務,驅動科學創新發現;二是聚焦服務產業,以科學數據支撐技術創新,聚焦生物育種、新材料創制、藥物研發等領域,以數智融合加速技術創新和產業升級。
廣泛賦能千行百業
由《行動計劃》,人們很自然地聯想到“互聯網+”,聯想到于2015年7月印發實施的《關于積極推進“互聯網+”行動的指導意見》。兩個文件雖然時隔8年多,但是仍有諸多可以相比較的地方。兩者分別以“互聯網+”和“數據要素×”為關鍵詞,都引入了數學符號,給人非常直觀的感受。同時,兩者都對部署的措施冠以“行動”并都詳細列舉了開展“行動”的重點領域。前者列舉了“創業創新”“協同制造”“現代農業”等11個領域,后者列舉了“科技創新”“智能制造”“智慧農業”等12個領域。
如何解讀“互聯網+”和“數據要素×”之間的關系呢?對此,國家數據局副局長沈竹林表示,從前者到后者可以用3個轉變來概括:一是從連接到協同的轉變。“互聯網+”強調的是連接,即各行各業擁抱互聯網,實現基于數據生成和傳遞的互聯互通;而“數據要素×”強調的是數據協同,是基于數據有效應用的全局優化。二是從使用到復用的轉變。“互聯網+”強調的是千行百業利用互聯網技術;而“數據要素×”強調的是基于行業間數據復用的價值創造,拓展經濟增長新空間。三是從疊加到融合的轉變。“互聯網+”強調的是通過匯聚數據來提升效率;而“數據要素×”強調的是融合多來源、多類型的數據,驅動創新,培育經濟增長新動能。
中央財經大學中國互聯網經濟研究院副院長歐陽日輝是《行動計劃》的起草人之一。他近日撰文對“互聯網+”和“數據要素×”之間的關系進行了闡釋,指出互聯網和數據是數字技術的統一體,前者是“露出水面的冰山”而后者是“深藏在水下的主體”,實施多年的“互聯網+”行動為采取“數據要素×”行動奠定了堅實基礎,“數據要素×”是“互聯網+”的升級和升華,二者本質上都是數字技術與經濟社會的深度融合、雙向賦能。
縱觀《行動計劃》所列的“數據要素×”12個重點領域,基本覆蓋了一、二、三產業的各行業及重點細分領域,涉及千行百業。比如,在工業制造領域,《行動計劃》要求,支持工業制造類企業融合設計、仿真、實驗驗證數據,培育數據驅動型產品研發新模式,提升企業創新能力。比如,在現代農業領域,《行動計劃》提出,支持相關方面融合利用遙感、氣象、土壤、農事作業、災害、農作物病蟲害、動物疫病、市場等數據,加快打造以數據和模型為支撐的農業生產數智化場景,實現精準種植、精準養殖、精準捕撈等智慧農業作業方式。
詮釋新質生產力
數據是經過收集、記錄、測量、統計、描述所得到的信息或信息的載體,可以是數字、文字、圖像、聲音等形式。隨著網絡技術的發展和向各行業的滲透,數字技術創新成果與經濟社會各領域深度融合,不同領域的數據被生產、記錄、傳輸、存儲和消費,數據規模以摩爾定律的速度快速增長。數據的充分挖掘和有效利用,可以優化資源配置和使用效率,對價值創造和生產力發展有著廣泛影響。
歐陽日輝表示,在數字經濟時代,數據的重要性不言而喻,但是數據并不是從一開始就被作為生產要素,而是經歷了一個過程。
2017年12月,習近平總書記在中共十九屆中央政治局第二次集體學習時強調“構建以數據為關鍵要素的數字經濟”。2019年10月,中共十九屆四中全會明確了勞動、資本、土地、知識、技術、管理和數據等7種生產要素。這是首次正式明確數據的生產要素地位。之后,中央作出改革和加快培育數據要素市場、更好發揮數據要素作用等一系列重大部署,而《行動計劃》就是落實這些部署的最新舉措。
值得注意的是,《行動計劃》把培育和發展新質生產力作為實施“數據要素×”行動的重要目標之一。對此,南開大學經濟與社會發展研究院教授杜傳忠指出,新質生產力的培育有多種推動力量,其中數據要素作為國家基礎性戰略資源和關鍵性生產要素,與算力相結合,將衍生形成強勁的數據生產力,成為新質生產力的重要組成部分。杜傳忠特別提到類似ChatGPT這樣的生成式人工智能大模型,他認為,AI大模型以智能算力作為底座支撐,通過深度學習算法和萬億級別數據的訓練,不斷迭代,從而形成新質生產力。此外,數據要素在人工智能技術加持下,推出大量具有深度學習、自主學習能力的機器人,可以進一步深化勞動分工、優化勞動力供給結構,從而形成新質生產力。
中國首個工業級流體仿真大模型“東方·御風”被認為是新質生產力的典型代表。2022年9月,該大模型由中國商飛公司聯合有關方面共同發布,在相關流體仿真套件的支持下,有效提高了對復雜流動的仿真能力,將仿真時間縮短至原來的1/24。同時,該模型能對流場中變化劇烈的區域進行精準預測,流場平均誤差降低到萬分之一量級,達到工業級標準。正是有了大模型“東方·御風”的助力,中國C919大型客機才得以縮短研發周期,才能早日翱翔藍天。
來源:人民日報海外版
免責聲明:本網站部分文章、圖片等信息來源于網絡,版權歸原作者平臺所有,僅用于學術分享,如不慎侵犯了你的權益,請聯系我們,我們將做刪除處理!