南方日報 | 突破“數據孤島”,暢通數字經濟發展動脈
數據要素作為數字經濟時代的核心要素,在提高生產要素的配置效率、推動生產要素創新性配置方面發揮著重要作用。目前,高質量中文數據庫稀缺,高質量數據清洗成本高,高質量訓練數據集匱乏。同時,數據標準不統一,數據交易規則不一致,降低了數據要素交易活躍度,數據共享不充分,催生“數據孤島”,制約了高質量數據生成和供給。高質量數據要素的迫切需要與不平衡不充分的數據要素供給之間的矛盾日益突出。高質量數據要素供給體系的構建,核心在于激活高質量數據要素源頭,關鍵在于暢通高質量數據要素流通渠道,著力點在于發揮數據標注領軍企業的標桿作用,激發市場活力。
歸集高質量訓練數據集,打造高質量中文語料數據庫。一是政企牽引,擴大高質量數據要素源頭。發揮政府機關、科研院所、企事業單位豐富的數據資源優勢,支持各類經營主體通過數據流通交易平臺提供高質量數據集。二是平臺賦能,建立高質量數據配套服務機構。搭建高質量的文字、圖片、音頻、視頻等多模態大模型預訓練語料庫,支持在依法設立的數據交易機構開展數據流通、交易融合應用,探索建設行業性高質量數據交易配套服務平臺。三是基地支撐,打造高質量數據產業集群。鼓勵開展大模型研發、訓練和應用,重點支持在通用大模型的基礎上開發適用于垂直行業的專用大模型,優先提供高質量數據集推廣示范、低成本算力保障等綜合支持。建立人工智能產業數據資源清單,建設“產業數鏈”,打造以數據為核心的虛擬產業集群。四是人才驅動,創建新型高質量數據行業隊伍。推動數據與行業知識深度融合,開發數據產品,滿足算法設計、模型訓練、產品驗證、場景應用等需求,逐步建立和完善復合型數字經濟人才隊伍。積極培育大數據企業,完善大數據產業服務支撐體系,夯實數據要素市場產業基礎,催生創造數據標注師、分析師、數據資產評估師等一批新型職業崗位。
加強公共數據高質量供給,推動公共數據定向開放。一是加大公共數據開放共享力度,推動公共數據和社會數據定向有條件開放和及時更新。二是優化公共數據開放目錄,進一步完善數據治理和審核機制。三是健全公共數據開放評價體系,持續開展公共數據開放水平動態評估,對出現異常的指標及時回溯分析,以評促改推動公共數據質量提高。四是強化公共數據治理能力,加強公共數據全生命周期管理,充分利用政務信息化項目管理抓手,將數據治理要求貫穿項目管理始終。五是完善數據基礎體系,以監管促進各級各部門提升公共數據開放的種類、數量和質量。
培育數據標注領軍企業,構建數據產業服務生態。一是建設數據精細化標注平臺,開發智能云數據管理服務系統,研究平臺和服務系統激勵機制,鼓勵企業研究互聯網數據全量實時更新技術、多源異構數據整合和分類方法,研發數據清洗、標注、分類、注釋和內容審查等算法及工具。二是培育本土數據標注領軍企業,積極探索建立一批數據標注產業基地、園區,推動數據的采、存、洗、標、訓等業務全面發展。三是制定數據標注行業發展規劃,逐步完善數據采集標注行業的規范和標準,建立智能語音、計算機視覺、自然語言處理、數據集交換共享、數據集安全隱私等方面的行業應用標準,形成數據標注行業的標準化體系,推動基礎數據服務產業健康有序發展。
培育數據交易市場生態,盤活高質量數據資產池。一是打造數據要素市場和市場化配置改革先行區。加強政策支持和引導,明確試點目標和定位。建立跨部門協調機制,推動數據共享和流通。二是暢通數據交易渠道。鼓勵各類經營主體通過數據交易場所開展數據交易活動,推動區域性、行業性數據流通,鼓勵公共數據加工形成的數據產品和服務進場交易。三是探索多樣化數據定價模式。推動用于數字化發展的公共數據按政府指導定價有償使用,鼓勵企業與個人信息數據由市場自主定價,促進數據要素價格形成。四是拓寬行業數據空間。支持各行業主管部門引導本行業龍頭企業、數據經紀人打造行業數據空間,對符合條件的數據產業給予相應的補貼或稅收優惠,在智能制造、節能降碳、綠色建造、新能源、智慧城市等重點領域,大力培育貼近業務需求的行業性、產業化數據商,助力廣東打造數字經濟創新引領型城市。
作者曾慶鐸、趙超,單位分別系廣東工業大學經濟學院和中共廣東省委黨校校刊編輯部
本文系國家社會科學基金課題(23BJL114)、黨的二十大精神研究專項課題(2022ZXYB07)階段性成果