我與文化科技融合20年(3):文化和科技融合能帶來怎樣的變化?
■ 高書生
《中共中央關于制定國民經濟和社會發(fā)展第十五個五年規(guī)劃的建議》再次明確,推進文化和科技融合,推動文化建設數智化賦能、信息化轉型,發(fā)展新型文化業(yè)態(tài)。怎么推進?抓手是什么?2025年6月,我在湖南湘西以“文化和科技融合能帶來怎樣的變化”為題談了些想法,現整理如下,供大家參考。
2025年5月,由中央宣傳部主辦的“2025文化強國建設高峰論壇”提出:要推動文化和科技融合,深入實施國家文化數字化戰(zhàn)略,用好人工智能等前沿技術,加快文化建設數字化賦能、信息化轉型。
這就是說,在文化和科技融合、數智化賦能之間,有兩個環(huán)節(jié)作為媒介或抓手,一是實施國家文化數字化戰(zhàn)略,二是用好人工智能等前沿技術。
一、從當下炙手可熱的人工智能談起
黨的二十屆三中全會《決定》在深化文化體制機制改革部分中強調一句話,即加快適應信息技術迅猛發(fā)展新形勢(四中全會《規(guī)劃建議》在文化部分強調“順應信息技術發(fā)展潮流”)。這是最應該引起宣傳思想文化戰(zhàn)線重視的內容。
習近平總書記向2019中國國際智能產業(yè)博覽會致賀信時指出:當前,以互聯網、大數據、人工智能等為代表的現代信息技術日新月異,新一輪科技革命和產業(yè)變革蓬勃推進,智能產業(yè)快速發(fā)展,對經濟發(fā)展、社會進步、全球治理等方面產生重大而深遠影響。
習近平總書記在中共中央政治局第九次集體學習時強調:人工智能是引領這一輪科技革命和產業(yè)變革的戰(zhàn)略性技術,具有溢出帶動性很強的“頭雁”效應。
自2023年ChatGPT出世后,國內涌現了上百個人工智能大語言模型,我們也在研究人工智能如何在宣傳文化領域落地應用。但同技術公司、互聯網大廠等深入接觸后,我們感覺是人工智能落地應用成本過高,大多數宣傳文化機構承受不起。
DeepSeek的橫空出世,打破了國際上“高算力和高投入是發(fā)展人工智能唯一途徑”的迷信,開辟了一條低成本發(fā)展人工智能的可行之路。
低成本是技術普及的基本要求,蒸汽機、電力和計算機的普及如此,人工智能落地應用肯定也會走這條路。
人工智能在宣傳文化領域落地應用,比成本更重要的問題是“幻覺”。
我問DeepSeek,人工智能是否存在“偏科”現象?得到的答案是肯定的。DeepSeek還從技術上做出解釋:理工科知識通常有明確的結構化邏輯和標準答案,更適合AI的符號推理和模式匹配能力;人文社科涉及主觀性、文化語境、價值判斷等復雜維度,對模糊性和多樣性的處理能力仍是AI的短板。
“偏科”的后果就是“幻覺”,即生成與事實不符或文化背景錯位的虛構內容。
在歷史文化問題上的“幻覺”,這是意識形態(tài)管理不能容忍的,也是人工智能落地應用的“一道坎”。
據DeepSeek透露:OpenAI內部評估顯示,約40%的幻覺可追溯至語料問題。
語料來源于數據。而數據恰恰是宣傳文化機構的天然優(yōu)勢,數字化的人類知識成果,是當前人工智能最短缺的“食糧”。
人工智能有三要素,算力、算法和數據。算力和算法是科技的問題,數據是我們的優(yōu)勢。
人工智能是文化和科技雙向奔赴,是文化和科技融合的產物,用公式表達:
人工智能=科技(算力+算法)+文化(數據)
科技已經發(fā)力,文化不能缺席。
二、宣傳思想文化戰(zhàn)線每個單位手里都有“牌”
數據從哪里來?
2022年中共中央辦公廳 國務院辦公廳印發(fā)的《關于推進實施國家文化數字化戰(zhàn)略的意見》明確三個渠道:一是匯集,匯聚全國性文化資源普查數據;二是采集,采集中華民族文化基因數據;三是貫通,貫通已建或在建文化專題數據庫。
1、匯集,全國性文化資源普查數據量十分浩大:
——全國第三次文物普查顯示,全國共登記的不可移動文物共766722處,普查共制作電子數據包2868個,其中文本文件462.1萬個,各類圖紙156.8萬幅,照片228.1萬張,所占空間近8TB;
——第一次全國可移動文物普查僅照片就5000萬張,數據總量超過140TB;
——共著錄登記漢文古籍270余萬部和藏文古籍1.8萬函,2861家單位參與并完成古籍普查登記工作,已累計完成645家收藏單位的《全國古籍普查登記目錄》,共計137種215冊,收錄147萬余條款目;
——全國美術館藏品普查,藏品實際數量592663件,藏品圖片820288幅,數據總量6.9TB;
——全國現存348個劇種,參加普查的戲曲演出團體共有1.2萬個,共收入表格11萬份、圖片4.7萬張;
——被譽為“文化長城”、耗時30年完成的《中國民族民間文藝集成志書》,共計298卷、400冊,約4.5億字,收集相關資料逾50億字(包括曲譜、圖片)。
2、采集,包括開展紅色基因庫建設,對紅色紀念館藏品進行高精度采集、標注,并實現全國聯網,形成中華民族文化基因庫。在數據采集方面,故宮博物院保存約186萬件文物藏品,已有90萬件套實現了數字化采集,占48%左右。中國國家博物館有約143萬件套,70萬件套實現數字化采集,約占49%。中國美術館有約13萬件套藏品,有10萬件套已經實現了數字化采集,約占76.9%。國家圖書館的古籍大約317萬冊件,目前有61萬冊件實現了數字化采集,約占19.3%。
3、貫通,就是按照物理分布、邏輯關聯原則,通過標識解析體系,把已建或在建的文化專題數據庫關聯起來,實現數據互聯互通,通過釋放數據解放文化生產力。
至于已建數據庫(媒資庫)就更多了。比如出版領域,具有一定規(guī)模的數據庫已經不少,期刊領域有同方知網、萬方數據、龍源期刊、維普期刊等大型期刊數據庫,在圖書領域有綜合性的國家數字圖書館、讀秀網、掌閱科技、中文在線、方正電子書等圖書數據庫,專題性的如人民出版社的中國共產黨思想理論資源數據庫、科學出版社的科學文庫、社科文獻出版社的皮書數據庫等,以及專業(yè)性的如中華古籍資源庫、愛如生、翰堂典藏、書同文等古籍數據庫等,還有許多出版社、報社建設了自己的數據庫。
三、文化資源數據如何從能源轉化為能量
數據是新能源,如何將其轉化為能量?這是我們需要進一步探索的問題。
1、數據不標注等于沒內涵
這些年,每個宣傳文化機構都擁有一定數量的數據,但由于大多數沒有標注,許多數據缺乏文化內涵,不能成為真正的生產要素。
數據成為文化創(chuàng)新創(chuàng)造的素材,需要進行深加工:一是要對文化數據進行科學分類。分類標準可參照聯合國教科文組織的文化統(tǒng)計框架,將數據劃分為六大類別,即文化和自然遺產、表演和節(jié)慶活動、視覺藝術和手工藝、書籍和報刊、視聽(音像)和交互媒體、設計和創(chuàng)意服務;二是按照專業(yè)性的知識圖譜進行編目,確定每個數據的方位;三是對文化資源數據的特征進行描述并進行數據標簽化;四是為每一個元素級數據分配ISLI標識編碼。
數據標注具有很強的專業(yè)性,同時也是規(guī)模巨大的新興產業(yè)。
2、數據不標識不易被發(fā)現
數據標注完后不標識,別人無法發(fā)現。從2023年開始,我們在全國建立國家文化大數據標識基地,除了標注外,我們還需要做一個標識。
2021年10月,《文化資源數據分類與代碼》團體標準(/CPRA 301—2021)發(fā)布,按照聯合國教科文組織劃分的六大類別進行分類,代碼采用七位代碼四級分類表示,其中,第1位使用英文大寫字母表示第一級分類,第2位~第3位用十進制表示指定二級分類代碼,第4位~第5位用十進制表示指定三級分類代碼,第6位~第7位用十進制表示四級分類代碼。
四、“數據+”動能轉換催生文化新質生產力
如何將能量轉化為生產力,即新質生產力,這是一個急迫問題。
新質生產力的核心要素也有三個,即新勞動對象、新勞動工具、新型基礎設施。如果不抓住這三個要素,文化新質生產力就無法變成現實。
1、新勞動對象
數據作為新型生產要素已經成為重要勞動對象,這已成為共識。但數據是要分類的,不是指數據分為公共的、個人的、商業(yè)的,而是指從供給和需求角度分類。
當下討論較多的數據,都是在消費過程中產生的,我稱之為需求側數據,這類數據通常包含個人信息,因此確權較為困難。
還有另一類數據,我稱之為供給側數據,它能夠進入生產過程,成為二次創(chuàng)作素材,是真正意義上的生產要素。文化數據屬于這一類,數據的權屬非常清晰。
供給側數據和需求側數據所遵循的規(guī)律是完全不同的。這一點被忽略了,數據要素市場之所以不夠活躍,與沒有認識到數據實際上包含這兩類有直接關系。
2022年中辦國辦文件使用“文化資源數據”一詞,其用意是強調數據來源于文化資源,即文化資源數據是來源于文化資源的數據。
2、新勞動工具
提到新勞動工具,大家不約而同地指向了生成式人工智能。
如前所述,幻覺率高是人工智能在宣傳文化領域落地應用的“一道坎”,怎么降低幻覺率是關鍵問題。
我提出一個觀點:人工智能一定要分層,即基礎層、行業(yè)層和應用層,通過每一層來降低幻覺率。
在基礎層,即通用大模型訓練層,科技公司要攻克AI在人文社會科學方面的短板,將歷史文化特別是中華歷史和文化的數據轉化為語料,能夠“喂養(yǎng)”大語言模型,降低大語言模型在歷史文化方面的幻覺率。
在行業(yè)層,我提出了對象化模型的概念,怎么理解?舉個例子,中國戲曲出版社接入開源大語言模型,運用自有數據研發(fā)出“戲曲模型”,通過蒸餾或其他方式提供給全國1888家院團使用,院團接入“戲曲模型”運用自有數據研發(fā)出場景模型,這樣做既可以把“幻覺率”降到最低程度,又可以讓人工智能低成本落地應用,還可以打消院團數據外泄的顧慮。以此類推,中國文物出版社或中國文物報可以研發(fā)“文物模型”,供全國6000多家博物館使用。
每一個文化機構在開發(fā)場景應用時,通過私有化部署,用數據進一步降低幻覺率,人工智能才可以真正地落地。
3、新型基礎設施
新型基礎設施,即信息基礎設施或數據基礎設施,宣傳文化領域是否有數據基礎設施?
夯實文化數字化基礎設施,是2022年《關于推進實施國家文化數字化戰(zhàn)略的意見》文件明確的八項重點任務之一,即依托現有有線電視網絡設施,廣電5G網絡與互聯互通平臺,部署提供標識編碼注冊登記和解析服務的技術系統(tǒng),完善結算支付功能,形成國家文化專網以及國家文化大數據體系的省域中心和區(qū)域中心,服務于文化資源數據的存儲、傳輸、交易和文化數字內容分發(fā),這就是宣傳文化領域的新型基礎設施。
關聯形成中華文化數據庫,是2022年《關于推進實施國家文化數字化戰(zhàn)略的意見》文件明確的第一項重點任務,即依托信息和文獻領域相關國際標準,在文化機構數據中心部署底層關聯服務引擎和應用軟件,按照物理分布、邏輯關聯原則,關聯形成中華文化數據庫。
中華文化數據庫并非將所有宣傳文化機構的數據匯集在一起,而是按照統(tǒng)一的標準以及物理分布、邏輯關聯原則,將零散的、不同領域、不同形態(tài)的數據關聯起來。
怎么關聯?關聯的標準和接口必須統(tǒng)一。
標準統(tǒng)一就是依托我國提案創(chuàng)建的國際標準,即關聯標識符國際標準——ISLI(英文全稱International Standard Link Identifier),這是信息與文獻領域唯一標識實體之間關聯關系的全球通用標識符,但不替代各個行業(yè)正在執(zhí)行的標識符標準。
依托我國提案創(chuàng)建的關聯標識符國際標準(ISLI)進行技術架構,即在廣電網絡公司機房部署提供標識編碼注冊登記和解析服務的技術系統(tǒng)、在文化機構數據中心部署底層關聯服務引擎和應用軟件,就可以形成了全國范圍內互聯互通的數據基礎設施,即國家數據局正在推動的“可信數據空間”,我稱之為“文化數字化的技術底座”。
五、接入國家文化專網輕松跨越“數字鴻溝”
如何跨越“數字鴻溝”,即完成數字化轉型升級,是所有宣傳文化機構面臨的棘手問題,也是非常大的挑戰(zhàn)。
宣傳文化機構在數字化轉型升級中的痛點主要有三個,第一是數據安全,第二是數據確權,第三是技術。
這幾年,我們組織成員單位基于國家文化專網開發(fā)了8項基礎性業(yè)務,包括數據安全、數據確權、數據加工、數據交易、數據分發(fā)、算力服務、人工智能服務和數據資源入表服務等,每一項都直擊宣傳文化機構在數字化轉型升級過程中的痛點。
只要接入國家文化專網,宣傳文化機構就可以搭建一條文化數字化生產線,這條生產線集成了以上8項基礎性服務,為宣傳文化機構排憂解難。
文化人最擅長做內容,最不擅長做生意。
宣傳文化機構有兩塊短板,第一是經營,第二是技術。
實施國家文化數字化戰(zhàn)略,就是要解放文化人,讓他們從不擅長、不熟悉、不精通的業(yè)務中解放出來,專心做內容。
推動宣傳文化機構數字化轉型升級,一定要便捷化,便捷到文化數字化跟數碼相機一樣簡單,用數碼相機照相不需要懂光學原理,只要會取景、會按快門,就能照出好照片(好內容)。
實施國家文化數字化戰(zhàn)略催生出一條新賽道:
國家文化專網如同高速路,每一個宣傳文化機構如同跑在高速路上的新能源車,文化產權交易所如同高速路上的服務區(qū),版權保護如同裝在新能源車上的ETC,8項基礎性服務可以集成到充電樁,新能源車只要能夠接通充電樁,就可以享受基礎性服務。
六、挖掘地域文化助力文化和旅游深度融合
雖然我在文化和旅游融合領域研究不多,但可以從另一個角度助力文化和旅游深度融合,即挖掘地域文化。
過去我們不太講地域文化,實際上地域文化對整個旅游帶來許多意想不到的好處。
只要有中華民族鮮明生活的地方,都有特色鮮明的地域文化,可以從中挖掘出許多有價值的內涵和內容。地域文化應該成為旅游地文化體驗的重點。
在公共文化機構中,無論是地方志還是檔案館、文化館、圖書館和博物館都與地域文化密切相關,這些都是地域文化的物化或者載體。
將原本收藏在地方志、博物館、圖書館、美術館以及電臺電視臺的數據活化到旅游景區(qū),就可以實現白天看景、晚上體驗文化,留住游客。
七、數字化賦能公共文化服務“即時可得”
2010年我們在制定國家“十二五”時期文化改革發(fā)展規(guī)劃綱要時,曾提出一個“公共文化服務圈”的概念,城市叫“15分鐘服務圈”,農村叫“1小時服務圈”。其實,在數字化時代,公共文化服務不存在時間差,無論在什么地方,在什么時間都可以享受到公共文化服務。即時可得應當成為數字化時代公共文化服務應當追求和能夠實現的目標。
黨的二十屆三中全會明確提出要完善公共文化服務體系,建立優(yōu)質文化資源直達基層機制。我們在10多年前進行過探索,即電視圖書館實驗項目,將其作為“十二五”時期文化數字化建設的先導工程。
該項目把電視機作為公共圖書館的終端,通過有線電視網絡將百萬圖書進入千萬家庭。2012年在北京歌華有線進行試點,2017年擴大到其他9個省市,覆蓋5000萬高清用戶。
該項目證明,優(yōu)質文化資源直達基層是可以實現的,文化企業(yè)也可以承擔公共文化服務的任務(通過政府購買)。
更為重要的是,電視圖書館試驗項目運行7年多,沒有發(fā)生過一起盜版事件,充分證明數據安全是有保障的。
八、數字化文化消費新場景“近在咫尺”
2022年《關于推進實施國家文化數字化戰(zhàn)略的意見》文件明確提出:集成全息呈現、數字孿生、多語言交互、高逼真、跨時空等新型體驗技術,大力發(fā)展線上線下一體化、在線在場相結合的數字化文化新體驗。
數字化文化消費新場景包括線上和線下兩部分,線上主要是指大屏和小屏,大屏主要指電視機;線下包括新時代文明實踐中心、學校、公共圖書館、文化館、博物館、美術館、影劇院、新華書店、農家書屋等文化教育設施,以及旅游服務場所、社區(qū)、購物中心、城市廣場、商業(yè)街區(qū)、機場車站等公共場所。
文化重在體驗,這點大家都已經認識到了,但文化體驗需要場景?,F在的技術已經實現,只要有空間就能營造出場景。在這方面宣傳文化系統(tǒng)大有可為。公共文化設施存在閑置、利用率不高的問題,文化體驗可以彌補這個問題。
《關于推進實施國家文化數字化戰(zhàn)略的意見》明確提出,要鞏固和擴大中華文化數字化創(chuàng)新成果的展示空間,包括在旅游服務場所、城市廣場等建設文化體驗園,在學校、公共圖書館、文化館、博物館、美術館等建設文化體驗館,在影劇院、新華書店、農家書屋、社區(qū)、購物中心、城市廣場、商業(yè)街區(qū)、機場車站等建設文化體驗廳。
總而言之,可以將數據活化到數字化文化消費新場景之中。
文化消費并非僅通過發(fā)放幾張消費券就可以解決。我一直強調一個觀點,在文化領域供給決定需求,并非是大家不消費,而是沒有提供優(yōu)質產品吸引大家消費。
中央一直強調供給側結構性改革,在宣傳文化領域如何推進?需要探討如何激活文化資源,將其轉化為數據,并利用這些數據打造新的場景和產品。
我有個預言:未來3到5年內,文化體驗將成為文化消費的主流。
(本文作者高書生,系中共中央宣傳部原文改辦副主任、一級巡視員)








