AI大模型,與傳統文化到底有什么關系?
來源:騰訊研究院 作者:騰訊研究院 時間:2023-07-14
6月21日,在聯合國教科文組織駐華代表處、中國文物信息咨詢中心(國家文物局數據中心)、中國文化遺產研究院的指導下,騰訊SSV數字文化實驗室與騰訊研究院聯合發起“探元計劃2023”。
探元計劃2023,面向人工智能、數字孿生、沉浸式感知交互等創新技術群,聚焦文物、非遺、傳統文化藝術等傳統文化應用場景,征集、遴選創新技術解決方案;騰訊投入千萬級資金,牽引內部近10個核心技術團隊,推動“文化+科技”解決方案的共創落地。
“探元計劃2023”項目征集將于2023年7月底截止,期待更多優質項目加入,共啟中華文化數字生命力新篇章。報名請登錄 “探元計劃2023”項目征集平臺,提交報名信息及相關資料。
?? https://tanyuan.qq.com/tanyuan-plan-2023沈浩:中國傳媒大學教授、博士生導師,媒體融合與傳播國家重點實驗室媒體大數據中心首席科學家,中國市場信息調查業協會副會長,探元計劃2023特邀專家
一、關于“AI大模型+傳統文化”能夠碰撞出什么樣的火花?關于AI大模型與傳統文化領域的碰撞,我認為有四個判斷要點。一是二者融合產物的“形式與內容”;二是生成物的文化屬性與藝術質感;三是生成物的版權;四是文化相關行業的勞動就業。如果按照這個原則來看AI生成內容,目前還存在以下情況:第一,需要認識到,AIGC存在“形式大于內容”的問題。尤其在面對需要邏輯應對、涉及專業知識或最新信息的任務時,AI大模型產出的內容很可能是缺乏事實核查的“虛假信息”。第二,目前AI大模型能夠以極快的速度創作內容,帶來了文化產品數量的海量增長,但這些生成物是否能夠保持文化屬性或藝術美感?這一點值得商榷。如,AI大模型生成的很多數字藏品,僅是文化元素的模式化拼貼,其藝術審美和文化價值大打折扣。第三,版權是文化產業化的生命線,而利用AI大模型生成的文化內容,存在無法確認“自然人創作者”與“人工智能創作者”貢獻度評估的問題。如在“Midjourney案”裁定中,美國版權局拒絕對ChatGPT類產品生成內容進行版權保護。目前,我國對于生成作品的著作權歸屬也未有明確的法律規定。第四,目前生成式AI可能會帶來失業問題,但也會創造出類似“提示工程師”等新的職業,打破文化創意行業門檻,帶來“平民化”或“民主化”發展趨勢。比如,Stable Diffusion、Midjourney等AI生成工具,任何一個賦有想象力的人,都可以使用自然語言創作出此前技術層面難以實現的文化藝術作品,可以達成“創意民主化”“人人皆可創作”的圖景。基于以上利弊,我們把對AI大模型與傳統文化碰撞的思考,帶入文物數字化的應用場景。AI大模型是“大數據+大算力+強算法”結合的產物,能夠存儲和學習大量的文化資源數據并進行獨特的內容呈現,因此,基于國家文化數字化戰略背景的文化資源要素上鏈和上線,將文化數據信息導入模型,就能實現例如探索溯源三星堆歷史。AI大模型有助于提升傳統文化數字孿生的效率和質量。但從目前來看,AI大模型只能簡單地回答問題,難以生成故事序列。因此,如何利用AI生成中國文化主題的圖像、音頻、文本故事序列,如何挖掘和理解文化的內在價值,并據此進行創新性創造,展現高超的敘事水平仍是難題。未來,如果暢想生成式AI應用于文化遺產展覽場景,觀眾只需通過掃描二維碼便可與AI進行對話,就能夠獲得 AI基于歷史文獻和研究數據庫自動生成的虛擬場景和創意內容,以此給予觀眾沉浸式的交流和獨特的互動體驗,我認為這還是具有一定可行性的。二、如何利用AI大模型提升文化資源要素管理和應用的質量和效率?2022年,我國推進實施“國家文化數字化戰略”,推進文化數字化,文化資源采集是前提。雖然我國科技企業擁有海量的互聯網數據,但數據類型不夠全面,文化數據的上線上鏈標準還不統一。AI大模型通過數據復制、學習和訓練,可以提升文化資源要素的管理和應用效率。由于消耗的資源體量巨大,OpenAI會讓用戶通過訂閱的方式來提供更高的訪問優先級、更短的響應時間以及更高版本的模型等,來盡可能釋放算力資源,算力資源消耗較大的項目也將調整經營策略進行收費。國內大型企業為了迅速進入賽道,也競相推出自己的大模型,由此帶來的能源消耗與碳排放壓力是巨大的。因此,在擁抱科技的同時,也建議理性對待大模型的開發使用問題,不同大型企業可以在某種程度上進行數據的共享與資源的整合。在穩步進化的同時,也需要避免過度競賽所帶來的不必要消耗。同時,生成式AI領域的創新發展也意味著在軟硬件關鍵技術上實現突破,需要有產業政策的支持。三、如何創作獨具“中國特色”,應用于文化領域的AI行業大模型?據數據統計,國內已經出現了70多個所謂的AI大模型。但從技術應用的角度來看,中國的很多大模型并沒有發生革命性的迭代,需要考量能否創造或形成在文化垂類領域的獨特性。ChatGPT對眾多行業都是革命性和顛覆性的,對于文化領域更是觸及到了核心區域,也可能會帶來一些相關風險,例如AI大模型在中文文字理解上弱于英文,且在翻譯過程中存有偏差。因此,可能為中文母語用戶帶來認知偏差,為非中文母語用戶在理解中國文化時造成理解困難和理解錯誤。此外,目前國外的AI大模型在編碼與訓練過程中隱含種族、性別、國別、黨派等不公正因素,進一步帶來社會偏見與刻板偏見,致使存在社會極端情緒風險、價值觀風險等意識形態風險。我國如需創作獨具中國特色的AI大模型,至少需要在以上層面扭轉偏差并提供價值。值得注意的是,從數據資源角度來看,英語目前仍是全球通用語言,各國資料數據均會有對應英語版本,英語大模型訓練的語料數據遠高于中文,雖然我國發展人工智能具有海量數據和用戶基礎,但豐富的傳統文化沉淀并未實現數字化,致使可供AI大模型訓練的中文語料有限。比如,為訓練GPT,OpenAI雇傭了肯尼亞勞工進行數據標注產出了海量的訓練數據。而中國的數據資源相對較少,且成本相對較高,這在一定程度上影響了大模型的發展。從技術水平差異來看,中國目前正在相關行業的技術內容上遭受美國“卡脖子”的限制,訓練大模型所需的硬件發展創新遇到一定的瓶頸。從產業全生態來看,美國AI產業生態較為成熟,涵蓋了從數據資源到算法創新的全鏈條,中國初步涉足大模型領域,未來需要進一步加強產業鏈上下游的合作和創新。四、AIGC生成的新內容是否會鼓勵和激發文化創新? AIGC主要是通過復制、學習和訓練現有的內容,利用算法和數據分析生成新的內容,可能會面臨創造力和創新性的限制。因此AIGC在激發文化創新層面,以原真性復原和創新性展示為主,可以為文化的傳承提供新的媒介和途徑。從文化保護的角度來看,AIGC在“習得”了大量的傳統文化語料之后,對于某些瀕臨失傳的傳統文化形式,可以以數字化的形式還原其內容,使這些傳統文化內容或形式得到更好的保護。AIGC生成的內容可以作為一種媒介形式,為傳統文化的傳承提供新的途徑,如虛擬文化展覽、文化主題的互動游戲等,這樣的優勢是可以吸引更多年輕人參與到文化傳承中。在“合理使用”的范圍內,可以通過AI為傳統文化注入一些新的表達方式,比如網上已經有的用模型將二維碼和具有文化特色的水墨畫等結合起來生成可掃碼的圖片,不僅能夠為實用的二維碼增色,還給傳統文化注入了新的表現形式。與之類似的想法,還有利用AI技術將傳統文化特色的作品進行數字化處理,用于保護和保存傳統文化的珍貴資源;利用AI翻譯技術將文學作品翻譯成不同語言,促進傳統文化的國際傳播和交流等等。文化作品和觀眾之間連接的本質是內在的價值共情,AIGC無法取代人類創作的思想獨特性,但AIGC可以充當優秀的“協助者”,通過其擅長的“頭腦風暴”式的內容生成方式,為創作者進行文化創新提供更多元的思路和切入點??傊?,對待AIGC與文化創新,我們需要保持一定程度的理性克制,確保AI訓練不會削弱藝術創造的可持續動力,不會阻礙人類文明的源遠流長。五、AI大模型與傳統文化的創新機會,未來對于文博機構從業者、文化內容創作者、文化科技企業等會帶來哪些范式變化或機遇挑戰嗎?前面提到的“Midjourney案”中,AI繪畫已經開始和人類繪畫師、插畫師“搶飯碗”,威脅到他們的職業發展。在影視領域,有些后期公司對AIGC技術的運用也已經覆蓋全流程,通過提示驅動AI參與基于IP形象訓練的衍生品設計與開發、影視宣發等工作。動漫和游戲行業及其從業者們,紛紛嘗試基于AIGC技術的改變。長遠來看,AI替代文化行業的特定職位甚至顛覆行業生產生態的潮流勢不可擋。需要強調的是,AIGC的普及雖然意味著內容創作門檻的降低,但決不意味著對內容工業化的顛覆。AI生成器是一種知識的“催化劑”,特定內容的生成可以完全由AI生成或主導生成,但原創性和源頭性的專業內容生成仍然離不開兼具專業知識、技術經驗和工業能力的頂尖創作者。大模型通過深度學習等技術,可以對文化遺產進行數字化保護和修復,使得文化遺產得到更好地傳承和利用。對于文博機構從業者來說,大模型的發展將促進數字化轉型和文化創意的創新。AI大模型的應用也會改變傳統文博發揮收藏、展覽和教育功能的方式,需要從業者具備相關的技術和創新能力。AI大模型不僅可以為文化內容創作者帶來靈感,其不斷的發展也將提供更多的創作工具和方式。提供便利的同時也伴隨著新的挑戰,因為大模型的使用可能會導致創作者的作品缺乏獨特性和原創性,需要在創作過程中保持創作者的個性和創新能力。通過利用大模型開發智能化的文化產品和服務,文化科技企業可以提供個性化的文化體驗和定制化的文化產品,提高用戶體驗和文化消費的質量,能夠帶來更多的商業機會和創新空間。六、AIGC的創作,如果僅是“編排方式創新”是否還能繼續享有版權保護?基于大模型一鍵生成“編排式創新”產物,是否應該享受版權保護的問題應該還有待商榷。如學術論文寫作,知名機構如《科學》雜志表示不接受ChatGPT作為論文的作者,AI暫時沒有被公眾廣泛地認為是創作者或創作者的合作者,AIGC到底應歸結于人類的創意和還是機器的創意到現在尚未有定論。區塊鏈技術可能是進行確權和版權保護比較好的選擇,但當下中國沒有公鏈。但有一點,內容是否為AI生成是可以通過算法檢測到的,類似于用“魔法打敗魔法”。七、人工智能技術進入大眾傳播、文化領域,應該如何規范“真實性”? 這就涉及到人工智能技術在圖像、視頻、音頻處理和合成方面的應用,包括圖像編輯、人臉合成和視頻合成等等,這些技術成熟之后便有可能生成一些以假亂真的內容。至于真實性的規范,一方面我們可能需要研發更先進的人工智能技術用于檢測AI生成的圖像和視頻,比如開發一些真實性檢測算法,用來標記這些內容。另一方面我們可能也需要法律政策的約束來禁止和打擊虛假信息的傳播。為確保人工智能技術在大眾傳播、文化領域的應用是真實可信的,是保障社會良性發展和文化傳承的重要一環,我們需要加強數據管理和隱私保護,防止數據被濫用和泄露。需要對大眾進行AI技術的普及和宣傳,提高公眾的科技素養和媒體素養,讓人們更加理性地對待AI技術和文化領域的應用。同時,需加強社會監督和公眾參與,推動AI技術的公開透明和民主參與,避免出現利益輸送和信息不對稱的問題。八、您曾經表達對“技術向善、技術為善”的期待,騰訊也曾經發布過“科技向善”的理念。針對“探元”計劃,您有哪些期待和建議嗎?“探元”計劃是一個很好的嘗試,旨在推動解決文化數字化道路上的一些“卡脖子”問題,將中華優秀傳統文化與科技創新相結合,實現多方共創和融合發展。我們應當始終堅持以“科技向善”為核心,重點關注項目所帶來的社會價值和對中華文化傳承的貢獻。要鼓勵各類企業、科研機構、組織、人員等共同參與到其中,擁抱變化,與時俱進,共同推動我們中華優秀傳統文化與科技創新的融合發展。同時也要注意知識產權保護問題,為參與項目的各方提供知識產權保護指導,確保創新成果得到有效保護。最后?!疤皆庇媱澞軌蛟俅稳〉镁哂虚_拓性的進展,為中華文化傳承與創新發展做出更大的貢獻。