很高興有機會在“新一代AI·新時代金融”論壇與業界和學界的各位同仁和專家共同交流探討人工智能。很長一段時間以來,人工智能一直是一個熱門話題,大家都在期待運用人工智能可以給整個社會發展帶來一些新變化,諸如工業機器人、自動駕駛、無人機等等,都一定程度上改變了我們的生產生活方式。但去年ChatGPT的橫空出世,我們忽然發現可能一個新的時代即將到來,人工智能極有可能從傳統意義上的體力勞動替代向腦力勞動替代轉變,它所帶來的改變和沖擊將是爆炸性和顛覆性的,甚至會改變人類的未來。譬如三五年后,一些崗位是否還需要存在?我們中的部分人是否還能淡定的坐在會場上?可以說ChatGPT開拓了人工智能新的能力前沿和想象空間,也因此引發全球高度關注。在此,我想就人工智能未來的變化以及應對舉措,談一些觀點和想法,供大家參考。
第一個觀點、人工智能發展迎來新拐點
追溯歷史,運用和發展通用人工智能的想法由來已久。上世紀五十年代,提出了著名的圖靈測試。大半個世紀以來,我們一直在探索。最近十年,逐步取得一些突破,譬如AlphaGo驚艷世人。然而,這些產品距離真正的通用人工智能還相差甚遠,基本還停留在大算力和專用能力。但ChatGPT的出現,讓我們所有人真切地感受到新賽道的顛覆性威力。
首先,算力、算法、數據的相互賦能,使人工智能出現了涌現效應。ChatGPT的成功離不開成熟的模型底座、豐富的數據供給和強大的算力支撐。在算法方面,在循環神經網絡、Transformer等算法思想、架構上逐步傳承、積累。從公開數據來看,GPT模型參數從2018年最初的1.17億,到GPT3已達到1,750億,模型參數的規模化提升,使得大模型出現了歷史性的重大拐點,發生了靈光一閃的涌現效應,從涌現到泛化,舉一反三,融會貫通,能夠回答沒有經過特定訓練的問題,目前還很難解釋,但這就是進化。在數據方面,海量增長的數據為模型訓練和應用提供了豐沃土壤。根據IDC數據統計,2022年全球數據總量為103ZB,中國占比接近1/4,預估2027年全球數據總量將達到284ZB。在算力方面,模型訓練參數與算力成正比,據OpenAI測算,自2012年以來,全球頭部AI模型訓練算力每3-4個月翻一番。可以說在算法、算力、數據的共同加持下,目前GPT已支持文本和圖像輸入,在多種專業和學術考試中已經表現出與人類相當的能力,整個學界和業界都在期待大模型繼續向著通用人工智能邁進。
其次,生成式AI改變了人類知識的存儲、傳承和使用方式。過去五千年,人類知識被儲存在文字中,通過文字記錄歷史,探知未來,相互交流。過去三十年,互聯網的誕生,改變了人類記錄知識、獲取知識的方式,通過互聯網,加速了人類應用知識、創造知識的速度。而當下,因為生成式AI的突破式進展,人類的知識體系將被構建到大模型中,這是人類知識存儲、傳承和使用方式的再一次重構,其地位將不亞于文字和互聯網的出現。人工智能從固定任務場景觸發,逐步進化為通過自然語言接受指令、理解人類意圖并不斷迭代,由簡單的“人力替代”向“人機協同”轉變,實現人工智能從交互中學習,與人共同完成知識創造。
第三,人工智能正在由專用能力向通用能力轉變。以往人工智能基本都是專業領域、邊界清晰、定義明確的單一任務模型,任務稍有變化,效果會大打折扣。而以ChatGPT為代表的生成式AI具有了涌現能力、思維鏈推理能力、多模態理解和生成能力,實現了從文本理解到圖像理解,從對話理解到全文理解,從意圖理解到創意實現的根本性改變,不僅能夠完成文學創作、代碼生成、圖片生成等多項任務,而且伴隨數據和參數的規模提升,生成式AI擁有了學習和成長的基因,表現出的學習能力、理解能力已接近人類表現。去年一幅《太空歌劇院》,力壓人類藝術家。可以說AI能力的突破性進展,正在創造歷史,當然如果運用不當,也可能出現顛覆性的災難,AI教父杰弗里·辛頓曾提出警告,人工智能的崛起將對人類生存構成威脅,其威力將與核武器不相上下。
第二觀點、生成式AI將給金融業帶來機遇和挑戰
生成式AI作為走向通用人工智能的關鍵技術路線,正掀起產業變革浪潮。據彭博預測,未來十年,生成式AI市場規模將從2022年的400億美元,增長至2032年的1.3萬億美元,年復合增速有望達到42%。我國高度重視新一代人工智能發展,從中央到地方,都紛紛推出政策,可以說,新一代人工智能的大幕已經開啟,將影響整個社會和未來,金融領域也不例外。
一方面,生成式AI在金融行業的應用還處于探索階段,需要在實踐中尋找合適的突破口,并探索嘗試新的商業模式,進行商業價值驗證。
金融業具備大規模、高質量的數據資源和多維度、多元化的應用場景,是人工智能應用落地較為深入的領域之一。近些年,在智能客服、智慧營銷、智能風控等領域都取得了不錯成績。但是,生成式AI是人工智能領域的一次范式轉變,開辟了新的賽道,大家重新站在了賽道起點,我個人理解,新技術將有助于解決包括金融發展不平衡、不充分的結構性問題,數據要素向數據資產轉化的問題、金融科技人才短缺的問題,以及客戶體驗、運營效率和風險防控等經營效能提升。目前,包括交行在內的部分大型金融機構已在積極布局,推動實現商業價值。
一是探索升級客戶服務能力。生成式AI將變革人機交互方式,賦能差異化的產品和服務創新,促進實現從人性化、個性化到感性化的體驗升級。比如,在精準營銷方面,借助生成式大模型,在灌注專業領域知識后,一方面提升行業洞察能力,另一方面將更為精準地解讀個體個性化需求,幫助實現從理解“客群”到理解“客戶”的跨越,提升客戶服務精準度和滿意度。在智能客服方面,生成式人工智能在準確理解人類意圖,進行流暢、自然、高質量的對話方面具有優勢,甚至能夠體現出一定的共情能力,結合文檔理解分析和生成能力,人機交互的體驗和效率將有望出現質的飛躍。
二是探索提升內部運營效率。探索將生成式AI應用于運營流程優化、運營模式創新、運營知識提供,從而實現運營效率提升、運營成本降低。比如,在軟件研發方面,Gartner預測,到2027年,將有15%的新應用程序由AI自動生成,金融業可利用大模型實現代碼生成、代碼審查等能力,提升研發效率和質量。在智慧辦公方面,可以存儲復雜、專業、動態的制度規范,以在線問答的形式為員工提供高效精準的工作指引,成為提升員工能力的“智慧助手”。
三是探索精準的金融風險防控。生成式AI或將幫助金融機構更快識別、分析和預測風險。比如,在反洗錢、反欺詐方面,可探索借助大模型的泛化能力提升知識圖譜構建效率,從而提高欺詐行為和洗錢活動的識別效果,及時發出預警,在減少客戶損失的同時,降低銀行自身法律合規風險。
當然,有機遇,也必然有挑戰,生成式AI所形成的諸多挑戰,需要加以關注和重點研究解決。
一是大模型對算力、算法、數據的協同提出了更高要求,對基礎設施建設帶來巨大沖擊。萬億級別參數的人工智能大模型是大國重器,不是一般國家、一般企業可以承受的。大模型需要不斷提升算力資源統籌調度能力、算法創新能力和高質量數據要素供給能力。在建設過程中,既需要產業上下游的合力、也需要建立國家、行業、企業的基礎性規劃,在海量數據(603138)收集、數據質量控制、算力大規模組網、算法持續突破等方面統籌推進,解決模型在規模變大過程中引發的一系列工程化問題。
二是數據少、質量差和處理能力弱,將限制了人工智能的應用場景,降低人工智能大模型的“智商”。前期,金融業雖然已經積累了大量數據和數據處理經驗,但相對于大模型需要的數據量、知識密度和處理質量來說,還遠遠不夠。目前,互聯網中文數據相比英文數據還非常少、開源語料庫有限、數據質量參差不齊,細分到金融領域,專業數據和公共數據更加不足,并且由于金融制度的差異,無法完全照搬國外的金融語料、金融知識。而金融服務的專業性、精準性又對人工智能技術的效果和可信度提出了非常高的要求。因此,在豐富數據種類、強化數據治理、提升數據質量、保障數據安全、完善數據共享機制等方面我們還任重道遠。
三是數字時代是生態體系間的競爭,建立適合大模型的商業生態是當下大模型發展的重要挑戰。Win-tel生態體系主導了PC時代,ARM-Android主導了移動互聯網時代,人工智能時代同樣將面臨新的生態體系,以及不同生態間的競爭。在技術生態上,目前尚沒有成熟的軟硬件技術路線,國產化芯片體系建設仍是發展關鍵,通過加大國產化產業扶持和培養力度,將有力提高我國在大模型領域的自主可控能力。其次應用生態、場景生態決定了人工智能走多遠、走多好,尋找合適的商業模式是制勝關鍵,尤其是要不斷豐富人工智能應用場景,目前國內外各大模型廠商已經開始了具有廣泛、豐富能力的智能服務生態體系構建,大模型之爭即將演變為大模型生態之爭。
交通銀行高度重視人工智能技術發展和應用,“十四五”時期致力于打造人工智能新名片。上半年,交通銀行(601328)已成立人工智能聯合創新實驗室,制定GPT大模型建設規劃,組建專項團隊,加快生成式AI在金融場景的應用,推動人工智能與金融相向而行、融合發展。
第三個觀點、應用人工智能需要特別關注幾個方面
提五個方面的意見建議:
一是推進產業協同,共生共贏。大模型基礎投入大、技術門檻高,在建設過程中可能面臨模型優化能力不足、數據算力準備不充分、模型評測體系缺失等不確定性。因此,建議加大產學研合作,構建開放融合生態,建立金融領域可信、安全的生成式AI研究應用生態,積聚行業力量、產業力量,合力解決算力、算法、數據困境。大模型的持續優化需要建立軟硬件協同發展的研發生態,不斷迭代的大規模分布式訓練框架軟件,充分發揮高性能硬件的計算能力,實現海量數據下的模型高效訓練。并且與傳統軟件工程不同,大模型的開發模式已從機器語言轉向自然語言,研發與應用的落地離不開配套的中間件、數據庫、插件等一系列工程化設施,有待國內各方發揮自身優勢,合力共建一個便捷使用、繁榮發展的應用生態。
二是持續提升數據供給質量,重視數據安全和隱私保護。金融業合規性、時效性特點,決定了對模型訓練數據的質量要求更高、更專業、更精準。通過增加代碼語料的訓練,提升的不僅是大模型的代碼生成能力,也提升了大模型的邏輯能力。因此,要將金融大模型效果發揮到極致,光有金融專業數據是不夠的,還需要進一步拓展數據來源,如政務、海關、稅收等經濟數據,水電煤氣等產業公共數據。在此基礎上強化數據治理、規范數據標準,持續提升數據標注質量,持續保證數據可信好用、易用能用。在數據安全和隱私保護方面,ChatGPT引發的安全問題已受到各界關注,數據供給和語料訓練直接關系信息安全,甚至可能影響國家安全。建議研究建立有效的生成式AI應用內部控制機制,確保訓練數據合法依規使用,防止客戶信息、核心商業數據等關鍵信息泄露。
三是強化基礎設施前瞻規劃與統籌。宏觀層面,我國算力產業正進入新一輪發展周期,東數西算、5G網絡與大數據等國家重大工程驅動的新型算力網絡體系正在形成,算力統籌和智能調度能力持續提高。中國在算力總規模上已走在全球前列,但在微觀層面,我國算力市場存在碎片化、區域性、小市場等特征。因此有必要建立國家級的云計算底座作為大模型的基礎設施,有效統籌大模型在訓練、微調、推理等不同環節所需的算力資源,合理分工,統籌規劃,避免大模型基礎設施出現低水平重復建設。可以探索建立行業公有云,提供公正、可信的算力用于訓練行業通用大模型。針對金融、政務等對數據安全要求較高的場景,可以在行業通用大模型基礎上進行專屬私有化模型訓練。以此來降低生成式AI應用的技術門檻,助力產業數字化、智能化進程。
四是加強監管、關注科技倫理。技術本身是中性的,無所謂善惡。合理應用將幫助人類走向進步,濫用誤用將可能引發災難,核的利用就是最好的例證。當前生成式AI在各領域的應用還處于起步階段,大模型的高泛化性、生成式特點讓AI具有了一定的不可知性和不可控性。對大模型高“智能性”的濫用也已經引發問題,比如近期AI換臉詐騙、AI虛假新聞等頻發高發,造成了一定的社會危害。為促進AI健康發展,建議加強對生成式AI應用的科學監管、行業自律及企業自治。要關注生成式AI應用的合理性、準確性、可靠性,建立有效的管控機制和應急策略,避免誤導濫用;要關注生成式AI應用的可解釋性,尊重社會公德、公序良俗,避免出現價值導向偏離、不公平決策、歧視性內容等倫理問題。
五是注重數字素養的建立和人工智能領域專業人才培養。大模型的出現意味著未來人工智能的技術應用將更具普及化、大眾化趨勢,這不僅是一項技術變革,更多的將體現為思維、理念、認知變革的過程。如果說20年前,英語是一種技能,開車是一種技能,未來數字化能力也將是一種基本素養。要推動全員全社會提升數字素養和數字技能,以數字化思維改造經營理念、展業習慣和工作方法。同時,大模型的落地需要人才的支撐和保障。生成式AI的誕生與發展,不僅需要大量硬件加速、服務器架構、模型架構、模型算法、數據庫等科技人才,還將誕生提示(Prompt)工程師等新職業。金融業要加大自身人才引進和培養,構建技術和業務的專業人才隊伍,強化與高校、企業等外部合作,拓寬人工智能人才培養渠道。
各位領導,各位來賓,大模型所代表的公共服務知識體系,未來極有可能成為金融基礎設施的重要組成部分。上海具有金融要素市場齊全、科技創新主體集聚的產業優勢、技術優勢和生態優勢,深處大好環境,交通銀行將不辱使命,愿攜手在座的企業、高校、科研院所,全力推動AI技術的前沿突破,為全社會的數字化轉型做出自己應有的貢獻。謝謝!
【免責聲明】本文僅代表第三方觀點,不代表和訊網立場。投資者據此操作,風險請自擔。
最新評論