7月13日,京東言犀大模型在2023京東全球科技探索者大會暨京東云峰會上推出。與通用大模型相比,這一源于產業、服務產業的大模型,融合70%通用數據與30%數智供應鏈原生數據,具有“更高產業屬性、更強泛化能力、更多安全保障”的優勢,致力于深入零售、物流、金融、健康、政務等知識密集型、任務型產業場景,解決真實產業問題。
為夯實產業應用,京東推出了一套大模型的完整工具,包括支撐大模型研發的基礎設施——言犀AI開發計算平臺、向量數據庫、混合多云操作系統云艦、高性能存儲平臺云海、軟硬一體虛擬化引擎京剛等核心產品。
依托京東言犀大模型,以及京東在產業和供應鏈側的優勢,京東還發布了兩大服務平臺,包括全新升級的優加DaaS和言犀智能服務平臺,以及面向零售、金融、城市、健康、物流五大領域的行業解決方案。
京東集團CEO許冉表示:“京東的大模型技術演進,遵循了京東的技術追求:成本、效率、體驗、可信、普惠、突破。成本、效率和體驗是從京東的經營理念傳承而來,也是零售的第一性原理。可信、普惠和突破則是技術服務于產業和社會的承諾。”
京東相信,京東關于技術追求的內涵,在以大模型為代表的AI技術領域,能夠讓產業伙伴更加放心和低門檻地使用技術創新的成果,幫助技術走出實驗室和公司的圍墻,真正推動行業生產效率的提升,在產業場景發揮更大價值。
京東集團CEO許冉演講
最懂產業的大模型,用產業數據和Know-how創造價值
“大模型真正實現自己的價值,一定是在產業應用中。”許冉表示,大模型的價值=算法×算力×數據×產業厚度的平方。“前三個指標固然重要,但技術在產業場景落地應用,創造實際價值才是關鍵。當產業效率和產業的邊界拓展得到質的提升以后,大模型才有了更重要的實際價值和意義,這將不亞于又一次工業革命。”
“從產業端切入大模型,如同從北坡攀登技術珠峰,道路雖然更加艱難,卻有更波瀾壯闊的風景。”許冉說。
京東集團CEO許冉演講
產業場景是京東非常擅長的領域。京東作為一家新型實體企業,自身發展就來自產業場景歷練,擁有包括零售、物流、科技、健康、工業、產發等豐富的產業布局。這為京東積累下每年數百億條優質交互數據,訓練言犀大模型的數據庫,就由70%通用數據和30%供應鏈原生數據組成。
深厚的產業數據積累,以及千行百業Know-How,成為京東布局大模型的核心優勢,訓練出的大模型天然具備“產業基因”。此外,言犀大模型還具備行業泛化能力,并能夠保障客戶在云上云下安全使用。
“數智供應鏈訓練了產業大模型,而大模型則依托供應鏈深入產業”,京東集團技術委員會主席、京東云事業部總裁曹鵬如是說。
京東集團技術委員會主席、京東云事業部總裁曹鵬演講
對于大模型的應用實踐,京東也有明確的“三步走”規劃。目前,京東云已經基于內部實踐構建了通用大模型;到今年年底這段時間,京東將經由高復雜場景大規模錘煉,迭代出扎實的產業服務;預計在2024年初,會將大模型能力向外部嚴肅商業場景開放。目前,京東已經走到第二步,并在內部取得了豐富的實踐成果。
“某種意義上,我們的大模型相當于既做了通識教育,又讀了四年專業性的本科教育”, 京東探索研究院院長、京東科技智能服務與產品部總裁何曉冬博士表示。大模型的難點不在技術追趕,而是產業突破。京東言犀大模型的產業實踐,是京東非常關注的部分。
京東探索研究院院長、京東科技智能服務與產品部總裁何曉冬博士演講
構建大模型“訓練營”和“彈藥庫”,打通技術落地每一步
京東從很早就開始布局大模型。2021年,京東就推出十億級模型K-PLUG,2022年推出百億級模型Vega,本次大會則展示了千億級模型。
正是提早布局,讓京東形成了一套大模型的完整工具鏈:言犀AI開發計算平臺、向量數據庫,以及全新升級的基礎設施云艦、云海和京剛。
京東的言犀AI開發計算平臺,能夠為客戶的大模型開發和行業應用開發,提供定制化解決方案。它既具備行業知識庫,沉淀了京東自己的零售、物流、健康、金融等行業Know-How,又具備100多種訓練和推理優化工具,能將通用模型迅速轉化為專業模型。
在大會現場,京東演示了將通用大模型轉化為健康產業大模型的操作。通常,客戶完成這套流程,從數據準備、模型訓練到模型部署,需要10余名科學家花費一周時間。但利用言犀AI開發計算平臺,只需要1-2名算法人員,在數分鐘就能完成。通過平臺模型加速工具的優化,還能節省90%的推理成本。
京東健康發布的京醫千詢大模型,就是建立在京東言犀通用大模型基礎之上,能快速完成在醫療健康領域各個場景的遷移和學習,從而實現產品和解決方案的全面AI化部署,能為遠程醫療服務提供堅實的技術底座。
京東集團副總裁、京東健康技術產品部總經理李欣演講
此外,京東還展示了金融領域AI營銷運營平臺。使用者通過簡單的對話,就能一站式生成營銷活動,覆蓋運營策略制定、營銷任務調度編排、搭建活動頁面、批量生成營銷文案和素材、數字化投放等方面。過去這套流程需要產品、研發、算法、設計、分析師5類職能人員,如今減少到1人;過去流程需要2000次人機交互,也減少到少于50次。在大模型能力的加持下,營銷方案的生產效率有了百倍提高。
在電商領域,京東云AIGC內容營銷平臺也大有作為。從一張商品圖出發,它能夠理解商品特征,快速勝場電商運營需要的商品主圖、營銷海報圖和商詳圖等,滿足商家快速開店和營銷的需求。有了人工智能的加持,每套圖的制作成本能降低90%,制作周期也從7天縮短到半天。
以財富場景為例,目前京東機構基金代銷系統中已經上線言犀有方模塊,給機構客戶提供更便捷的基金篩選和投研分析功能。
如果說言犀AI開發計算平臺是大模型的“訓練營”,向量數據庫則是大模型的“彈藥庫”,是大模型使用數據的橋梁。京東從2019年開始研發向量數據庫,歷經電商大促場景磨練,向量數據庫Vearch已經能支撐百億級高性能檢索,延時降低到毫秒級,可用性達到99.99%,已經服務超過100家大中型企業用戶。京東將向量數據庫用于大模型預訓練,將推理成本降低了80%。
對大模型所需的計算資源,京東也做出了充分的準備。在重慶太陽島,京東全國首個超算中心——天琴α集群正日夜不停地運轉,推理速度較過去提升6.2倍,推理成本節約90%,成為技術創新背后強大的算力支撐。
京東云的三個核心產品,此次也迎來升級:全新升級的混合多云操作系統云艦,將GPU/NPU的資源成本降低50%,并提供行業最高的業務連續性承諾。高性能存儲平臺云海,將單集群每秒讀寫性能提升5倍,達到千萬級;時延降低50%,達到百微秒級;使用成本則降低30%。軟硬一體的虛擬化引擎京剛,將虛擬化卸載到智能網卡中,虛擬化損耗降至0,網絡性能提升高達4倍,并支持100Gb VPC網絡,云硬盤單實例性能突破百萬IOPS。
升級多場景解決方案,技術創新讓產業受益
伴隨技術進步,產業應用已經從流程驅動和數據驅動,進化到知識驅動階段。京東也升級了兩個能夠積累高質量行業數據的平臺:全新的優加DaaS和言犀智能服務,來支撐產業應用對數據的新需求。
新升級的優加DaaS具備三個優勢:更多維,既包括企業自身的數據,也能實現企業和京東及生態數據的安全互通和融合;更易用,大幅提高交互體驗、降低使用門檻,用簡單描述即可生成答案;更簡單,串聯數據開發平臺、數據服務平臺、數據可視化平臺等的原子能力,將原本復雜系統間的操作簡化。
言犀智能服務升級后,也具備了更豐富的交互渠道,覆蓋從智能客服到直播間,從移動終端到線下智能端;更生動的交互效果,支持語音、視頻、文字等方式;更專業的交互內容,生成的專業領域交互內容,更加可控、可用。目前,它已經服務于12345熱線、銀行數字員工、專家診斷場景等嚴肅場景。
技術要實現產業價值,供應鏈是重要的抓手。京東云深入全渠道一盤貨、供應鏈金融科技、產業協同、數據中臺、數字倉庫等20多個數字化場景,已經服務100座城市、2500+家大型企業、944家金融機構和超250萬家中小微企業。這些千行百業的數字化實踐,成就了最懂產業的云。
“智能化優先在數字化領先的行業發生”, 京東集團副總裁、京東科技產品與解決方案總裁高禮強表示。在零售、金融、城市、物流等多個場景,京東都發布了全新的智能化解決方案,借助大模型能力實現服務能力的升級。
京東集團副總裁、京東科技產品與解決方案總裁高禮強演講
在本次大會上,京東物流發布了一站式數智化供應鏈數據管理平臺京慧3.0,在大模型的加持下,其銷量預測、庫存、供應及補貨計劃方面更具表現力,其交互式供應鏈控制塔能夠幫助用戶快速定位并解決供應鏈問題,實現降本增效。
過去人工智能的發展歷程,曾經數次達到應用爆發的邊緣,但很多都沒有創造出很大的價值,技術沒有在產業端形成扎實的應用是重要的原因之一。作為新型實體企業,京東一直根植并服務于實體經濟,在大模型的產業應用過程中更是憑借扎實的產業積累,勾畫了一條以實助實的產業價值創造路徑。
在大會現場,京東宣布攜手零售和金融行業伙伴,在零售場景探索供應鏈優化、顧客體驗、營銷降本增效等方面,在金融場景探索金融客服、智能投顧、產品營銷等方面,共建零售和金融行業的大模型創新應用。
正如許冉所說:“京東發展大模型的旅程,注定會與產業伙伴攜手同行。京東會與產業伙伴緊密合作,通過技術創新持續為產業高質量發展貢獻力量。”