智駕網(wǎng) 2025-02-18 13:34
階躍星辰與吉利宣布聯(lián)合開源兩款多模態(tài)大模型,視頻生成堪比Open AI sora?
分享
階躍星辰表示,在兩款大模型的研發(fā)過程中,雙方展開了深度合作,在算力算法、場景訓練等領(lǐng)域優(yōu)勢互補,顯著增強了多模態(tài)大模型的性能表現(xiàn)。

今天(2月18日),AI大模型公司階躍星辰宣布與吉利汽車集團聯(lián)合開源了兩款階躍Step系列多模態(tài)大模型——Step-Video-T2V視頻生成模型和Step-Audio語音模型。


階躍星辰表示,在兩款大模型的研發(fā)過程中,雙方展開了深度合作,在算力算法、場景訓練等領(lǐng)域優(yōu)勢互補,顯著增強了多模態(tài)大模型的性能表現(xiàn)。


根據(jù)技術(shù)報告中的評測結(jié)果,階躍Step-Video-T2V的參數(shù)量和模型性能目前在全球開源視頻生成領(lǐng)域都處于領(lǐng)先水平,其參數(shù)量達到300億,可以直接生成204幀、540P分辨率的高質(zhì)量視頻,是當前全球范圍內(nèi)參數(shù)量最大、性能最好的開源視頻生成大模型。


階躍Step-Audio是行業(yè)內(nèi)首個產(chǎn)品級的開源語音交互模型,能夠根據(jù)不同的場景需求生成情緒、方言、語種、歌聲和個性化風格的表達,能和用戶自然地高質(zhì)量對話,是行業(yè)內(nèi)首個產(chǎn)品級的開源語音交互模型。


模型生成的語音具有自然流暢、高情商等特征,同時也能支持不同角色的音色克隆,可應(yīng)用于影視娛樂、社交、游戲等行業(yè)場景。


階躍星辰是吉利汽車集團的科技生態(tài)戰(zhàn)略合作伙伴,擁有國際頂尖的算法團隊,由原微軟全球副總裁姜大昕創(chuàng)立于2023年4月,隨后即與吉利便在預(yù)訓練大模型、垂直領(lǐng)域大模型、應(yīng)用場景設(shè)計、工程開發(fā)等方面展開了深度合作。


其中,吉利牽頭了場景設(shè)計、模型測評、工程開發(fā)等業(yè)務(wù),階躍星辰主導了模型預(yù)訓練等業(yè)務(wù),雙方優(yōu)勢互補,顯著增強了兩款階躍Step系列多模態(tài)大模型的性能表現(xiàn)。

 

吉利汽車在2022年建成全球車企首個 “云、數(shù)、智”一體化的星睿智算中心,在2023年發(fā)布了全球首個汽車行業(yè)全棧自研全場景AI大模型——星睿AI大模型,2025年,發(fā)布了行業(yè)首個“智能汽車全域AI”技術(shù)體系。

 

此次,吉利與階躍星辰聯(lián)合開源的階躍Step系列多模態(tài)大模型,也將助力吉利的汽車產(chǎn)品在智駕和智艙兩個維度在行車安全、緊急避險、智慧泊車等全場景為用戶帶來自動駕駛程度更高、更安全的高階智駕體驗,同時打造更加智能的汽車情感座艙,重新定義人車交互體驗,推動AI科技在智能汽車領(lǐng)域的普及應(yīng)用。

 

吉利星睿AI大模型中的AI Drive大模型,具備強大場景生成與規(guī)劃能力,能夠根據(jù)雨雪等不同天氣光照條件、道路結(jié)構(gòu)、擁堵路況、立體車庫和不常見的交通目標,構(gòu)建出真實駕駛中難得一遇的極端駕駛場景。

 

基于真實的駕駛視頻數(shù)據(jù)去優(yōu)化階躍Step-Video-T2V,可以將它變成一個自動駕駛數(shù)據(jù)合成器。

 

星睿AI大模型正在探索將這些豐富的合成場景轉(zhuǎn)換成“以假亂真”的訓練數(shù)據(jù),相當于自動駕駛系統(tǒng)打造了一個豐富的"虛擬駕考考場",從而顯著提升車輛在智駕行駛時面對各種路況的應(yīng)變能力,保障行車安全。

 

在階躍Step-Audio大模型超強交互功能賦能下,吉利星睿AI大模型可以大幅提升語音指令響應(yīng)速度,以及交互過程的情感理解與表達能力。


當用戶說“導航,快遲到了”的時候,系統(tǒng)不僅會自動規(guī)劃更快路線,還會主動詢問是否需要播放輕音樂緩解情緒。同時,系統(tǒng)不僅可識別粵語、四川話等豐富的方言,還支持個性化聲音定制,用戶既可以選擇系統(tǒng)提供的人聲音色,也能錄制孩子的笑聲制作專屬提示音,甚至讓車載AI模仿山澗流水聲營造車內(nèi)冥想空間。


此外,吉利也與DeepSeek完成了深度融合,通過攜手DeepSeek-R1模型,吉利將對星睿車控FunctionCall大模型、汽車主動交互端側(cè)大模型等進行蒸餾訓練。


屆時,吉利智能汽車AI不僅能對用戶的模糊意圖實現(xiàn)精準理解,進而準確調(diào)用約2000個車載接口,還能基于車內(nèi)外場景主動分析用戶潛在需求,并為用戶主動提供車輛控制、主動對話、售后等服務(wù),智能交互體驗將大幅提升,加速AI在智能汽車領(lǐng)域普及。

 

目前,基于“智能汽車全域AI”技術(shù)體系打造的AI銀河精靈、Flyme Auto 智能座艙、無界空間、AI云動力、AI繪本、AI哨兵等一系列AI應(yīng)用,已在銀河E8、銀河E5、銀河星艦7EM-i等車型上搭載。


今年3月初,吉利還將對外發(fā)布重磅AI智能化戰(zhàn)略,加速推動AI數(shù)字底盤、高階智能駕駛等最新AI技術(shù)的逐步上車,為用戶帶來顛覆性的智能化體驗。 


x

收藏 0
打賞
相關(guān)標簽:
電話:010-65030507
郵箱:editor@autor.com.cn
地址:北京市朝陽區(qū)朝外大街乙6號朝外SOHO D座5097室
北京智駕時代傳媒科技有限公司          Copyright © 2014 - 2022
Autor.com.cn All Rights Reserved. 版權(quán)所有 AutoR智駕 智能汽車網(wǎng)
京ICP備14027737號-1      京公網(wǎng)安備 11010502038466號
電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證:京B-20211307
關(guān)注官方微信