文心大模型上車(chē) 智能座艙邁入大模型時(shí)代_環(huán)球速遞

2023-05-30 07:31:17|

來(lái)源：21世紀(jì)經(jīng)濟(jì)報(bào)道作者：

隨著AI大模型的持續(xù)演進(jìn)，其應(yīng)用場(chǎng)景也在不斷更新。

“今天我們正站在大語(yǔ)言模型的技術(shù)基點(diǎn)去思考，汽車(chē)?yán)锼枰淖畋举|(zhì)的核心變革點(diǎn)是什么。”5月26日，在21世紀(jì)經(jīng)濟(jì)報(bào)道科技峰會(huì)“潮起AIGC：大模型崛起”北京閉門(mén)會(huì)上，百度智能汽車(chē)事業(yè)部智艙業(yè)務(wù)部產(chǎn)品架構(gòu)師徐嘉南介紹稱(chēng)。

(資料圖片)

在徐嘉南看來(lái)，未來(lái)可移動(dòng)的汽車(chē)機(jī)器人應(yīng)當(dāng)具備自主移動(dòng)及人機(jī)對(duì)話(huà)式交互兩大方向的能力，大語(yǔ)言模型則以其更強(qiáng)的自然語(yǔ)言理解、邏輯推理及創(chuàng)造性為汽車(chē)的智能應(yīng)用帶來(lái)全新的想象空間。

需要注意的是，百度正在進(jìn)行大模型上車(chē)的持續(xù)探索。就在日前，百度Apollo汽車(chē)智能化業(yè)務(wù)展示了以文心大模型為基礎(chǔ)的新一代AI智艙探索成果，這也是國(guó)內(nèi)首個(gè)基于文心大模型在車(chē)載場(chǎng)景下的探索成果，并有望在未來(lái)推進(jìn)量產(chǎn)。

據(jù)介紹，基于文心大模型能力，百度Apollo推出的智艙將具備出行場(chǎng)景對(duì)話(huà)式交互、邏輯推理、策略規(guī)劃和知識(shí)問(wèn)答等多項(xiàng)能力，同時(shí)也能夠?qū)崿F(xiàn)在當(dāng)前智艙命令式交互下覆蓋全車(chē)多音區(qū)、毫秒級(jí)響應(yīng)、免喚醒全時(shí)交互的極致體驗(yàn)。

“從整個(gè)發(fā)展角度來(lái)看，我們認(rèn)為未來(lái)文心大模型會(huì)重塑車(chē)內(nèi)的應(yīng)用和交互，基于文心這樣的能力，把過(guò)去可能我們想到的體驗(yàn)，但是過(guò)去的技術(shù)做不到的能力，去進(jìn)行一次重構(gòu)，給大家?guī)?lái)全新體驗(yàn)?！毙旒文现赋?。

文心大模型上車(chē)

作為智能汽車(chē)的核心，智能座艙隨著汽車(chē)智能化的演進(jìn)而持續(xù)發(fā)生著變化，它也愈發(fā)成為用戶(hù)購(gòu)車(chē)決策的決定因素之一。

徐嘉南指出，當(dāng)前智能座艙的功能正在持續(xù)增加，同時(shí)語(yǔ)音交互的覆蓋率也在持續(xù)增加。據(jù)相關(guān)機(jī)構(gòu)調(diào)研，2022年1-8月，語(yǔ)音交互功能在智能座艙的滲透率達(dá)到73.3%，百度方面則預(yù)測(cè)稱(chēng)，未來(lái)智能座艙的語(yǔ)音交互覆蓋量還會(huì)快速拓展，到2025年會(huì)實(shí)現(xiàn)超過(guò)95%的搭載。

不過(guò)當(dāng)前，智能座艙的語(yǔ)音交互更多是命令式的交互工具，并且系統(tǒng)功能單一，交互系統(tǒng)毫無(wú)智能可言。大模型的落地，則帶來(lái)了全新的可能性，有望推動(dòng)座艙語(yǔ)音助手向“AI智能助手”升級(jí)。

就此，百度Apollo正式推出國(guó)內(nèi)首個(gè)基于文心大模型在車(chē)載場(chǎng)景下的探索成果。據(jù)介紹，基于文心大模型能力，百度Apollo針對(duì)車(chē)載場(chǎng)景進(jìn)行專(zhuān)項(xiàng)訓(xùn)練和模型精調(diào)，無(wú)需人工數(shù)據(jù)標(biāo)注，AI便會(huì)具備更出色的語(yǔ)言理解和學(xué)習(xí)能力。

例如，在出行場(chǎng)景中，小度車(chē)載語(yǔ)音可以幫用戶(hù)進(jìn)行旅途行程規(guī)劃、沿途景點(diǎn)美食推薦。在家庭出行時(shí)，靈感畫(huà)畫(huà)可起到給兒童娛樂(lè)陪伴的作用。只需用一句話(huà)描述想要的畫(huà)作內(nèi)容，AI即可在幾秒內(nèi)按照完成一幅創(chuàng)意畫(huà)作。

同時(shí)，百度也在探索如何借助文心大模型能力重塑個(gè)性化駕駛空間。在未來(lái)，百變?nèi)嗽O(shè)功能可針對(duì)不同場(chǎng)景和不同用戶(hù)特點(diǎn)、偏好，定制個(gè)性化的語(yǔ)音助手人設(shè)，與用戶(hù)進(jìn)行情感化交流。用戶(hù)也可以擁有一個(gè)用車(chē)顧問(wèn)，拋棄陳舊的產(chǎn)品說(shuō)明書(shū)，用戶(hù)可以隨時(shí)隨地、詳細(xì)了解車(chē)輛功能。

此外，大模型融入智艙場(chǎng)景后，百度Apollo智艙也將演變?yōu)椤暗谌羁臻g”的核心載體?？梢砸劳姓Z(yǔ)音助手完成朋友圈文案撰寫(xiě)、沿途景色拍照并一鍵發(fā)送至手機(jī)，也可以在開(kāi)車(chē)途中讓語(yǔ)音助手完成一天的日程安排和會(huì)議預(yù)定等等。

據(jù)介紹，在未來(lái)，大模型加持下的智艙將具備出行場(chǎng)景對(duì)話(huà)式交互、邏輯推理、策略規(guī)劃和知識(shí)問(wèn)答等多項(xiàng)能力，讓車(chē)內(nèi)助手在未來(lái)有能力像真人一樣跟用戶(hù)交流，可以理解并滿(mǎn)足用戶(hù)在車(chē)內(nèi)場(chǎng)景的深層次需求。

“未來(lái)基于文心大模型的能力，車(chē)?yán)锼薪换タ梢杂米匀徽Z(yǔ)言的方式進(jìn)行，而不是以點(diǎn)擊頁(yè)面然后跳轉(zhuǎn)的邏輯進(jìn)行交互，這是大模型給未來(lái)車(chē)機(jī)交互體驗(yàn)帶來(lái)的非常大的變化。”徐嘉南表示，“用戶(hù)直接表達(dá)需求，系統(tǒng)根據(jù)分析和理解，調(diào)動(dòng)應(yīng)用資源進(jìn)行需求滿(mǎn)足。這將改變?nèi)伺c應(yīng)用、甚至人與車(chē)之間的關(guān)系?！?/p>

技術(shù)推動(dòng)變革

身處汽車(chē)行業(yè)劇變的時(shí)代，智能化成為汽車(chē)品牌差異化的重要因素，而智艙是當(dāng)前階段用戶(hù)最容易有感知的智能汽車(chē)配置。

百度智能座艙產(chǎn)品由小度車(chē)載SDK及小度車(chē)載OS構(gòu)成。官方數(shù)據(jù)顯示，百度Apollo始終助力OEM打造智能化競(jìng)爭(zhēng)優(yōu)勢(shì)，其汽車(chē)智能化解決方案已在31個(gè)汽車(chē)品牌的134個(gè)車(chē)型上實(shí)現(xiàn)量產(chǎn)，累計(jì)搭載超700萬(wàn)輛。

同時(shí)，考慮到車(chē)企希望進(jìn)行個(gè)性化、定制化而非千篇一律的體驗(yàn)，希望形成自身的品牌調(diào)性，因而百度進(jìn)一步推出了小度車(chē)載SDK，從而讓車(chē)企實(shí)現(xiàn)差異化設(shè)計(jì)。

其中，在小度車(chē)載語(yǔ)音SDK方面，百度Apollo已經(jīng)實(shí)現(xiàn)了最新的技術(shù)升級(jí)，使其變得更加智能化和易用。

基于大模型本地化，小度車(chē)載語(yǔ)音SDK持續(xù)推動(dòng)座艙極致交互體驗(yàn)?！八^的大模型本地化，是指將云端參數(shù)非常大的模型通過(guò)蒸餾和裁剪的方式，把整個(gè)體積和運(yùn)行資源占用變得更小，然后移動(dòng)到端上，利用本地化的算力去進(jìn)行加速運(yùn)行，從而帶來(lái)更極致的語(yǔ)音交互體驗(yàn)?！毙旒文辖忉尫Q(chēng)。

具體而言，小度車(chē)載語(yǔ)音能夠?qū)崿F(xiàn)流暢的免喚醒多路同時(shí)交互、全頁(yè)面所見(jiàn)所說(shuō)、全域毫秒級(jí)響應(yīng)，讓用戶(hù)像是擁有了一個(gè)隨時(shí)待命的私人助理。

尤其值得注意的是，小度車(chē)載語(yǔ)音還能夠?qū)崿F(xiàn)真多路同時(shí)對(duì)話(huà)能力，最大支持8路同時(shí)交互精確處理，覆蓋整個(gè)座艙內(nèi)外，可以實(shí)現(xiàn)多路同時(shí)、快速、連續(xù)對(duì)話(huà)的極限挑戰(zhàn)。坐在駕駛位、副駕駛位、和后排的每一個(gè)人都可以同時(shí)提出自己的訴求，語(yǔ)音助手不僅可以識(shí)別不同位置用戶(hù)的需求并且可以依次解決。

此外，小度車(chē)載語(yǔ)音還實(shí)現(xiàn)了全領(lǐng)域毫秒級(jí)響應(yīng)，且通過(guò)自動(dòng)識(shí)屏方式實(shí)現(xiàn)用戶(hù)全場(chǎng)景的語(yǔ)音交互體驗(yàn)?！败?chē)?yán)锼械墓δ芏伎梢哉Z(yǔ)音交互，而不是只在某些應(yīng)用里面才能交互，這在我們行業(yè)上是非常大的改變?！毙旒文媳硎?。

在徐嘉南看來(lái)，大語(yǔ)言模型正在推動(dòng)行業(yè)走向真正的對(duì)話(huà)式交互，而它也將帶來(lái)用戶(hù)及產(chǎn)業(yè)層面的深刻變革。

從用戶(hù)層面而言，隨著通用語(yǔ)言模型置入設(shè)備中，其能夠在不同場(chǎng)景下化身不同類(lèi)型的助手，并解決用戶(hù)的專(zhuān)業(yè)問(wèn)題。從產(chǎn)業(yè)層面來(lái)看，車(chē)企未來(lái)在進(jìn)行語(yǔ)音交互功能開(kāi)發(fā)時(shí)，也將從儲(chǔ)備語(yǔ)音開(kāi)發(fā)人員進(jìn)行具體功能設(shè)計(jì)，到配備提示詞工程師進(jìn)行大模型調(diào)教，訓(xùn)練車(chē)機(jī)更好地響應(yīng)用戶(hù)需求。

而想要達(dá)到這樣的變革，就需要堅(jiān)實(shí)的技術(shù)支撐。“百度在整個(gè)行業(yè)內(nèi)擁有深刻的AI技術(shù)積累，擁有全棧自研的AI架構(gòu)，從底層芯片的昆侖芯，到上層深度學(xué)習(xí)框架飛槳，再到AI大模型層，我們能夠基于文心大模型的能力實(shí)現(xiàn)用戶(hù)及車(chē)企所需要的體驗(yàn)?！毙旒文媳硎?。

（文章來(lái)源：21世紀(jì)經(jīng)濟(jì)報(bào)道）

標(biāo)簽：