酷睿輕薄本也能運行大語言模型，英特爾推動 PC 生成式 AI 落地

2023-08-24 11:45:10|

來源：IT之家作者：

IT之家 8 月 24 日消息，2023 年 8 月 18 日上午，英特爾在大灣區(qū)舉辦了一場技術(shù)分享會，主題是英特爾在 AIGC（人工智能生成式計算）領(lǐng)域的最新進展。會上，英特爾的技術(shù)專家向與會者展示了他們在 AIGC 上的技術(shù)方向，并進行了多個應(yīng)用的演示。

(資料圖片僅供參考)

首先，英特爾介紹了他們在大語言模型方面的優(yōu)化和支持。在我們傳統(tǒng)的認知里，運行類似 ChatGPT 這種大語言模型必須要有大顯存的顯卡支持。但這場交流會卻顛覆了我們的認知。英特爾為了讓 12、13代酷睿平臺也能夠順利運行各種大語言模型并提供流暢的使用體驗，構(gòu)建了 BigDL-LLM 庫。通過這個庫，可以對各種大語言模型進行優(yōu)化和支持，包括一些開源的、可以在本地運行的大語言模型。這個庫甚至可以在一臺搭載 16GB 內(nèi)存的英特爾輕薄本的機器上運行參數(shù)量高達 16B 的大語言模型。此外還支持 LLaMA / LLaMA2、ChatGLM / ChatGLM2 等多個大語言模型。

接下來，英特爾展示了他們在大語言模型應(yīng)用方面的表現(xiàn)。通過集成了 ChatGLM2、LLaMA2 和 StarCoder 這三個大語言模型的 Demo，他們演示了這些模型在中文和英文應(yīng)用上的表現(xiàn)。通過優(yōu)化和量化操作，這些大語言模型在生成回答時能夠以非常快的速度生成，并且不影響閱讀體驗。英特爾已經(jīng)發(fā)布了這套 Demo，任何搭載 12、13代酷睿的電腦都可以直接安裝并體驗。

我們這里選擇了一臺通過英特爾Evo平臺認證的輕薄本：華為 MateBook 16s 來進行測試。處理器為酷睿 i9-13900H + 32G 內(nèi)存，看看在核顯輕薄本上究竟能不能跑 AIGC。

英特爾大語言模型的 Demo 安裝過程非常傻瓜，英特爾已經(jīng)打包成了 EXE 文件，安裝并導(dǎo)入.Bin 格式的大語言模型就可以運行了。打開界面我們可以看到左側(cè)可以選擇聊天內(nèi)容、調(diào)整模型參數(shù)和查看運算延遲，右側(cè)則是聊天框。

筆者先嘗試問了他一些人情世故方面的問題，沒想到回答非常出色，響應(yīng)速度也很快。這樣一個問題只花了 658.87ms 就完成了響應(yīng)。

在運算過程中我們可以看到，i9-13900H 占用率達到了 100%，內(nèi)存占用達到了 16G，Xe 核顯也有一定占用?？磥磉@個運算過程確實是在本地進行的。經(jīng)過英特爾不斷的優(yōu)化和 13代酷睿處理器算力的提升，我們真的在輕薄本上實現(xiàn)了 AIGC 的落地。

在情感分析功能中，我們讓大語言模型分析了一段經(jīng)典散文?？梢钥吹诫m然分析的角度比較淺顯，但沒有邏輯錯誤，還是可以自洽的。

而在這個中文翻譯功能中，英特爾大語言，模型的表現(xiàn)就更加令我意外了，它的翻譯質(zhì)量相當(dāng)高，速度也很快。哪怕是有如此多專有名詞的稿件，也能準(zhǔn)確無誤地翻譯。

在故事創(chuàng)作方面，這套大語言模型也展現(xiàn)出了令我驚訝的邏輯能力和創(chuàng)造能力。我這邊讓它寫一篇關(guān)羽大戰(zhàn)林黛玉，最后林黛玉取勝的故事。但 AI 居然認識到了這兩人根本不是一個時代的，最后寫了一個穿越時空的戲碼，雖然漏洞百出，但大體上沒有問題。

生成大綱功能則是一個非常有用的功能，我們只要輸入想要撰寫的稿件，就能幫我們列出一套邏輯清晰的稿件大綱了。這對于經(jīng)常需要寫文章的群體來說能起到很好的輔助作用。

信息提取功能對于經(jīng)常需要閱讀報告的群體來說很有幫助?？梢钥焖購拈L篇文章中提取核心信息。我這邊嘗試讓 AI 從英文文章中提取中文信息，效果卻依然非常好。

最后，筆者讓 AI 給出一份青島美食建議和青島旅游建議。由于這個大語言模型是完全離線運行的，所以給到的信息也會比較陳舊，但單從撰寫水平來看還是不錯的。

除了大語言模型應(yīng)用外，英特爾還展示了在 AI 文生圖算法 Stable Diffusion 上的支持。他們啟用了 OpenVINO 的加速，開發(fā)了一套 AI 框架，通過一行代碼的安裝，就可以加速 PyTorch 模型的運行。通過 Stable Diffusion 的 WebUI，可以在集成顯卡和 Arc 獨立顯卡上運行 Stable Diffusion Automatic1111。通過演示，可以看到在 Evo 輕薄本和搭載 i7-13700H 處理器的機器上，Stable Diffusion 在集成顯卡上的表現(xiàn)效果。96EU 版本的英特爾銳炬 Xe 顯卡強大的算力，可以支持 Stable Diffusion 軟件上運行 FP16 精度的模型，快速生成高質(zhì)量圖片。

同時，他們還展示了在搭載 i7-13700K CPU + Arc A770 獨顯的機器上運行 Stable Diffusion 的效果，速度非?？?。

此外，英特爾還展示了基于 Arc 顯卡的人物動作的三維數(shù)字重建技術(shù)。通過 Arc 強大的算力和 OpenVINO 框架對 AI 算法的優(yōu)化推理，可以實時探測和重建人物動作，并進行后期渲染。這項技術(shù)不需要智能穿戴設(shè)備，只需連接家用攝像頭，即可實現(xiàn)實時探測和重建人物動作，并通過數(shù)字人的形象進行動畫渲染。通過實時的骨骼點信息和 3D 重建，數(shù)字人可以展現(xiàn)出靈活多樣的肢體動作，實現(xiàn)真實的三維動效。同時，根據(jù)用戶的需求，可以自定義渲染器的畫風(fēng)，快速打造各種元宇宙應(yīng)用。

在最后的渦輪卡展示環(huán)節(jié)，英特爾展示了他們新的渦輪 GPU 卡，Arc A770 16G。這張卡具有雙槽全長全高的設(shè)計，適應(yīng)各種邊緣側(cè)服務(wù)器機箱或設(shè)備機箱。它采用渦輪風(fēng)扇設(shè)計，減少對機箱內(nèi)流場的干擾，更適合多卡混合計算的服務(wù)器、煉丹爐場景。

從本次分享會看來，英特爾一直著力于發(fā)展 AI 技術(shù)，特別是當(dāng)下火熱的 AIGC 領(lǐng)域，英特爾也沒有缺席。憑借 13代酷睿強勁的算力和不斷的算法優(yōu)化，現(xiàn)在即便是輕薄本也可支持大語言模型的本地運行。而在 Arc 顯卡的加持下，Stable Diffusion 文生圖的支持也在不斷開展。同時，英特爾也在探索 AI 的下一代應(yīng)用場景，并為企業(yè)級用戶提供算力更強的解決方案。

通過這些技術(shù)的展示，英特爾向大家展示了他們在 AIGC 領(lǐng)域的領(lǐng)先地位和不斷創(chuàng)新的能力。他們致力于為用戶提供更智能、高效的計算體驗，推動人工智能技術(shù)的發(fā)展和應(yīng)用。隨著技術(shù)的不斷進步和完善，我們可以期待在未來看到更多來自英特爾的 AIGC 應(yīng)用和解決方案。

廣告聲明：文內(nèi)含有的對外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

標(biāo)簽：