📢 Gate廣場 #创作者活动第一期# 火熱開啓,助力 PUMP 公募上線!
Solana 爆火項目 Pump.Fun($PUMP)現已登入 Gate 平台開啓公開發售!
參與 Gate廣場創作者活動,釋放內容力量,贏取獎勵!
📅 活動時間:7月11日 18:00 - 7月15日 22:00(UTC+8)
🎁 活動總獎池:$500 USDT 等值代幣獎勵
✅ 活動一:創作廣場貼文,贏取優質內容獎勵
📅 活動時間:2025年7月12日 22:00 - 7月15日 22:00(UTC+8)
📌 參與方式:在 Gate 廣場發布與 PUMP 項目相關的原創貼文
內容不少於 100 字
必須帶上話題標籤: #创作者活动第一期# #PumpFun#
🏆 獎勵設置:
一等獎(1名):$100
二等獎(2名):$50
三等獎(10名):$10
📋 評選維度:Gate平台相關性、內容質量、互動量(點讚+評論)等綜合指標;參與認購的截圖的截圖、經驗分享優先;
✅ 活動二:發推同步傳播,贏傳播力獎勵
📌 參與方式:在 X(推特)上發布與 PUMP 項目相關內容
內容不少於 100 字
使用標籤: #PumpFun # Gate
發布後填寫登記表登記回鏈 👉 https://www.gate.com/questionnaire/6874
🏆 獎勵設置:傳播影響力前 10 名用戶,瓜分 $2
AIGC 如何掀起智能客服“新革命”
來源:infoq
作者:李冬梅
結合ChatGPT 的底層技術邏輯,未來中短期內ChatGPT 產業化的方向大致有四類:即智能客服、文字模態的AIGC 應用、代碼開發相關工作以及圖像生成。其中,最適合直接落地的項目就是智能客服類的工作。
基於大模型技術所構建的智能客服正在從根本上改變傳統的人機交互過程,大模型自動生成對話流程讓運營智能客服更高效,可以提升複雜纏繞問題解決率、人機交互感知程度,以及意圖理解、流程構建、知識生成等運營內容的效率。
如果單從產品滲透率層面來看,智能客服早在過去的七八年裡就已經在電商、金融等等領域慢慢普及開來了。大模型帶來的兩個核心改變,一個是開發智能客服產品的成本大幅度下降,另一個就是用戶體驗的提升。
那麼,想要將LLM 大語言模型與智能客服產品進行結合,或者將前者落地於ToB SaaS 應用軟件領域,該如何著手搭建技術棧?大模型產品將如何賦能智能客服產品?本期《極客有約》我們特別邀請了bothub 創始人,布奇托網絡科技創始人兼CTO 徐文浩擔任主持人,與華院計算技術總監兼數字人事業部聯合負責人賈皓文、中關村科金智能交互研發總監、中關村科金智能客服技術團隊負責人王素文,京東雲言犀KA 產品負責人王超一同探討AIGC 在智能客服產品中的落地及未來發展趨勢。
以下為訪談實錄整理。
**王超:**AIGC 的出現引起了整個智能客服領域的廣泛關注,並促使相關同行進行了大量的探索。對於智能客服的認知和未來的改變,這些認知變化在日新月異。
京東雲言犀團隊一直密切關注國內外智能客服應用的進展。另外,我們正在研發的言犀大模型將於7 月發布,同時我們也在持續進行客服業務中的各種大模型實驗。近幾個月以來,我個人對AIGC 的理解和3 個月前已經完全不同,所以今天我想分享的觀點更多代表個人意見和當前的看法。
AIGC 對智能客服帶來的影響可以從兩個層面來看。首先,從我們行業常見的管理問題和技術難題的角度來看,AIGC 具有解決的潛力。我們都知道,大模型對於智能客服的應答水平、擬人度和服務體驗等方面都會帶來巨大的提升,並且能夠大幅降低運營成本。
在機器人方面,我認為不需要過多展開討論,因為我們已經將很多注意力放在機器人上了。我想說的是,大模型在廣泛的智能客服領域中,特別是客服管理智能化方向上的驗證信息。例如,我們在智能輔助方面的實踐,以往的一些技術在一些關鍵點上的推薦和會話中關鍵信息的提取等問題,儘管有解決方法,但成本和效果通常難以取得很好的平衡。然而,通過大模型的驗證,我們發現它在處理這些問題上有很好的解決能力和潛力。另外,對於質檢工作來說,行業中普遍使用的關鍵詞正則等方法或者智能質檢方法,雖然有一定效果,但準確率往往較低,工作量也很大,提升準確率的周期較長。
然而,通過大模型的實踐,我們發現它在理解抽象質檢標準和執行質檢工作方面效果很好。此外,在員工培訓方面,我們已經看到一些頭部銀行引入對話機器人進行培訓的例子。除了以上所述,我們還在客服中心進行經營分析,需要總結客戶諮詢中的需求、客戶畫像以及風險等方面的信息,而在實驗中,大模型的效果也非常好。我認為在泛智能客服領域中,大模型的應用潛力是巨大的。我們相信,大約在半年左右的時間內,市面上的主流產品將迎來一次重要的升級。
基於目前對該行業和領域的理解,我們可以探討更廣泛的領域是否會發生變化。例如,它能給客服和客戶服務帶來哪些變化?我認為這個問題可能更具挑戰性,而且在目前的階段,沒有人能夠確定具體的變化。但我們相信,至少在某些方向上,例如主動服務方面,它將帶來巨大的變化。舉個例子,電商經常進行各種活動,而活動的宣傳和解釋工作通常不會落在客服中心。因為如果要用人工或傳統的機器方式進行這種廣泛的活動承接,都是非常困難的。但我們可以想像一個未來,通過引入大模型,通過基礎信息的輸入,我們的客服可以很好地解釋許多活動,這代表著未來客戶服務在主動轉型和升級方面可能存在的潛力。
**王素文:**正如刚才提到的,智能客服领域的范围非常广泛。智能客服和机器人等技术实际上可以改变传统的人机交互过程。通过大模型的运用,特别是利用自动生成对话流程,可以使传统智能客服的运营更高效。在传统方式中,我们通常需要通过人工手动配置知识库等方式,但效果并不明显。然而,通过大模型的自动生成对话流程,可以直接提高解决复杂问题的能力和问题的直接回答率,这是一个显著的颠覆性影响。
第二点是,大模型还能实现降低成本、提高效率的目标。从智能化的角度来看,人工成本一直相对较高,因为它需要人工辅助机器。通过大模型的应用,可以辅助提升知识库建设和运营的效率,从而实现显著的降本增效效果。
第三點是,關於機器人的擬人度和用戶體驗。傳統的機器人在這些方面常常不盡如人意。然而,大模型的出現使得對話更流暢,擬人化程度更高,更像人與人之間的交流。這是一個非常強大的顛覆性影響。
當然,對於泛客服而言,包括質檢、助手和陪練等方面,大模型也會帶來相應的顛覆性影響,不同的產品會產生不同的影響。
**賈皓文:**在回答這個問題之前,我想先回到智能客服領域。智能客服的發展本質上可以追溯到人工智能的歷史,它建立在語言的積累基礎上。我還記得大約十年前,有幾層樓都是客服人員,他們的大部分工作時間都耗費在用戶問題整理上。當時,甚至連現在兩位老師提到的知識庫等工具也不是很完備。
現在回顧一下,支付寶等客服產品從最初的知識庫到後來的高級助手,逐步擴展,衍生出像Rasa 框架這樣的用於模擬多輪對話場景的工具。然而,與剛才兩位老師所說的一樣,所有這些對話過程在人格擬人化方面仍然有所欠缺。以前的所有客服類工具本質上都無法通過計算機行業標準測試。但是,當大模型出現後,尤其是像ChatGPT 或小羊駝(Vicuna)等,它們具有一定程度的人格特質,儘管可能是10 歲或11 歲孩子的水平。在某種程度上,它們能夠通過圖靈測試。
現在回到您之前提出的問題,將智能客服與數字人結合,會帶來一些新的革新。在數字人領域的起初階段,基於知識庫和大模型的方式進行與人類的擬人化問答是無法實時完成的。然而,隨著技術的擴展,我們已經能夠實現擬人形象,並結合大型模型來模擬真實的場景。當我們將其應用於知識庫、客服以及數字員工等場景時,數字人領域可能面臨兩個挑戰。首先是數據的完備性,儘管ChatGPT 等看起來很酷,但它們本質上是基於過去的歷史數據生成的,類似於完形填空的生成。雖然這種方法能夠提高效率並降低腳本撰寫的成本,但生成內容的質量實際上是無法控制的。在數字人和智能客服領域等綜合領域的產出內容中,我們無法完全確信生成的內容。因此,我們可能需要引入不同的驗證和保障措施,以確保數字人或ChatGPT 等所說的話更像是人類在說話,而不是胡言亂語。
總結下,雖然現在大模型可能比較火,未來的前景也很廣闊,但當下階段它還是一個從0 到1 的狀態。未來我們可能期望它長成參天大樹,但是現在不管是對整個行業來說,還是大家對它的期望來說,還是要讓它在一個比較好的土壤裡面逐步成長,真正的能夠給智能客服、給數字人等領域來帶來效率的提升。
**賈皓文:**是否引入大模型取決於具體的業務場景和用戶需求。對於大型公司如螞蟻金服或京東等擁有龐大而成熟的系統的情況,盲目引入大模型可能會增加額外成本。我們需要採取一些兼容性措施來規避AI 生成內容帶來的不確定性。對於規模較小的公司來說,將大模型作為知識庫的補充,並輔助一定程度的人工審核,可能是一種提高效率的好方法。它可以幫助智能客服更好地理解用戶的語義,提升知識庫的質量,甚至改善用戶體驗。此外,對於認知智能等更高層次的應用,引入大模型可能有助於更好地理解和認知用戶。在互聯網行業中,有一個重要的概念叫做"千人千面",這意味著每個客服都能夠提供個性化的服務。因此,我們需要在辯證的角度來看待是否引入大模型,結合具體情況做出決策。
**王超:**對於大型公司在C 端產品上謹慎應用大模型是出於保障顧客體驗和服務安全性的考慮。在面向消費者的業務中,保持謹慎是至關重要的。在這方面,驗證和實驗都是以非常謹慎的態度推進的。
在面向B 端或面向運營的領域,您們在實驗和驗證更加“勇敢”。我們在幫助運營搭建文案和腳本等方面引入大模型,這為運營解決創意和效率問題提供了很好的支持。此外,對於質檢、輔助和培訓等面向員工管理的方向也非常積極地投入。
大模型是“剛需”還是“跟風”?
**王超:**我們目前還沒有對這個問題進行具體的測算,因為大模型的應用在不同的工作項目中表現各異。例如,在生成腳本和文案方面,它的速度可能會提升幾倍。然而,在日常分析和質檢搭建等方面,效果可能因情況而異。因此,在當前階段,我們很難量化並得出一個準確的結論,但是我們確信,大模型的應用確實提高了效率。
**王素文:**在我們的業務領域,主要面向ToB 市場,我們服務各種不同領域的客戶,例如金融和保險行業等。這些客戶在創新方面有一些需求,包括降低成本和提高效率的動機。我們與客戶進行了一些共創合作,並進行了驗證。例如,我們為某個客戶創建了營銷助手,可以自動生成一些文案。傳統上,每個員工的水平參差不齊,包括營銷話術方面也缺乏標準化和統一性。通過我們的營銷助手,首先可以幫助他們生成統一的文案,根據歷史上的優秀經驗進行複制。其次是降低成本和提高效率,他們不再需要花費太多時間進行培訓、學習、記憶等工作。我們的大模型在行業中得到了廣泛應用。
我們還開發了電銷機器人,可以直接回答一些問題。當然,我們必須考慮到合規性問題,包括遵守相關法律和保護數據安全。我們正在與信創院合作,致力於解決這些標準化問題。
**王超:**在數字化浪潮的推動下,金融機構更容易實現智能客服的落地。在金融領域,智能客服已經相對廣泛應用,並成為金融機構比較常見的產品之一。對於金融機構而言,智能客服的核心需求主要是降低成本和提高效率,它能夠將人力資源從繁瑣的工作中解放出來。特別是在一些高頻問題的自動問答、通知和回訪等業務場景中,智能客服可以節省人力資源,使其能夠將精力集中在更專業、有創造性的工作上,而不是重複、頻繁且低價值的工作上。讓他們可以有資源投入到開發和維護高淨值客戶方面,更專注於執行更有價值的任務。此外,隨著新一代的基礎突破,如大模型的出現,智能客服也能夠獲得強大的自然語言生成能力,使其變得更加智能和高效。
**賈皓文:**除了金融領域,像保險、法律和健康等垂直領域也存在對大模型的需求。特別是在公司的視角下,對於生成和提取知識的需求越來越明顯。當我們與銀行或保險公司交談或與法律工作者討論問題時,他們提供的信息本質上都是事實性的內容。通過大模型,我們可以更好地識別用戶問題的意圖,並進行聚類或分流處理。
如王素老師所說,金融、保險和法律等行業的效率提升潛力非常大,這是一個降低成本和提高效率的過程。從我個人的角度來看,這是一個剛需,特別是在效率方面。然而,這些行業可能不會採取過於激進的方式,因為與金融、保險和法律相關的業務都是敏感性很高的,需要具備很強的專業性。在這方面,又引出了另一個問題,即對大模型生成結果的成熟度評估。雖然像GPT-4 等大模型在美國的一些專業考試中表現良好,但在中國,特別是在中文這樣龐大而復雜的語義背景下,它是否能通過相應的考試仍然是個問題,這可能需要進一步的研究。在這方面,我們公司計劃在7 月份與浙江大學合作發布一個法律垂直領域的大模型,為這個特定領域提供更好的解決方案。
**王超:**我認為無論是電商還是金融行業,對智能客服的要求都非常嚴格。另外,對於電商智能客服來說,大促銷期間和日常的諮詢都非常可觀。我們團隊在京東的自營業務中,日常期諮詢量佔70%,高峰期90%。這70%的諮詢量已經具有巨大的價值。我相信這種邏輯也適用銀行等各種機構。我們也注意到一些銀行的智能客服服務能力仍有不足。因此,我們需要思考如何提升智能客服的成熟度,並且它需要與企業或銀行的發展階段相適應。目前,許多銀行正處於智能客服的初級階段,主要集中在FAQ 和簡單的多輪對話構建上,而服務能力和用戶體驗可能還無法達到令人滿意的水平。
基於我們在電商領域的經驗,我們認為銀行智能客服需要進一步發展,特別是在運營體系方面需要大幅升級。例如,我們要求基層客服在服務標準和技巧方面接近人工水平,這對我們的運營體系變革具有重大影響。然而,在與銀行合作的過程中,我們發現許多銀行在智能客服建設中面臨挑戰。技術供應商與銀行之間的合作更類似於乙方和甲方的關係,與我們的合作模式有所不同。銀行在組織架構和人才培養方面與我們的要求仍存在差距。我們與許多銀行合作夥伴進行了交流,發現一種普遍現象,即他們認同我們的發展方法論,但也感到困難。推動內部改革對於銀行來說是複雜的,需要更多的努力。我相信大模型是一個機會,因為它可以降低智能客服的運營難度,簡化組織架構,我對此充滿期待。
**王素文:**我認為可以從三個方面來討論:擬人化、人性化和個性化。
首先是擬人化。在智能客服領域,擬人化一直是一個痛點,因為傳統的機器人在這方面表現還有待改進。我們一直在探索如何構建擬人化的對話交互。這涉及到如何設計情景化的對話,如何拆解問題,如何繼承上下文以及如何理解多輪對話。總體而言,我們希望機器人能夠提供更加貼切、自然的對話和交互模式。
其次是人性化的服務。在精準識別場景或意圖的基礎上,我們還需要在擬人化的基礎上進一步提升服務。我認為多模態情感計算是實現這一目標的有效方法。例如,我們公司開發了虛擬數字人客服,它可以進行人機交互對話,並結合情感計算,通過視頻、語音和文本等多媒體方式識別用戶情感表達。這樣一來,智能客服可以對用戶做出相應的情感反饋,打造出具有情感理解和溫度的人機交互,實現更人性化的服務。在情感計算方面,傳統的方法有規則和機器學習兩種模式。通過機器學習,我們可以訓練模型自動學習情感狀態,並達到分類的標準,從而更好地適應不同領域和語境。這樣可以獲得更優秀的情感表達效果,提供更人性化的服務。
最後是個性化服務。我們需要根據用戶的畫像實現個性化服務,以實現“千人千面”的效果。例如,我們開發了用戶洞察平台,通過用戶的基本畫像信息和歷史對話過程中的洞察分析,可以對用戶進行標記和畫像積累。在後續對話中,我們可以根據用戶的畫像為其提供不同的對話流程、回複方式和推薦,從而實現更精準的個性化服務,提升用戶和企業的滿意度。
**王超:**我們在提升體驗和個性化服務方面做了很多投入。言犀團隊開發的情感智能客服是業界首個大規模商用的情感智能客服。自2018 年開始,我們在機器人應答能力中引入了情感識別和應答的能力。這項技術不僅應用於客服領域,還應用於質檢和人員管理服務。
回答這個問題涉及兩個方面。第一個方向是技術方面,例如多輪對話等前沿技術,這些是當前智能客服技術的主要發展方向。另一個重要方向是運營,即如何通過與人工客服進行對標,進行精細場景拆解,分析人機差異,並通過監控和工具體系實現自動化的問題發現和人機服務差異對比。通過這樣的方式,我們從整體體驗和人群服務體驗的大面差異分析,逐步實現精細化的人群服務體驗分析。有了這樣的體系,我們才能夠持續優化整體服務體驗,並最終實現像京東目前日常機器接待量達到70%、大促期間達到90%的機器服務覆蓋。
**賈皓文:**今晚的直播主題是關於數字人客服領域和大模型的理解。我們對傳統客服的理解,無論是人工客服還是FAQ,都可以被視為低端智能客服。作為用戶,我們期望客服能夠勝任各種問題,並能夠提供排憂解難的幫助。同時,如果客服能夠展現擬人化的特點和提供個性化服務,那對於用戶來說體驗會更好。
在大模型領域,擬人化和人格化非常重要。我們公司更偏向於認知智能和心理學的研究方向。我們關注如何快速獲取用戶的心理標籤,並通過心理學的角度對用戶進行判斷,從而提供更好的服務。我們可以設想一個場景,例如漫威電影《鋼鐵俠》中的賈維斯。如果未來的大模型能夠像一個助手一樣,可以根據我們當天的心情和喜好給出最合適的答案和推薦,那將是一個理想的狀態。
目前,在大模型和數字人結合的研究中,我們還處於初步階段。但隨著學界在多模態領域的研究成果的出現,可能會有一些更好、成本更低的體驗產品湧現出來。
**賈皓文:**如果我們要構建一個高質量的對話系統,實際上涉及到了傳統的互聯網項目立項的問題。在這個過程中,我們需要考慮業務產品架構、技術架構的選型,以及產品的實際落地形態。同時,我們還需要考慮到許多大型企業或中型企業已經擁有許多現有的客服產品。如果我們想通過大模型提升這些現有客服產品的能力,可能需要採取比較保守的方式。例如,大模型可用作一個外部知識庫的工具,用於提供知識輸入。回到剛才提到的架構方面,產品架構和工具選擇都是重要的考慮因素。對於初始的切入點,可能涉及到關鍵字的標註系統和傳統的正則表達式等工具。然而,對於這種範式的具體選擇並沒有一個通用的標準範例,因為它與每個業務的特點相關。
**贾皓文:**如果我们将问题范围缩小,关注于提供更高效和高质量的智能客服内容输出,那我们可以将大模型视为一种增强型对话服务。在智能客服产品中,用户期望遇到的是一个智能、善解人意、善于交流的机器人,同时希望回答的内容能够聚焦于特定业务范畴,例如客服营销等场景。 在这种情况下,我们可以通过将大模型的意图识别、对话流程和多轮对话能力与传统的 FAQ 等外部数据源结合起来。这意味着我们需要收敛整个语言处理过程,例如对访客的问题数据进行归纳和与用户问题的对比,甚至在用户提问的同时输入大量的私有化数据,以补充传统的智能机器人、语音机器人和内外部知识库的能力。通过这种结合,可以在短时间内显著提高用户体验的效率。 进一步地,我们可以考虑拟人化能力的提升,但对于那些希望升级对话系统能力的公司来说,挑战可能较高,因此建议慎重引入。作为一个切入点,将大模型视为外部知识输入的一部分可能是一种成本较小且快速切入的方式。
如何提高大模型的對話質量
**王素文:**我們可以考慮以下幾點來提升對話系統的質量。
數據標註成本的降低:傳統的數據標註方法需要大量的人工標註,這會帶來時間和資源的成本。為了降低這種依賴性,我們可以研究如何利用大量的無標註數據進行無監督訓練,從而減少對人工標註數據的需求。這樣的方法可以提高數據獲取的效率並降低成本。
泛化能力的提升:僅僅回答單一問題是不夠的,對話系統需要具備一定的泛化能力,以適應不同的場景和用戶需求。通過學習語言的多樣性和規律,我們可以提升模型的泛化能力,使其能夠應對更多的問題和情境。
對話模型的構建和選擇:在選擇對話模型時,我們需要考慮不同場景下的模型適用性。當前已有許多大模型可供選擇,因此我們需要根據具體需求選擇適合的模型,以達到更高的準確性和效果。
持續學習和優化:對話系統需要進行持續學習和優化,因為初始上線的模型效果並不完善。系統應具備自我迭代和自我優化的能力,通過不斷使用和反饋,逐漸提高效果和性能。這種持續學習和優化的過程可以滿足客戶的需求,並使系統變得越來越智能和高效。
**王超:**我覺得這個問題的關鍵在於從客戶和業務方的角度以及我們作為平台產品開發設計者的角度來看,其實都指向了相同的目標。無論是從哪個角度來看,我們都需要關注業務的核心需求,以及智能客服系統在提供服務方面的期望。在不同的服務形態和模式下,產品的技術架構和引入的技術能力可能會有所不同,但整體而言並沒有太大的差異。
舉個例子來說,對於一些業務方來說,他們可能希望機器人能夠提供基本的問答和信息查詢能力,這時我們可能只需要提供一些FAQ 和一些簡單的對話工具和算法模型就能解決需求。而對有些業務方來說,他們希望機器人具備代為辦理業務和跟進業務的能力,甚至提供情景化的對話服務和全程護航。針對不同層次的客戶需求,我們需要相應地設計產品和構建技術架構,引入相應的能力。因此,我認為跟進業務方、幫助業務進行諮詢、深入了解他們的業務是非常重要的。根據不同的客戶需求,進行產品設計和技術架構的搭建,並引入相應的能力,以滿足他們的需求。
**王素文:**在使用ChatGPT 或類似的大模型時,可以按以下步驟進行應用和部署。
模型訓練和調優:選擇可商用的開源大模型,如智普ChatGLM、百川大模型等。根據自己的需求和業務,驗證和測試模型的性能。收集領域相關的數據,並使用這些數據對開源大模型進行領域訓練,也可以進行指令集合的半自動化生成。通過微調和篩選多輪對話數據,增強領域大模型的對話能力。確保模型在安全性方面滿足要求,根據規範和價值觀進行微調和後處理。
模型工程化和性能優化:針對生成式模型,考慮模型推理的速度、容量和壓縮問題。如果模型太大,單卡無法容納,可以考慮單機多卡或多機多卡的並行推理。對模型進行性能優化,包括壓速、壓縮和加速,以實現更好的性能。
**王素文:**我相信每個人在選擇模型時都會根據自己的需求和標准進行權衡。每個模型都有自己的特點和優勢。在我們的業務需求中,我們測試了多個模型,最終選擇了智普和百川這兩個大模型,因為智普大模型在商業化方面已經有了一定的成熟度。他們最近發布了新的模型,這也說明他們在不斷地優化和迭代。我相信隨著這些模型的不斷改進,基於這些大模型再進行領域模型的開發,將會帶來更好的效果提升。
**賈皓文:**對於中小型公司來說,從零開始自己開發或在現有模型上進行指令集調優可能會比較困難。模型通常很大,甚至在單個顯卡或單台機器上都無法容納。此外,收集結構化數據,特別是與特定業務領域相關的數據,也是非常關鍵的。因為在ChatGPT 的原始訓練過程中,做了大量的數據收集和整理,這就需要在指令集調優的過程中使用自己領域的數據來微調模型。這涉及到一些多機多卡的並行計算,可能需要算法和模型訓練人員具備高水平的知識,例如張量加速措施和梯度累加措施等。
在部署和運維模型的環節中,可能需要考慮模型訓練的網速、硬盤選型(如Zata 或SSD)、存儲器以及數據傳輸加速工具等方面,對運維環境有較高要求。總的來說,當前大模型的訓練過程可能會相對較難,但單純的部署和推理過程來說,基於6B 或13B 這樣的大模型,在V100 上進行部署,基本上是可行的。
如果模型調優訓練完成後,將其部署到線上系統中,我們通常會考慮整個架構的升級。目前業界比較熱門的是Milvus 向量數據庫,它可以通過向量檢索將生成的結果進行中間緩存,類似我們平時使用的Redis 緩存。因為完形填空生成機制的特性,雖然每次生成的具體樣式可能會不同,但大致意思是相同的。為了降低線上的成本,我們可以採用這樣的機制。同時,對於生成內容的審核系統、訓練數據準備系統和標註系統等,也需要有一套完整的解決方案。
總的來說,訓練大模型並不一定可怕,但可能會對我們之前的技術棧要求有所提升,但這種提升也是可以跨越的,只是可能稍微有一點難度,但我們完全可以通過學習和實踐來應對這些挑戰。
**王超:**在這個問題上,我可以分享一些關於正在開發的大型模型的信息。我們正在開發自己的產業大模型,並期待與企業和同行們進行合作。在7 月份之後會公佈更多關於合作機會的信息。另外,提到如何驗證哪些大型模型更好的問題。在這方面,我們更關注的是如何在平台上成功應用已經驗證過的優秀大型模型,比如百川等模型,鼓勵大家關注和了解它們。
**王素文:**整個開發和部署大型模型的過程確實需要花費一定的時間。特別是在模型的壓縮、加速和優化方面,需要進行反复的實驗和調整,這可能是非常耗時的。舉個例子,我們曾經開發了一個模型,它的規模達到了7B,經過優化後,在A800 服務器上的4 卡b 型配置上,推理速度從之前的28 毫秒降低到了大約5 毫秒。總的人力投入取決於你所做的工作。
首先,需要構建整個基礎框架,並對模型進行壓縮和量化處理,包括算子的優化。我們基於英偉達的FastarTransformer 進行了優化,因此需要自定義優化算子,選擇適合需求的推理引擎,比如英偉達的Triton,根據不同的後端提供服務。最後,還需要進行整體的性能測試,以確定模型在不同設備上的最佳性能,並進行最終的部署。根據我們的經驗,整個適配過程至少需要一個月的時間。此外,調整指令任務的優化也需要一定的時間,這取決於具體業務需求和指令數量。根據不同的業務類型,通常需要一個十幾個人的團隊來做。
**王素文:**是的,在特定行業訓練好並優化好的模型可以快速將其部署並複制給該行業的客戶。通過這種方式,我們能夠利用之前的工作成果,為客戶提供定制化的解決方案。舉例來說,我們在金融領域、保險、財富管理和零售等行業已經完成了模型的優化,因此我們可以將這些優化的模型快速復制,並迅速落地為客戶提供服務。這種複用的能力可以極大地提高效率,加快解決方案的交付速度。
**賈皓文:**對於領域大模型開發,數據收集對於特定領域的模型是必不可少的。對於高度專業化的領域(如法律),數據收集可能需要投入較長的時間,可能需要半個月甚至一個月。完成數據收集並進行結構化處理後才能開始後面環節,如指令集的調優和多級多卡的訓練過程等。完成這些環節之後,通常會進行多輪的模型效果評估,因為通過Transformer 機制生成的結果可能不夠可靠,需要進行大量的效果測試來確保模型的可靠性。當模型訓練基本完成,可以初步商用時,我們可能會根據客戶的需求進行進一步的產品化工作,將其打包成一個完整的產品,為用戶提供全面的服務。
從成本的角度來看,數據整理可能需要半個月至一個月的時間,訓練一個規模為6B 或7B 的相對較小的模型。然而,這還需要一個重要的前提條件,即負責模型訓練的團隊必須熟悉多機多卡的訓練方式和方法,並熟悉各種數據加速策略和內存加速策略等。此外,環境的準備也很關鍵。對於一些小型公司,如果要進行大模型的訓練,可能需要在阿里雲或騰訊雲等平台上租賃機器並自行搭建環境。這額外的成本也需要考慮進去。
開發一款大模型,投入產出比如何?
**贾皓文:**要评估投入产出比,需要考虑具体的业务场景和需求。对于创意类脚本生成等传统文案、广告和影视行业,AIGC 等大模型能够快速生成大量的素材,虽然可靠性可能有所欠缺,但可以显著提高生产效率,对于这些创意生产工作来说,投入产出比可能非常划算。然而,对于其他领域如法律知识生成、案例剖析、保单分析等,因为产出结果可能并非完美,需要投入大量人力资源,并经过多轮模型调优,才能达到较为理想的产出。因此,投入产出比可能会较高。
至於監管方面,像最近出台的深度生成相關的監管政策,也需要我們考慮。主要涉及幾個方面。首先,需要關注是否會侵犯作曲家、作家、畫家等知識產權或版權,以及是否容易產生虛假信息。在生成結果的監管方面,我們需要確保配套的內容審查和管理機制,以確保生成的文本和圖像不侵犯知識產權。同時,對於傳統行業,合規和風險控制也是重要的考慮因素。隨著實驗的發展,大模型產業鏈可能會形成,其中一些人致力於生成大模型的生產資料,而其他人則致力於防止大模型生成失控的措施。這種對應關係的建立將經過時間的迭代,以便在法律法規和道德規範的框架下實現大模型的生成與監管的良好平衡。
**王素文:**首先,我們在進行領域模型或大模型的訓練時,數據的合規性和合法性至關重要,應該通過正規的渠道獲取數據,並確保數據的安全和保密性。
其次,當我們為客戶進行領域模型訓練時,我們必須確保企業內部數據的安全合規性,並且不同企業之間的數據應該進行隔離,不能隨意復用或在訓練中使用。此外,在為客戶訓練領域模型時,我們還需要進行微調和對齊,以確保輸出的模型符合合規要求。
從監管層面來看,政府部門在製定監管框架時需要藉助跨學科和跨領域的專家知識。我們與信科院合作,共同建立健全的監管框架,並與其進行深度合作。我們也在與信科院進行安全認證,以確保我們的大模型經過了嚴格的測試和驗證。
只有通過政府、專家和企業的合作,我們才能推動AIGC 的健康發展,滿足用戶需求,並確保大模型的安全使用。
在智能客服領域,企業的核心壁壘是什麼?
**王超:**對於智能客服行業而言,同質化問題與企業採購智能客服建設目標和預期的ROI 密切相關。在京東,企業在建設智能客服時應將其發展目標分為初階、中階和高階(或成熟)三個階段。如果客戶的目標仍處於初階階段,即僅需簡單的問答和查詢功能,那麼採購智能客服的需求可能相似。在這種情況下,同質化程度可能較高。但如果客戶的需求定位在更高級的目標,例如提供主動服務、全程跟進和全情景化服務等,那麼就需要考慮智能客服供應商是否具備與之匹配的運營方法論和相關的完整運營工具體系。基於這個邏輯,我認為當前一代智能客服產品的核心壁壘之一是供應商是否具備複雜成熟的機器人項目經驗和豐富的運營經驗。
另一個關鍵點是,智能客服公司除了提供相關產品和技術外,還能否提供長期規劃和指導意見的運營方法論,以及相關的配套運營工具體系。同時,我們是否能夠幫助客戶建立人才梯隊,並提供培訓服務。在當前一代智能客服中,這些因素非常重要。
至於未來,大模型將成為一個重要壁壘。對於你所提及的產品,能否將不同類型的大模型與原有產品能力有效融合,將是一個關鍵因素。同時,具備大模型開發能力也將成為一個獨特的競爭優勢。
**賈皓文:**從傳統客服到大模型客服,整個過程可以看作是一種競爭壁壘。雖然在算力、數據量方面,我們可能無法與大廠競爭,但在交叉學科領域,如心理學知識在大模型訓練中的應用,以及對認知智能與大模型應用的交叉領域,我們可能具備先發優勢。對於其他公司而言,也可以結合自身特點,在日益同質化的大模型服務和訓練過程中脫穎而出。
**王素文:**這個問題實際上歸結到兩個核心點:智能客服公司需要考慮如何盈利和提高毛利率。為了實現這一點,首先要關注兩個方面。第一,你需要提供優質的智能客服服務,讓客戶滿意,這樣你的企業才能長久發展。因此,關注產品的效果至關重要,包括產品力和智能化效果的提升,以提高用戶體驗和滿意度。第二,注重提高效率,考慮投入產出比問題,降低成本並提高項目的毛利率。項目交付和運營效率的提升是關鍵,要考慮產品滿意度、部署實施的效率以及與客戶業務系統的快速集成和運營內容的對接。你需要擁有完整的交付方法論和運營工具來提高項目的毛利率,以實現盈利並保持持續發展。
智能客服公司可以分為兩類,一類是垂直領域的專業廠商,另一類是通用型廠商。垂直領域的智能客服廠商專注於特定領域,例如電商或保險,他們的優勢和壁壘在於行業聚焦,持續優化行業知識圖譜和數據,提供特殊的解決方案和核心競爭力。中關村科金作為對話式AI 解決方案提供商,我們專注於金融、政務、零售等多個行業,已為900 多家行業領軍企業提供服務,並積累了豐富的行業知識。我們還計劃推出通用和領域大模型,通過整合對話引擎,升級智能客服、外呼機器人、陪練和質檢助手等產品,以提升我們在行業中的競爭力。
其次,提高交付和運營效率也是關鍵。產品滿意度對於降低項目交付成本至關重要,而高效的部署和實施,以及與客戶業務系統的快速集成和運營內容對接,將提高運營效率。你需要擁有一整套交付方法論和運營工具,確保項目的毛利率最大化。這樣做將使你能夠盈利並保持長期可持續發展。
*AIGC 會完全替代傳統的客服人員嗎? *
**王超:**作為一個從業者,我對AIGC 的前景持樂觀態度,而取代的問題涉及不同的視角。一種觀點是以存量市場的視角看待,認為客服行業的市場空間有限,因此AIGC 可能會取代傳統人力。然而,我更傾向於從增量的角度來考慮。
首先,智能客服仍然需要人類運營支持,在從傳統客服到智能客服的轉變過程中,運營人員仍然扮演著重要的角色。其次,未來的運營模式可能會發生變化,智能客服與人工運營人員配合,形成一種新的作戰模式。這種模式下,少數運營人員可以攜帶智能客服機器人,提供高質量的24 小時服務,而且成本較低,這可以讓更多的小微企業以新的方式提供客戶服務,並擴大市場規模。總之,從增量的角度來看,智能客服不會完全取代傳統客服,而是與其相輔相成,為市場帶來新的機會和發展空間。
**王素文:**在可預見的未來,人工客服不會被完全取代,因為它們在處理複雜問題、思考性問題以及情感問題上具有獨特的優勢。特別是在處理高價值客戶、潛在客戶以及提高客戶轉化率方面,人工客服仍然扮演著重要角色。由於獲取客戶的成本較高,通過人工客服進行高效跟進並確保成交仍然是許多企業所希望的。因此,人工客服和智能客服之間更多是一種相互結合的合作模式。企業需要根據自身情況考慮人工客服和智能客服的優勢,並製定最佳的客戶服務模式。
在整體上,我認為AIGC 未來的發展空間是廣闊的,並且整個行業也已經看到了這一點。在未來的兩三年中,AIGC 和類似ChatGPT 的技術將以高速發展,並推動整個企服產業的升級。互聯網和企服行業都將經歷大規模的升級和變革,包括配套設施的改進。目前AIGC 仍存在一些問題,如內容質量、投資成本、數據安全和版權等方面。因此,我們仍然需要更長遠的發展,包括探索更精密、更有效的建模方式,以改進這些問題。我相信隨著技術的進步,大模型的發展空間將是無限廣闊的。
**賈皓文:**確實,我們不應過於強調替代性,而是關注未來將帶來的工作模式和業務模式的變革。在推進業務的過程中,我們需要衡量投入產出比,特別是在客服推進中需要考慮用戶數據隱私的安全性、法律法規的遵守以及跨場景、跨行業的擬人化服務。大模型能夠為傳統客服人員帶來很高的價值,它們會帶來質的變革,但並不意味著取代人工客服。總的來說,儘管大模型目前存在一些問題,但它在未來的前景非常廣闊。用一句比較文藝的話來說,未來不久大模型的發展將從夢境變成現實,我們很快就能親身體驗到。