超碰亚洲无码,日本一区3不卡

成為首席人工智能官（CAIO）要掌握23個關鍵生成人工智能術(shù)語及含義

作者：CIO.com睿觀來源：CIOCDO 發(fā)布時間：2024年09月27日點擊數(shù)：

從代理系統(tǒng)到零樣本提示，生成人工智能可以感覺像一種新的語言。以下是首席信息官成為首席人工智能官需要知道的術(shù)語。

圖源：Shutterstock / monticello

正如生成式人工智能突然出現(xiàn)在人們的視野中一樣，隨之而來的新語言也是如此。與人工智能相關的詞匯完整列表可能會有數(shù)千個條目，但為了緊急相關性，以下是在首席信息官、分析師、顧問和其他企業(yè)高管中最常聽到的術(shù)語。

1.Agentic systems/智能體系統(tǒng)

智能體是一種能夠自主決策或行動的人工智能模型或軟件程序。當多個智能體為了追求一個單一目標而共同工作時，它們可以進行計劃、委派、研究和執(zhí)行任務，直到目標實現(xiàn)。當其中一些或所有智能體由生成式人工智能驅(qū)動時，結(jié)果可能會大大超過簡單的提示和響應方法所能達到的效果。然而，由生成式人工智能驅(qū)動的智能體系統(tǒng)相對較新，企業(yè)可能很難構(gòu)建自己的系統(tǒng)，更難確保這些系統(tǒng)的安全性。

“智能體和人工智能顯然是風險投資家和初創(chuàng)企業(yè)大量投資的一個領域，”Gartner（高德納，Gartner Group公司成立于1979年，它是第一家信息技術(shù)研究和分析的公司。它為有需要的技術(shù)用戶來提供專門的服務。Gartner已經(jīng)成為了一家獨立的咨詢公司，Gartner公司的服務主要是迎合中型公司的需要，它希望使自己的業(yè)務覆蓋到IT行業(yè)的所有領域，從而讓自己成為每一位用戶的一站式信息技術(shù)服務公司。）分析師Arun Chandrasekaran（阿倫?錢德拉塞卡蘭）表示，“我們可能會在?2025?年看到更多的智能體框架發(fā)展和成熟。”

2.Alignment/對齊

人工智能對齊指的是模型被訓練以堅持的一系列價值觀，如安全性或禮貌性。但并非所有公司都有相同的價值觀，也并非所有的人工智能供應商都明確說明他們在其平臺中構(gòu)建了哪些價值觀。

“這是一個問題，而且不容易解決，”Globant（是一家全球性的技術(shù)服務提供商，專注于為客戶提供數(shù)字化解決方案和企業(yè)技術(shù)服務。公司提供的數(shù)字解決方案包括區(qū)塊鏈、云技術(shù)、網(wǎng)絡安全、數(shù)據(jù)與人工智能、數(shù)字體驗與性能、編程、物聯(lián)網(wǎng)、元宇宙以及工程和測試等領域。此外，Globant?還提供電子商務、會話接口、設計、數(shù)字營銷和數(shù)字產(chǎn)品交付服務。）的數(shù)據(jù)科學和人工智能負責人JJ Lopez Murphy（JJ·洛佩茲·墨菲）說，“如果模型經(jīng)過大量訓練與你的利益相悖，那么你通過提示詞能做的事情是有限的。”

3.Black box/黑箱

一種內(nèi)部機制不清晰、內(nèi)部過程被隱藏的模型，使得很難判斷該模型是如何得出答案的。這對于當今的企業(yè)來說是一個重大問題，尤其是對于商業(yè)模型。

“如果我不知道該模型是基于什么數(shù)據(jù)進行訓練的，也不知道對模型進行了哪些微調(diào)，我就不會相信它與公司的價值觀一致，”AArete（是一家總部位于芝加哥的管理和技術(shù)咨詢公司，自2008年成立以來一直在行業(yè)內(nèi)產(chǎn)生重大影響。公司的首要目標是提供數(shù)據(jù)驅(qū)動的解決方案，幫助企業(yè)優(yōu)化績效，實現(xiàn)可持續(xù)增長。A are te非常重視將深厚的行業(yè)專業(yè)知識與先進的分析能力相結(jié)合，已成為醫(yī)療保健、金融服務、能源和技術(shù)等行業(yè)客戶值得信賴的合作伙伴。）的數(shù)據(jù)科學與分析副總裁Priya Iragavarapu（普里亞·伊拉加瓦拉普）說。

4.Context window/上下文窗口

模型在給定提示中可以處理的標記（Token）數(shù)量。平均而言，一個標記約為四分之三個單詞。大的上下文窗口允許模型分析長段文本或代碼，或者提供更詳細的答案。它們還允許企業(yè)在提示中提供更多示例或指南，嵌入上下文信息，或者提出后續(xù)問題。

【睿觀：在自然語言處理（NLP）中，“標記”（token）和“詞”（word）是兩個重要的概念，它們之間有一定的關系，但并不完全相同。標記（token）是文本的基本處理單元，數(shù)量上大致上與單詞相關，但不完全等同。在處理文本時，尤其是在大規(guī)模 NLP 模型中，了解標記的數(shù)量與上下文的關系是非常重要的，因為它直接影響模型處理信息的能力和效率。

（一）標記（Token）數(shù)量與單詞的關系

標記（Token）：

通常指對文本進行分詞后獲得的單元。一個標記可以是一個單詞、符號、標點符號甚至短語的組成部分。例如，“我們吃蘋果?！笨梢员环譃槿齻€標記：“我們”、“吃”、“蘋果”。

標記與單詞：

在許多情況下，一個標記主要對應一個單詞，但因為語言的復雜性，一個標記可以小于或大于一個單詞。例如，在某些情況下，一個復合詞可能會被視為一個標記，而某些拆分的詞匯（如“don’t”可能被視為“do”和“n’t”兩個標記）。

數(shù)量關系：

“一個標記約為四分之三個單詞”，意味著平均情況下，多個標記攜帶的信息會少于多個完整的單詞。因此，一個標記通常被認為是處理語言的基本單位，而不僅僅是單詞的集合。

（二）Token 的英文原意

Token：

英文中“token”原意為“代幣”或“標記”。在計算機科學和文本處理領域，token 通常用來表示文本處理中的基本單位，如單詞、符號等。在 API 調(diào)用中，token 也指代計算機進行身份驗證時的標識符。】

在發(fā)稿時，OpenAI（在美國成立的人工智能研究公司，核心宗旨在于“實現(xiàn)安全的通用人工智能，AGI”，使其有益于人類。OpenAI于2015年由一群科技領袖，包括山姆·阿爾特曼、彼得·泰爾、里德·霍夫曼和埃隆·馬斯克等人創(chuàng)辦。）的ChatGPT（是人工智能技術(shù)驅(qū)動的自然語言處理工具，它能夠通過理解和學習人類的語言來進行對話，還能根據(jù)聊天的上下文進行互動，真正像人類一樣來聊天交流，甚至能完成撰寫郵件、視頻腳本、文案、翻譯、代碼，寫論文等任務）的最大上下文窗口為128,000個標記（Token），這相當于約96,000個單詞或近400頁文本。Anthropic（是一家人工智能初創(chuàng)公司，由前?OpenAI?員工創(chuàng)立，成立于2021年，總部位于舊金山，致力于構(gòu)建可靠、可解釋和可控的人工智能系統(tǒng)。）在9月初為其Claude（是人工智能初創(chuàng)公司Anthropic?發(fā)布的一款類似ChatGPT的產(chǎn)品。升級后的Claude 2?模型在編碼、數(shù)學和推理方面的性能都有所提高。2023年7月，Anthropic?宣布，已發(fā)布最新大語言模型Claude 2。升級之后，Claude 2的處理能力已經(jīng)提升到了100K個Token，這意味著它可以處理數(shù)百頁的技術(shù)文檔，甚至是整本書。此外，Claude 2?也開始面向更廣泛的用戶群體免費開放，并支持中文使用。）模型發(fā)布了一個企業(yè)計劃，上下文窗口為500,000個標記，Google（谷歌公司，美國跨國科技企業(yè)。成立于1998年9月4日，被公認為全球最大的搜索引擎公司。業(yè)務包括互聯(lián)網(wǎng)搜索、云計算、廣告技術(shù)等，同時開發(fā)并提供大量基于互聯(lián)網(wǎng)的產(chǎn)品與服務，其主要利潤來自于關鍵詞廣告等服務。）在6月宣布其Gemini1.5 Pro（?是谷歌發(fā)布的模型，具有原生音頻理解、系統(tǒng)指令、JSON模式等功能。它是在2024年5月15日凌晨的谷歌I/O開發(fā)者大會上發(fā)布的眾多產(chǎn)品之一，旨在與OpenAI對抗。Gemini 1.5 Pro的發(fā)布標志著谷歌在AI領域的進一步投入和創(chuàng)新。）模型的上下文窗口限制為200萬個標記，這相當于約150萬個單詞或6,000頁文本。

【睿觀：上下文窗口是衡量語言模型處理信息能力的一個重要指標。更大的上下文窗口意味著模型能夠處理更復雜的任務，生成更高質(zhì)量的文本。但是，上下文窗口越大，模型的計算成本也會越高。

（一）什么是上下文窗口？

上下文窗口，簡單來說就是模型在處理信息時能夠“記住”的上限。它決定了模型在生成文本或回答問題時，能參考的上下文信息量。這個“上下文”可以是你在提示中給出的任何文本，比如問題、指令、示例、甚至是一段很長的文章。

（二）上下文窗口與 Token 的關系

Token 是什么？

Token 是自然語言處理中的一個基本單位，可以是一個單詞、一個標點符號，甚至是部分單詞。將文本分割成一個個 Token 是語言模型處理文本的第一步。

上下文窗口與 Token 的關系：

上下文窗口的大小就是指模型能夠處理的 Token 的最大數(shù)量。
例如，如果一個模型的上下文窗口是 2048，那么你最多可以輸入 2048 個 Token 讓它處理。

（三）大上下文窗口的優(yōu)勢

處理長文本：?可以分析和生成更長的文本，比如文章、代碼、甚至是一本書的摘要。
提供更詳細的答案：?通過提供更全面的上下文，模型可以給出更準確、更有針對性的回答。
支持復雜任務：?大上下文窗口可以支持更復雜的任務，比如多輪對話、文本摘要、代碼生成等。
嵌入更多信息：?你可以在提示中嵌入更多的信息，比如示例、規(guī)則、背景知識等，讓模型更好地理解你的需求。】

5.Distillation/蒸餾

將一個模型縮小為一個盡可能準確的較小模型的過程，以適應特定的用例。

“使用在訓練期間經(jīng)過蒸餾或修剪的模型可以提供類似的性能水平，同時在推理過程中需要更少的計算資源，”云咨詢公司Caylent（是一家AWS云服務公司，幫助組織在以技術(shù)為中心的世界中蓬勃發(fā)展。）的數(shù)據(jù)與應用高級總監(jiān)Ryan Gross（瑞安·格羅斯）說。這意味著它們使用更少的內(nèi)存，可以更快、更便宜地回答問題。

6.Embeddings/嵌入

表示文本、圖像或其他數(shù)據(jù)的方式，以便相似的對象可以彼此靠近。這通常是在多維空間中使用向量來完成的，其中每個維度反映了數(shù)據(jù)的特定屬性。它們通常存儲在向量數(shù)據(jù)庫中，并與retrieval augmented generation/RAG（即檢索增強生成，是一種自然語言處理模型，旨在改進各種NLP任務的表現(xiàn)，包括問答、摘要生成等。）結(jié)合使用，以提高人工智能響應的準確性和及時性。

7.Fine-tuning/微調(diào)

在特定數(shù)據(jù)集上對預訓練模型進行進一步訓練的過程，以使其適應特定任務。公司通常從商業(yè)模型或開源模型開始，然后在自己的數(shù)據(jù)上進行微調(diào)以提高準確性，避免從頭開始創(chuàng)建自己的基礎模型。“訓練是最昂貴的，”Constellation Research（是美國硅谷的一家科技研究與咨詢公司。致力提供戰(zhàn)略指導,幫助企業(yè)通過突破性技術(shù)的率先應用推進企業(yè)轉(zhuǎn)型。）的副總裁兼首席分析師Andy Thurai（安迪·圖萊）說，“微調(diào)次之?！?/span>

8.Foundation models/基礎模型

大型生成式人工智能模型通常在龐大的數(shù)據(jù)集上進行訓練。最常見的例子包括像ChatGPT這樣的大語言模型和像Dall-E 2（是OpenAl公司推出的人工智能圖像生成器，具有創(chuàng)造性和藝術(shù)性，可以根據(jù)自然語言的文本描述創(chuàng)建圖像和藝術(shù)形式。）這樣的圖像模型。單個企業(yè)通常不會訓練自己的基礎模型。相反，他們使用商業(yè)上可用的或開源的基礎模型，然后根據(jù)自己的需求進行定制或微調(diào)。基礎模型也可以直接使用，無需額外微調(diào)，結(jié)合RAG和AI提示詞（Prompt)工程。

9.Grounding/錨定

由于生成式人工智能模型實際上并不記住它們的訓練數(shù)據(jù)——只是記住從訓練數(shù)據(jù)中學到的模式——因此響應的準確性可能會有很大差異。這對于企業(yè)用例來說可能是一個重大問題，因為人工智能模型可能會給出看似正確但完全錯誤的答案。通過為人工智能提供所需的數(shù)據(jù)，錨定（Grounding）可以幫助減少這個問題。例如，用戶向人工智能詢問如何使用特定產(chǎn)品時，可能會將產(chǎn)品手冊的上下文粘貼到提示中。

【睿觀：“Grounding”是人工智能領域一個重要的概念，它關系到模型的理解能力、推理能力以及與人類的交互能力。在翻譯時，應根據(jù)具體的上下文選擇合適的用詞，既要準確表達其含義，又要符合中文的表達習慣。

（一）“Grounding”在人工智能中的含義

在人工智能領域，“grounding”通常被翻譯為“基礎”或“錨定”、“接地”，但其含義遠比字面意思豐富。它主要指將人工智能模型與現(xiàn)實世界建立聯(lián)系的過程，確保模型生成的文本、圖像等輸出能夠與現(xiàn)實世界中的概念、實體和關系相對應。具體來說，“grounding”涉及以下幾個方面：

語義理解：?確保模型能夠正確理解人類語言中的語義，將文本轉(zhuǎn)化為計算機能夠處理的語義表示。
知識圖譜：?將模型與外部知識庫（如知識圖譜）連接，讓模型能夠訪問和利用大量的背景知識。
常識推理：?使模型具備基本的常識推理能力，能夠根據(jù)已有的知識和經(jīng)驗進行推理和判斷。
多模態(tài)學習：?允許模型同時處理文本、圖像、音頻等多種數(shù)據(jù)，從而更好地理解復雜信息。

（二）“Grounding”的重要性在于：

提高模型的可靠性：?確保模型生成的輸出符合邏輯，避免產(chǎn)生荒謬或不合理的結(jié)果。
增強模型的泛化能力：?使模型能夠更好地適應新的場景和任務，提高模型的通用性。
促進人機交互：?幫助模型更好地理解人類的意圖，實現(xiàn)更自然、更流暢的人機對話。

（三）“Grounding”的翻譯用詞

基礎：?強調(diào)模型與現(xiàn)實世界的連接，是模型運行的基礎。
接地：?強調(diào)將抽象的概念與具體的現(xiàn)實聯(lián)系起來，使模型更加“接地氣”。
語義接地：?更準確地表達將語言與世界聯(lián)系起來的過程。
知識接地：?強調(diào)將模型與知識庫連接的過程。

其他相關的翻譯：

根植：?強調(diào)將模型扎根于現(xiàn)實世界。
錨定：?強調(diào)將模型固定在現(xiàn)實世界的某個點上。】

10.Hallucinations/幻覺

人工智能模型可能會生成虛假、荒謬甚至危險的答案，且乍一看可能似乎還很合理。企業(yè)通過微調(diào)模型以及使用RAG和基礎技術(shù)來減少這些幻覺。EY（安永，成立于1989年，是一家總部位于英國倫敦的跨國性專業(yè)服務公司，全稱是安永會計師事務所，為國際四大會計師事務所之一。）美洲的生成式人工智能負責人David Guarrera（大衛(wèi)·瓜雷拉）表示，另一種減少幻覺的方法是多次運行相同的提示并比較響應，不過這可能會增加推理成本。

11.Human in the loop/人機交互式機器學習（人機回圈）

在許多用例中，生成式人工智能在沒有人工監(jiān)督的情況下不夠準確、全面或安全，無法使用。人機交互式機器學習的方法涉及一個人在人工智能輸出被使用之前對其進行審查。“我強烈主張確保人類審查大型語言模型生成的所有內(nèi)容——代碼、內(nèi)容、圖片——無論是什么，”Iragavarapu（伊拉加瓦拉普）說。

【睿觀：人機交互式機器學習（Human-in-the-Loop，HITL）?是一種將人類智能與機器學習相結(jié)合的迭代過程。它旨在通過人類的反饋和干預，不斷改進機器學習模型的性能。簡單來說，就是讓機器在學習的過程中不斷地與人交互，在人的指導下不斷完善自己。

（一）核心思想：

人機協(xié)同：?人類提供專業(yè)知識、判斷力和創(chuàng)造力，機器提供強大的計算能力和數(shù)據(jù)處理能力。
迭代優(yōu)化：?通過不斷的人機交互，機器學習模型能夠逐漸改進，提升準確性和可靠性。
反饋機制：?人類對機器的輸出結(jié)果進行評估和反饋，從而引導機器學習模型向正確的方向發(fā)展。

（二）除了“人機交互式機器學習”外，還有以下幾種常用的翻譯方式：

人在回路：?更直觀地表達了人類在機器學習過程中所處的位置。
人機回圈：?強調(diào)了人機交互在機器學習中的重要作用。
人類參與的機器學習：?強調(diào)了人類在機器學習過程中的參與度。

（三）人機交互式機器學習的應用場景

數(shù)據(jù)標注：?人類對數(shù)據(jù)進行標注，為機器學習模型提供訓練數(shù)據(jù)。
模型訓練：?人類參與模型的訓練過程，提供反饋和調(diào)整參數(shù)。
模型部署：?人類對模型的輸出結(jié)果進行評估，確保模型的可靠性。

（四）人機交互式機器學習的優(yōu)勢

提高模型性能：?通過人類的反饋，可以有效地提高模型的準確性和魯棒性。
增強模型可解釋性：?人類可以幫助理解模型的決策過程，提高模型的可信度。
加速模型開發(fā)：?人機協(xié)同可以加快模型的開發(fā)和迭代速度。

（五）總結(jié)

人機交互式機器學習是一種非常有前景的人工智能技術(shù)，它將人類的智慧與機器的計算能力相結(jié)合，為人工智能的發(fā)展開辟了新的道路。在未來，人機交互式機器學習將在越來越多的領域得到應用，推動人工智能技術(shù)的不斷進步?！?/span>

12.Inference/推理

使用經(jīng)過訓練的模型來回答問題的過程。如果公司使用按標記收費的商業(yè)模型，這可能會非常昂貴。“當你開始運行有數(shù)百萬次推理的工作負載時，你會感到震驚，”Thurai（圖萊）說。一些降低推理成本的方法包括開源模型、小型語言模型和邊緣人工智能。

13.Jailbreaking/越獄

像聊天機器人或圖像生成器這樣的生成式人工智能系統(tǒng)通常有防護措施，以防止人工智能給出非法、危險的答案。為了繞過這些限制，惡意用戶會試圖用諸如“忽略所有先前的命令?！?/span>這樣的提示來欺騙人工智能忽略這些防護措施。隨著時間的推移，人工智能供應商已經(jīng)了解了最常見的越獄技術(shù)，但用戶不斷想出新的方法。Guarrera（瓜雷拉）說，這是許多大語言模型應用中最大的安全風險。“而且目標總是在變化。”

除了欺騙人工智能給出不適當?shù)拇鸢竿?，越獄還可以用于暴露訓練數(shù)據(jù)，或者獲取存儲在向量數(shù)據(jù)庫中并用于RAG的專有或敏感信息。越獄攻擊也被稱為提示詞注入攻擊。

14.Large language model/大語言模型

大型語言模型是一種專門為處理文本而設計的基礎模型類型。它的規(guī)模通常為數(shù)千億或數(shù)萬億個參數(shù)，而小型語言模型通常少于100億個參數(shù)。例如，Meta（美國互聯(lián)網(wǎng)公司，原名Facebook，創(chuàng)立于2004年2月4日，總部位于美國加利福尼亞州門洛帕克。“Meta”，來源于“元宇宙”，Metaverse，意思是包涵萬物無所不聯(lián)。Facebook堅定地希望甩掉問世以來就牢牢被貼在身上的標簽——社交媒體，要跳出發(fā)家領域社交媒體的“舒適圈”，著力開拓元宇宙e。）的Llama 3.1（?是由Meta開發(fā)的超大型語言模型，于2024年7月發(fā)布。它是Llama模型系列的最新版本，旨在執(zhí)行廣泛的語言相關任務，包括自然語言理解、對話生成、文本摘要和翻譯等。Llama 3.1以其規(guī)模和性能而著稱，是目前訓練過的最大LLM之一，由一個包含1.3萬億個參數(shù)的巨大數(shù)據(jù)集訓練而成。在評估中，Llama 3.1超過了或匹敵了較小的LLM，例如GPT-3和BLOOM。）有4050億個參數(shù)，而據(jù)報道OpenAI的GPT-4（OpenAI為聊天機器人ChatGPT發(fā)布的語言模型。）有超過一萬億個參數(shù)。

選擇正確的模型通常需要針對預期用例進行一些測試。然而，公司通常首先查看排行榜，看看哪些模型得分最高。LMSYS Chatbot Arena Leaderboard（?是由LM-SYS組織發(fā)布的一個大語言模型的評測排行榜，也被稱為大模型匿名競技場。這個評測排行榜通過眾包的方式對大模型進行匿名評測，用戶可以在其官網(wǎng)上輸入問題，然后由一個或多個匿名的大模型同時返回結(jié)果。用戶根據(jù)自己的期望對效果進行投票，最終形成不同大模型的眾包評測結(jié)果。排行榜旨在提供一個公正、透明的平臺，讓研究者、開發(fā)者以及感興趣的公眾能夠了解和比較不同大語言模型的性能。通過這個平臺，用戶可以了解到各個模型在特定任務上的表現(xiàn)，從而選擇最適合自己需求的語言模型?。）對專有和開源模型都進行排名，而Hugging Face Open LLM Leaderboard（?是一個由Hugging Face發(fā)布的評測榜單，旨在跟蹤、排名和評估開源的大型語言模型。這個榜單主要針對英文模型，包含了一些關鍵基準測試，用于評估生成式語言模型在多個不同評估任務上的性能。）只對開源模型進行排名，但使用多個基準。

15.Multimodal AI/多模態(tài)人工智能

多模態(tài)基礎模型可以處理多種類型的數(shù)據(jù)，如上下文、圖像、音頻或視頻。一個完全多模態(tài)的模型將同時在多種類型的數(shù)據(jù)上進行訓練。然而，更常見的是，后端會有多個模型，每個模型處理一種不同類型的數(shù)據(jù)。“多模式仍處于起步階段，”EY的合伙人Sinclair Schuller（辛克萊·舒勒）說，“大多數(shù)多模態(tài)系統(tǒng)還不是真正的多模態(tài)系統(tǒng)。”例如，一個通過語音與我們交互的模型可能首先翻譯音頻文本，然后生成文本響應，然后再將該響應轉(zhuǎn)換回音頻。

16.Prompt/提示

給予生成式人工智能模型的輸入，或者用戶發(fā)送給聊天機器人的問題。除了問題之外，提示還可以包括有助于回答問題的背景信息、關于如何回答問題的安全指南以及用作模型的答案示例。

17.Prompt engineering/提示工程

一門全新的學科，用于制作有效的提示以從人工智能模型中獲得期望的結(jié)果。提示工程可以被終端用戶用來引導人工智能，例如要求答案“簡單到高中生能夠理解”，或者告訴人工智能“逐步思考問題”。但它也被開發(fā)人員用于在企業(yè)工作流中添加人工智能功能，并且可能包括指南和風格手冊、示例答案、上下文數(shù)據(jù)和其他可以提高響應質(zhì)量和準確性的信息。

18.Retrieval augmented generation（RAG）/檢索增強生成

檢索增強生成是一種通過向提示中添加上下文來提高準確性、安全性和及時性的方法。例如，一個使用生成式人工智能來撰寫營銷信件的應用程序可以從數(shù)據(jù)庫中提取相關的客戶信息，使人工智能能夠訪問最新的數(shù)據(jù)。此外，它允許公司避免在實際客戶數(shù)據(jù)上對人工智能模型進行訓練或微調(diào)，因為這可能會違反安全或隱私規(guī)定。

但是RAG也有缺點。首先，收集相關信息并將其移入向量數(shù)據(jù)庫會增加復雜性。然后，為確保信息僅被授權(quán)用戶或進程訪問，會有安全開銷。并且推理本身也會增加成本，因為定價通?；跇擞洠═oken）的數(shù)量。

“如果你正在上傳一篇長達一千頁的文檔，你的嵌入成本可能會變得非常高，”KPMG（畢馬威，成立于1897年，是世界頂級的會計專業(yè)服務機構(gòu)之一，專門提供審計、稅務和咨詢等服務。畢馬威也是國際四大會計師事務所之一，與其并列的其他三大所分別是普華永道、德勤和安永。是一個由獨立的專業(yè)成員所組成的全球性組織。畢馬威成員所遍布全球143個國家及地區(qū)，擁有超過265,000名專業(yè)人員，提供審計、稅務和咨詢等專業(yè)服務。各成員所均為各自獨立的法律主體，其對自身描述亦是如此。畢馬威國際有限公司是一家英國私營擔保有限公司。畢馬威國際有限公司及其關聯(lián)實體不提供任何客戶服務。）數(shù)字解決方案解決方案架構(gòu)負責人Swaminathan Chandrasekaran（斯瓦米納坦?錢德拉塞卡蘭）說。

19.Responsible AI/負責任的人工智能

在考慮倫理、偏見、隱私、安全、合規(guī)和社會影響的情況下開發(fā)和部署人工智能系統(tǒng)。負責任的人工智能可以幫助提高客戶、員工和其他用戶及利益相關者的信任，同時幫助公司避免公眾尷尬并領先于法規(guī)。

PwC（普華永道咨詢公司，國際領先的管理咨詢公司之一。2002年7月30日，普華永道咨詢公司被IBM以35億美元的現(xiàn)金和股票形式收購。）的負責任人工智能負責人Ilana Golbin Blumenfeld（伊拉娜·戈爾賓·布盧門菲爾德）建議企業(yè)首先定義其負責任的人工智能原則，這些原則將指導人工智能系統(tǒng)的開發(fā)和部署。這些原則可以包括公平、透明、隱私、問責制和包容性。她還建議公司保持人工監(jiān)督和問責制。“設計人工智能系統(tǒng)以增強人類決策，而不是完全取代它，”她說。

20.Small language model/小型語言模型

最著名的生成式人工智能模型，如OpenAI的ChatGPT或Anthropic的Claude，都是大語言模型，具有數(shù)千億或數(shù)萬億個參數(shù)。相比之下，小型語言模型通常有70或80億個參數(shù)，并且可以為特定用例提供顯著的好處。“較小的模型通常運行成本較低，但可能提供較低的準確性或能力，”Caylent的Gross（格羅斯）說。但他補充說，為特定任務選擇合適的模型大小可以在不犧牲性能的情況下優(yōu)化成本。

21.Synthetic data/合成數(shù)據(jù)

用于訓練人工智能模型的人工生成數(shù)據(jù)，通常由其他人工智能模型創(chuàng)建。“現(xiàn)實世界的數(shù)據(jù)非常昂貴、耗時且難以收集，”Thurai（圖萊）補充說，“例如，一些大語言模型在數(shù)十億個參數(shù)上進行訓練，你輸入的數(shù)據(jù)越多，模型就越好。”合成數(shù)據(jù)也可以用于填補空白，或替換個人可識別信息。但是過多的合成數(shù)據(jù)可能會引入新的偏見，并且如果模型在合成數(shù)據(jù)上進行訓練，然后用于生成更多合成數(shù)據(jù)，重復的循環(huán)可能會導致模型崩潰。

22.Vector database/?向量數(shù)據(jù)庫

通常用于存儲信息，然后通過RAG為人工智能模型提供所需的上下文。向量數(shù)據(jù)庫在多維空間中存儲數(shù)據(jù)，允許密切相關的信息彼此靠近存儲，以便更容易搜索。超大規(guī)模提供商和人工智能平臺供應商通常會在其工具集中包含一個向量數(shù)據(jù)庫。此外，Pinecone（?是一個云原生的向量數(shù)據(jù)庫，專為高性能的AI應用提供長期記憶。它適用于涉及大模型、生成式人工智能和語義搜索的應用。該數(shù)據(jù)庫能夠輕松存儲和查詢向量數(shù)據(jù)，提供優(yōu)化的性能和實時分析能力。）是一個流行的開源向量數(shù)據(jù)庫，而Elasticsearch（?是一個開源的分布式搜索和分析引擎，它是Elastic Stack的核心組成部分，旨在提供近乎實時的搜索和分析功能。Elasticsearch基于Apache Lucene構(gòu)建，采用分布式架構(gòu)，支持大規(guī)模數(shù)據(jù)的存儲和快速檢索。它支持結(jié)構(gòu)化或非結(jié)構(gòu)化文本、數(shù)字數(shù)據(jù)以及地理空間數(shù)據(jù)的搜索和分析，能夠發(fā)現(xiàn)數(shù)據(jù)中的趨勢和模式。Elasticsearch的設計目標是讓全文搜索功能的實現(xiàn)變得簡單，通過提供一套簡單一致的RESTful API，隱藏了Lucene的復雜性，使得用戶可以輕松地實現(xiàn)數(shù)據(jù)的索引、搜索和分析。）和OpenSearch（是一個開源的搜索和分析引擎，由AWS創(chuàng)建并維護，最初作為Elasticsearch的一個開源分支出現(xiàn)。其設計旨在提供一個高效處理大量數(shù)據(jù)并提供快速、準確搜索結(jié)果的解決方案。它被比喻為一個可擴展的數(shù)字圖書館員，能夠?qū)崟r組織、編目和檢索大量數(shù)據(jù)集中的信息，適用于分析日志、構(gòu)建搜索引擎或執(zhí)行數(shù)據(jù)分析等使用場景。）在全文搜索方面很受歡迎。

23.Zero-shot prompting/零樣本提示

一種生成式人工智能用例，其中用戶不提供他們希望大語言模型如何響應的示例，并且是使用生成式人工智能聊天機器人的最簡單方法。“有了零樣本提示，任何人都可以在生成式人工智能工具前進行操作，并為企業(yè)做一些有價值的事情，”Publicis Sapient（陽獅集團/Publicis Groupe的數(shù)字轉(zhuǎn)型中心，2014年11月，被陽獅集團收購。是一個數(shù)字轉(zhuǎn)型合作伙伴中心，可幫助成熟的機構(gòu)實現(xiàn)數(shù)字化運營，無論是他們的工作方式還是服務客戶的方式。Publicis Sapient通過創(chuàng)業(yè)思維和現(xiàn)代方法，將戰(zhàn)略、咨詢和客戶體驗與敏捷工程和解決問題的創(chuàng)造性融為一體來幫助解鎖價值。作為數(shù)字先驅(qū)，Publicis Sapient在全球范圍內(nèi)擁有20,000名員工和53個辦事處，橫跨科技、數(shù)據(jù)科學、咨詢和創(chuàng)意領域的經(jīng)驗加上其好奇和義無反顧的文化讓其能夠通過打造客戶所期待的產(chǎn)品和服務，加速客戶業(yè)務的發(fā)展。陽獅集團/Publicis Groupe，法國最大的廣告與傳播集團，創(chuàng)建于1926年，總部位于法國巴黎。）首席產(chǎn)品官Sheldon Monteiro（謝爾頓·蒙泰羅）表示，“就像一個開發(fā)人員進去說，‘幫我寫代碼。’”