近年來,在ChatGPT等一些聊天機(jī)器人進(jìn)入公共領(lǐng)域后,生成式人工智能席卷了世界。聊天機(jī)器人以近乎神奇的速度生成了類似人類的文本——以莎士比亞的風(fēng)格寫十四行詩,在多種語言之間翻譯文本,大量編寫計(jì)算機(jī)代碼等等。
企業(yè)和商業(yè)專家立即看到了潛在的好處。但最近幾個(gè)月,人們對生成式人工智能的懷疑還在增加(https://www.npr.org/sections/planet-money/2024/08/06/g-s1-15245/10-reasons-why-ai-may-be-overrated-artificial-intelligence)。批評(píng)者說,生成式人工智能的能力被夸大了。幻覺——生成式人工智能模型可能做出的錯(cuò)誤陳述——降低了其有用性,許多企業(yè)尚未找到使用這些工具的理想策略。盡管ChatGPT是有史以來發(fā)展最快的應(yīng)用程序之一,但表示經(jīng)常使用它的人的比例仍然相當(dāng)罕見(https://mashable.com/article/chatgpt-fastest-growing?test_uuid=01iI2GpryXngy77uIpA3Y4B&test_variant=b)。
在最近對全球技術(shù)領(lǐng)導(dǎo)者進(jìn)行的一項(xiàng)調(diào)查“The Impact of Technology in 2025 and Beyond: an IEEE Global Study”中,91%的受訪者同意“到2025年,隨著公眾的興趣和看法轉(zhuǎn)變?yōu)閷夹g(shù)能夠和應(yīng)該做什么的更大理解和期望,在結(jié)果的準(zhǔn)確性、深度偽造的透明度等方面,將出現(xiàn)一種生成式的人工智能計(jì)算。”
但該調(diào)查預(yù)計(jì)生成式人工智能不會(huì)遇到持久的障礙。相當(dāng)比例的多數(shù)人(91%)也同意“生成式人工智能的創(chuàng)新、探索和采用將在2025年以閃電般的速度繼續(xù)。”
那么,2025年生成式人工智能的前景如何?產(chǎn)品路線圖是什么,它們將對我們的工作和生活方式產(chǎn)生什么影響?
更多多模式功能
IEEE高級(jí)會(huì)員林道莊預(yù)計(jì),未來幾年生成式AI模型將能夠更容易地從簡短的文字片段中提供圖像和視頻,文本到圖像、文本到視頻和語音合成技術(shù)將得到改進(jìn),模型將在多樣化輸入中實(shí)現(xiàn)更好的上下文理解。
林說:“第一步是深度整合多模式,為消費(fèi)者甚至專業(yè)內(nèi)容創(chuàng)作者創(chuàng)造更復(fù)雜、詳細(xì)、準(zhǔn)確和自洽的內(nèi)容。”
解決模型中的準(zhǔn)確性和偏見
對幻覺、準(zhǔn)確性和偏見的擔(dān)憂也減緩了生成式人工智能模型的采用。當(dāng)模型在有偏見的數(shù)據(jù)上訓(xùn)練時(shí),偏見可能會(huì)蔓延。一些圖像生成模型可能會(huì)顯示對某個(gè)種族的人的偏好。
林說:“該模型的開發(fā)人員需要專注于如何消除人工智能在消費(fèi)者數(shù)據(jù)培訓(xùn)過程中產(chǎn)生的偏見和道德問題。重要的是引導(dǎo)用戶接受更普遍、更持久的價(jià)值觀,并引導(dǎo)模型變得更加‘善良’。”
提高模型處理信息的上下文窗口大小
生成式人工智能模型面臨的一個(gè)限制是它們在提示中一次可以處理的信息量。這被稱為上下文窗口或上下文大小。例如,想象一下,你需要輸入一個(gè)很長的提示或描述來生成圖像。在某些時(shí)候,生成式人工智能模型將無法處理整個(gè)提示。輸出將僅反映提示的一部分,省略潛在的重要信息。
在另一種情況下,您可能需要與模型就一份長文檔進(jìn)行對話。隨著對話的進(jìn)行,模型可能會(huì)忘記對話的早期部分。
提高模型處理信息的上下文窗口將使生成式人工智能模型能夠處理更復(fù)雜的任務(wù),并提高其響應(yīng)的一致性。
IEEE研究生會(huì)員Hector Azpurua表示:“我們還沒有達(dá)到生成式人工智能的極限;我們還沒有處于這項(xiàng)技術(shù)增長后的穩(wěn)定期。”