作者: Daniel Li,CoinVoice

封面: Photo by Maxim Berg on Unsplash

人工智能研究公司 OpenAI 上周正式推出 ChatGPT,這是一種基於對話的人工智能聊天機器人模型,它能夠理解自然語言並以自然語言的方式做出回應。

自 ChatGPT 公測以來,一些網友紛紛試水,各種千奇百怪的問題和新奇的玩法都被網友曬了出來,ChatGPT 也憑藉著既能玩梗、寫詩、寫劇本、又能給程序找 bug 的驚艷才能征服了一眾網友,甚至連馬斯克也忍不住詢問 ChatGPT 怎麼設計 Twitter,一時間 ChatGPT 成為了時下區塊鏈行業最熱門的話題,而與之相關的 AIGC(人工智能生產內容)行業也再度興起。

圖片

ChatGPT 是大型人工智能語言模型

ChatGPT 是一款以 InstructGPT 為基礎的人工智能語言模型,它能進行自然語言理解和生成,並具有高度的智能化和可訓練性。ChatGPT 以對話方式進行交互,既能夠做到回答問題,也能承認錯誤、質疑不正確的前提以及拒絕不恰當的請求,能以更貼近一般人的對話方式與使用者互動。

ChatGPT 是 OpenAI 的 GPT(Generative Pre-trained Transformer)自然語言生成式模型的最新衍生品,而 GPT 是一種基於互聯網可用數據訓練的文本生成深度學習模型,它用於問答、文本摘要生成、機器翻譯、分類、代碼生成和對話 AI。GPT 目前已經迭代到了第三代,第四代 GPT-4 也即將上線。

GPT 發展史

GPT-1 誕生於 2018 年,這一年也是 NLP(自然語言處理)的預訓練模型元年。在性能方面,GPT-1 有著一定的泛化能力,能夠用於和監督任務無關的 NLP 任務。其常用任務包括:自然語言推理、問答與常識推理、語義相似度識別、分類。

GPT-2 出現於 2019 年,GPT-2 並沒有對原有的網絡進行過多的結構創新與設計,只使用了更多的網絡參數與更大的數據集,在性能方面,除了理解能力外,GPT-2 在生成方面第一次表現出了強大的天賦:閱讀摘要、聊天、續寫、編故事,甚至生成假新聞、釣魚郵件或在網上進行角色扮演通通不在話下。

GPT-3 發佈於 2020 年,作為一個自監督模型,幾乎可以完成自然語言處理的絕大部分任務,在參數上,GPT-1 包含了 1.17 億個參數,GPT-2 包含了 15 億個參數,而 GPT-3 比前身多出了 100 倍,數量突破到了 1750 億個參數。在性能方面,GPT-3 能夠將網頁描述轉換為相應代碼、模仿人類敘事、創作定制詩歌、生成遊戲劇本,甚至模仿已故的各位哲學家——預測生命的真諦。且 GPT-3 不需要微調,在處理語法難題方面,它只需要一些輸出類型的樣本(少量學習)。可以說 GPT-3 似乎已經滿足了我們對於語言專家的一切想像。

GPT-4 目前還沒推出,不過坊間傳聞 GPT-4 預計很快就會出現,並且傳聞中還提到 GPT4 已經通過了圖靈測試,而所謂的圖靈測試目的是測試機器能否表現出真人一樣的智能水平,GPT-4 通過了圖靈測試,則表示 GPT-4 已經具備了真人一樣的智力水平。或許從 GPT-4 開始,真正的人工智能時代將要到來。

ChatGPT 和 GPT 的區別

ChatGPT 和 GPT 都是由 OpenAI 訓練的大型語言模型,ChatGPT 是基於 GPT-3 模型的衍生品,因為這一點 ChatGPT 也被稱為 GPT-3.5,但是在實際功能和應用方向上 ChatGPT 和 GPT 系列還是有一些關鍵的區別。

GPT 是最強大的語言模型之一,目前已經發展到了第三代。它可以針對各種自然語言處理任務進行微調,包括語言翻譯、文本摘要和問答,側重於綜合語言服務。而 ChatGPT 是專門為聊天機器人應用程序設計的 GPT-3 模型變體。它在大型對話文本數據集上進行了訓練,因此能夠生成更適合在聊天機器人上下文中使用的響應。

在性能方面,ChatGPT 不如 GPT 強大,但它更適合聊天機器人應用。它通常也比 GPT 更快、更高效,這使其在實時聊天機器人系統中成為更好的選擇。總體而言,ChatGPT 和 GPT 都是強大的語言模型,但它們的設計目的不同,各有所長。

ChatGPT 可以帶來哪些改變

ChatGPT 背後的訓練除了常規的萬億級別語料投餵之外,還依託了更為強大的算力,總算力消耗大約為 3640PF-days,除此之外,ChatGPT 有兩個較為明顯的思路。即引入 “人工標註數據+強化學習”。這也使得 ChatGPT 可以在不斷積累數據的同時,通過不斷的強化訓練,讓自己變的更加智能。ChatGPT 所帶來的改變不僅是為下一代智能搜索引擎發展提供了思路,還將助力 AIGC(人工智能生產內容)行業進一步向前發展。

ChatGPT 開創了搜索引擎的新範式

自 ChatGPT 發布以來便吸引了全球科技圈的目光,其用戶量在短短數天便增長上百萬,而 ChatGPT 通過與用戶交流的方式,充分挖掘用戶真實需求,提出針對性的答案也為未來搜索引擎提供了新範式,ChatGPT 也被認為是最有可能取代谷歌的下一代智能搜索引擎。

人們在 ChatGPT 和谷歌上就相同的一個問題就行檢索,通過對比發現 ChatGPT 往往可以給出用戶最想要的答案,並且答案呈現的方式也非常直接,如 ChatGPT 可以根據用戶編程的需求直接生成代碼,同時也可以幫助用戶檢索已有代碼存在的錯誤。而面對同樣的問題谷歌卻只能給用戶提供一堆網頁鏈接,運氣好或許可以找到類似問題的處理教程,這無疑會花費用戶更多的時間尋找答案。從時間成本和效率上 ChatGPT 無疑比現有絕大多數的搜索引擎更有優勢。

有人甚至將 ChatGPT 比喻為 “搜索引擎+社交軟件” 的結合體,能夠在實時互動的過程中獲得問題的答案,ChatGPT 所帶來的搜索引擎新範式也讓其在尋找答案、解決問題的效率上超越了百度、谷歌等平台,但是 ChatGPT 目前還處在早期發展階段,數據的收集還僅限於 2021 年之前的資料,想要取代谷歌成為下一代智能搜索引擎,ChatGPT 還有很長的一段路要走。

ChatGPT 或將威脅常規內容生產者

ChatGPT 另一個驚豔的表現是在語言組織能力、文本水平、邏輯能力上,一些用戶甚至打算把日報、週報、總結反思類的工作,都交給 ChatGPT 輔助完成。除了在文本創作上,ChatGPT 還能給程序員的代碼找 Bug,一些開發者在試用中表示,ChatGPT 針對他們的技術問題提供了非常詳細的解決方案,比一些搜索軟件的回答還要靠譜。

ChatGPT 更利好創新型內容創作者,基於調查研究和訪談類型的內容,是很難被 ChatGPT 所取代的。真正面臨威脅的是常規性質的內容創造者,如總結報告、基礎的程序編寫等此類常規性質的內容,ChatGPT 已被證實有不輸於人類的能力,並且從時間和成本上看 ChatGPT 無疑比人類更有優勢。就在 ChatGPT 公測不久,國內程序員社區 V2EX 就有用戶就在「程序員」節點發表了一則帖子,名為《體驗了下 chatGPT,越玩心越涼》,心涼的背後是,越來越多證據顯示 ChatGPT 在代碼編寫上的優秀能力,底下的評論則大部分是吐槽自己卷贏了同事,卻最終輸給了 AI。

但是從另一方面看,ChatGPT 也帶來了更多的好處,從輔助索引到內容呈現,ChatGPT 極大地提高了閱讀蒐集材料的效率,打破了知識的壁壘,當人們想要了解或掌握某一項知識時,不用再像過去一樣交學費報班學習,ChatGPT 可以給出專業的指導。此外 ChatGPT 的出現也促使了內容創作者不斷的探索創造新的內容,讓內容創作向更好的方向發展。

ChatGPT 助力 AIGC 行業進一步向前發展

AIGC 是指利用人工智能技術來生成內容,和此前 Web1.0、Web2.0 時代的 UGC(用戶生產內容)和 PGC(專業生產內容)相比,代表人工智能生產內容的 AIGC,是新一輪內容生產方式的變革。

AIGC 真正的大火是源於 AI+繪畫應用的出現,在 2022 初推出至今短短的幾個月內已經孕育了好幾個獨角獸,眾多的資本也開始瘋狂湧入到這一領域,ChatGPT 本身也屬於 AIGC 領域的實際應用,並且 ChatGPT 突出的文本編輯能力也為 AIGC 在文本領域商業化應用提供了可能,相信不久以後一些由 AI 創造的小說、新聞將會很快出現在大眾面前。

AIGC 對於創作的替代,降低了創作門檻,為元宇宙數字內容的豐富打下基礎。在此之上,ChatGPT 所展示了作為生產力的存在,或許在未來會改變獲取信息的方式,成為 AIGC 新時代的用戶入口。而 ChatGPT 的火爆也助力了 AIGC 行業進一步向前發展。

ChatGPT 存在的問題

ChatGPT 的出現讓 AIGC 行業再度興起,隨著越來越多的人開始關注這一行業,ChatGPT 所暴露出來的問題也愈發明顯,雖然 ChatGPT 成功的回答了 CNN 提交的問題,但是一些回答明顯不對。作為人工智能的 ChatGPT 可以回答涵蓋人類所涉及的各個學科的問題,但是 ChatGPT 並不是專家,它無法確保給出的建議或答案是正確的,一些人想要它發揮更多作用,甚至攻克人類尚且無法解決難題的想法恐怕要落空了,至少當前的 ChatGPT 還不具備這項能力。

ChatGPT 造成垃圾答案氾濫成災

Stack Overflow——全世界第二大程序員交友網站,正在面臨 ChatGPT 源源不斷生成垃圾答案的威脅,一些社群成員利用 ChatGPT 生成的答案隨意地發佈到網站上,然而為了判斷這些答案的對錯,避免用戶被誤導,Stack Overflow 就需要安排大量專業人員進行考證,對此疲於應付的 Stack Overflow 不得不宣布,暫時禁止用戶分享來自 ChatGPT 的信息,這些表明了,在涉及一些專業領域或當用戶對於答案精準度有要求時,ChatGPT 目前還不被信任。當前它在人們心中的定位還只是一個人機聊天的工具。

ChatGPT 的回答可能會無意識的傷害到某一群體

除了傳播不正確信息的問題之外,ChatGPT 語言模型的運行機制也很容易給出看似合理但不正確或荒謬的答案,市場研究公司 ABI Research 的研究主管 Lian Jye Su 曾警告說,聊天機器人的運行 “沒有對語言的上下文理解,尤其是它缺乏針對特定區域或國家的了解,一些看似正常的回答可能會傷害到某一類人或是表現出偏見的行為。” 如關於女性是否需要出門帶頭巾的問題,ChatGPT 的問到可能會造成一部分女性的困擾。

ChatGPT 引發社交媒體信任危機

ChatGPT 驚人的語言能力也帶來了另外一個問題,就是它模糊了人類和 AI 的界限,當你在社交媒體上與人交流時,你將無法確認對方是否為真實的人類,社交媒體也有可能會因此陷入信任危機。對此 Twitter 網友 @clowwindy 就發布了一串推文,討論了 ChatGPT 使用氾濫可能導致社交媒體上充斥更多、威脅更大的虛假信息:

圖片

ChatGPT 雖然存在一些問題,但整體瑕不掩瑜,未來隨著 GPT 的更新迭代,這些問題都會得到解決。而且相比於之前大火的 AI 繪畫,ChatGPT 更具有將 AI 能力與工作流程相結合的潛力,例如 ChatGPT 與 Midjourney 等創作工具融合,可以直接輸出設計圖稿等內容,用戶只需要調整自己的需求,就可以促使 AI 輸出更高質量的內容,而 ChatGPT 也可以在用戶不斷的反饋中,調整完善自己的答案。

ChatGPT 的大火離也不開 OpenAI 長期以來在 AIGC 領域的默默耕耘,也正是因為有了前幾代 GPT 的技術積累,ChatGPT 才能厚積薄發,一鳴驚人。很多人驚嘆於 ChatGPT 的能力,但其實真正驚豔的還在後面。ChatGPT 作為 OpenAI 未來人機交互領域的新起點,它的推出只是為即將公測的 GPT-4 作預熱,正如如 OpenAI CEO Sam Altman 的一句話:“Trust the exponential. Flat looking backwards, vertical looking forwards.” 我們就處在即將起飛的這個點上。

免責聲明:作為區塊鏈信息平台,本站所發布文章僅代表作者及嘉賓個人觀點,與 Web3Caff 立場無關。文章內的信息僅供參考,均不構成任何投資建議及要約,並請您遵守所在國家或地區的相關法律法規。