NRAR 曾在 NEARCON 2023 上推出過 NEAR Tasks,目標是為了進行人工智慧模型的的訓練和改進。

作者:Haotian

封面:Near

最近,NEAR founder @ilblackdragon 將亮相英偉達 AI 大會的消息,讓 NEAR 公鏈賺足了眼球,市場價格走勢也喜人。 不少朋友疑惑,NEAR 鏈不是 All in 在做鏈抽象么,怎麼莫名其妙就成了 AI 頭部公鏈了? 接下來,分享下我的觀察,順帶科普下一些 AI 模型訓練知識:

1)NEAR 創始人 Illia Polosukhin 有過較長時間的 AI 背景,是 Transformer 架構的共同構建者。 而 Transformer 架構是如今 LLMs 大型語言模型訓練 ChatGPT 的基礎架構,足以證明 NEAR 老闆在成立 NEAR 前確實有 AI 大模型系統的創建和領導經驗。

2)NRAR 曾在 NEARCON 2023 上推出過 NEAR Tasks,目標是為了進行人工智慧模型的的訓練和改進,簡單來說,模型訓練需求方(Vendor)可以在平臺發佈任務請求,並上傳基礎數據素材,使用者(Tasker)可以參與進行任務答題,為數據進行文本標註和圖像識別等人工操作。 任務完成後,平臺會給使用者 NEAR 代幣獎勵,而這些經過人工標註的數據會被用於訓練相應的 AI 模型。

比如:AI 模型需要提高識別圖片中物體的能力,Vendor 可以將大量圖片中帶有不同物體的原始圖片上傳到 Tasks 平臺,然後使用者手動標註圖片上上物體位置,就可以生成大量「圖片-物體位置」的數據,AI 就可以用這些數據來自主學習來提高圖片識別能力。

乍一聽,NEAR Tasks 不就是想社會化人工工程來為 AI 模型做基礎服務嘛,真有那麼重要? 在此加一點關於 AI 模型的科普知識。

通常情況下,一次完整的 AI 模型訓練,包括數據採集、數據預處理和標註、模型設計與訓練、模型調優、微調、模型驗證測試、模型部署、模型監控與更新等等過程,其中數據標註和預處理為人工部分,而模型訓練與優化為機器部分。

顯然,大部分人理解中的機器部分要明顯大於人工部分,畢竟顯得更高科技一些,但實際情況下,人工標註在整個模型訓練中至關重要。

人工標註可以為圖像中的物件(人、地點、事物)等添加標籤,供計算機提升視覺模型學習; 人工標註還能將語音中的內容轉化為文本,並標註特定音節、單詞短語等幫助計算機進行語音識別模型訓練; 人工標註還可以給文本添加一些快樂、悲傷、憤怒等情感標籤,讓人工智慧增強情感分析技能等等。

不難看出,人工標註是機器開展深度學習模型的基礎,沒有高品質的標註數據,模型就無法高效學習,如果標註數據量不夠大,模型性能也會受到限制。

目前,AI 微創領域有很多基於 ChatGPT 大模型進行二次微調或專項訓練的垂直方向,本質上都是在 OpenAI 的數據基礎上,額外增加新的數據源尤其是人工標註數據來施展模型訓練。

比如,醫療公司想基於醫學影像 AI 做模型訓練,為醫院提供一套在線 AI 問診服務,只需要將大量的原始醫學影像數據上傳到 Task 平臺,然後讓使用者去標註並完成任務,就產生了人工標註數據,再將這些數據對 ChatGPT 大模型進行微調和優化,就會讓這個通用 AI 工具變成垂直領域的專家。

不過,NEAR 僅僅憑藉 Tasks 平臺,就想成為 AI 公鏈龍頭顯然還不夠,NEAR 其實還在生態系統中進行 AI Agent 服務,用來自動執行使用者一切鏈上行為和操作,使用者只需授權就可以自由在市場中買賣資產。 這有點類似 Intent-centric,用 AI 自動化執行來提升用戶鏈上交互體驗。 除此之外,NEAR 強大的 DA 能力可以讓它在 AI 數據來源的可追溯性上發揮作用,追蹤 AI 模型訓練數據有效性和真實性。

總之,背靠高性能的鏈功能,NEAR 做 AI 方向的技術延展和敘事引導,似乎要比純鏈抽象要不明覺厲多了。

半個月前我在分析 NRAR 鏈抽象時,就看到了 NEAR 鏈性能+團隊超強 web2 資源整合能力的優勢,萬萬沒想到,鏈抽象還沒有普及開來摘到果子,這一波 AI 賦能再一次把想像力放大了。

Note:長期關注還是得看 NEAR 在 “鏈抽象” 上的佈局和產品推進,AI 會是個不錯的加分項和牛市催化劑! #NEAR

免責聲明:作為區塊鏈資訊平臺,本站所發佈文章僅代表作者及嘉賓個人觀點,與 Web3Caff 立場無關。 文章內的資訊僅供參考,均不構成任何投資建議及要約,並請您遵守所在國家或地區的相關法律法規。