您現在的位置是:首頁 > 棋牌

AIGC的一小步,人類文明的一大步

  • 由 闌夕 發表于 棋牌
  • 2023-01-10
簡介開源本身的價值在於,它可以經由第三方的大規模使用,加快模型更新迭代的效率,和「一家獨大」的ChatGPT不同,AI繪畫的爆發——似乎每家網際網路公司都搞出了一款輸入文案生成圖畫的產品出來——就得益於文圖生成模型Stable Diffusio

象棋雙方各有幾個棋子

AIGC的一小步,人類文明的一大步

文 | 闌夕

1779年,奧地利女皇瑪利亞·特蕾莎收到了一份特殊的禮物,一位發明家聲稱創造出了可以自動下棋的模擬人類,因為造型身披土耳其禮服,所以這個裝置被稱作是「土耳其機器人」,在宮廷巡遊裡,它擊敗了多名國際象棋高手,甚至包括本傑明·富蘭克林和菲特烈大帝,很快便聲名鵲起。

「土耳其機器人」的秘密並不複雜,它的體內其實藏了一個精通國際象棋的侏儒,透過透鏡折射,侏儒能夠看到棋盤走勢,並透過磁鐵操縱所謂的機器人移動棋子對弈,與其說這是一件科學工藝的作品,不如說它更接近於現代魔術,障眼法才是真正的妙訣所在。

AIGC的一小步,人類文明的一大步

但是,「土耳其機器人」的故事並非就此結束,1819年,英國數學家查理斯·巴貝奇和它下過2次棋——很遺憾,都輸了——然後猜出了這個騙局的本質,不過巴貝奇沒有就此揪著不放,而是將這種自動化的思路放在了對於分析機的設計裡,他的畢生都在致力於做出一個能夠自動計算函式表格的機器,就像「土耳其機器人」那樣準確無誤。

如果說巴貝奇是在製造最早的計算機,那麼他的同事阿達·洛芙萊斯就開發了最早的軟體,她敏銳的意識到分析機能做的事情絕非只有自動化的計算,而是有潛力發展出全新的「詩意科學」(Poetical Science),在程式的驅動下,這種機器甚至將能自主編寫不可思議的曲譜。

只是,當時誰都沒有想到,這個充滿樂觀的設想,還要花上幾百年才能實現。

· · ·

就在這個月,崑崙萬維開源了名為「崑崙天工」的AIGC全系列演算法模型,模型包括天工巧繪SkyPaint、天工樂府SkyMusic、天工妙筆SkyText、天工智碼SkyCode,覆蓋影象、音樂、文字、程式設計等多模態內容生成能力。

AIGC的一小步,人類文明的一大步

以天工巧繪SkyPaint為例,你可以在小程式中隨性輸入一句話即可得到一幅畫作,哪怕是中英文雙語輸入也能得到多種風格的AI繪畫作品。在這背後發揮作用的,是全球第一款多語言Stable Diffusion分支模型和1。5億中英雙語語料,這也是國內為數不多的支援中英雙語的文圖生成模型。

天工樂府SkyMusic則是國內第一款商用級作曲AI模型,它不但可以編曲,還能基於旋律或是文案素材創作歌詞,迄今為止已經發行了近20首AI生成的商用歌曲,甚至都有ISRC版權認證,在交易市場買賣流通。換句話說,你在Spotify、網易雲和QQ音樂隨機聽到的歌曲,可能就有天工樂府SkyMusic的AI作品,在短影片BGM和有聲書配樂等要求相對更低的領域,AIGC的覆蓋率還會更廣。

天工妙筆SkyText可以為使用者提供續寫、對話、中英翻譯、內容風格生成、推理、詩詞對聯等功能服務。比起《慶餘年》裡只會背詩的範閒,天工妙筆SkyText更具創造力,能夠帶來讓人耳目一新的佳作。這些創造性思維,是由千億級別的高質量中文資料集訓練而來,在訓練4周、後續最佳化2周後最終得到百億引數量的GPT-3生成模型。

天工智碼SkyCode是全球第一款多語言開源程式設計大模型,支援多種主流程式碼語言SkyCode能夠生成的程式碼,不僅包括使用廣泛的python、Java、C等,還涵蓋了php、go、swift等共計十餘種程式語言,使不同語言的使用者都能來體驗SkyCode強大的程式碼生成能力。換言之,天工智碼SkyCode就是一位可被你隨時隨地調動的AI智慧程式設計助手。

巴貝奇和洛芙萊斯看到的那個未來,以及「詩意科學」的開枝散葉,至此真正成為了近在咫尺的現實。

在把模型開源並上傳到GitHub之後,崑崙萬維的CEO方漢說,他堅信開源才能推動AIGC的生態發展,這種選擇在中文網際網路的環境下並不多見,甚至連近來大熱的ChatGPT,其背後公司OpenAI就都還沒有開源GPT-3模型。

開源本身的價值在於,它可以經由第三方的大規模使用,加快模型更新迭代的效率,和「一家獨大」的ChatGPT不同,AI繪畫的爆發——似乎每家網際網路公司都搞出了一款輸入文案生成圖畫的產品出來——就得益於文圖生成模型Stable Diffusion的程式碼開源,而所有的訓練資料,終將反哺Stable Diffusion變得更加聰明。

崑崙萬維大概也希望在模型層的佈局能夠強化這家公司的競爭壁壘,畢竟它從2020年開始就在AIGC賽道砸進了重磅資源,它的主要業務——遊戲、社交、音樂等等——也都對AIGC的工業化應用有著高度需求,投入產出的真章,都會見於技術力的厚度。

事實證明,人工智慧的指數級進化,和它新增的落地場景有著正比關係,從AlphaGo擊敗李世石和柯潔,到ChatGPT和網友們談笑風生,人和機器之間的邊界越是模糊,生產力的變革也就越是急迫。

至少,行業內的共識都是:大的要來了。

· · ·

學術界有一個經久不衰的討論話題,就是何為人類的獨特性,比較主流的解釋包括但不限於直立行走、懂得使用工具、擁有複雜的語言系統、具有理性等等。

歷史學家尤瓦爾·赫拉利在代表作「人類簡史」裡把上述歸因都槓了個遍,比如他說能夠直立行走的遠非智人——即現代人的先祖——像是直立人和尼安德特人都是能跑能跳的人屬,只不過它們沒能存活下來罷了。

最後,赫拉利的結論是人類擁有虛構能力,這是所有其他物種都不具備的素質,因為可以創造並相信虛構的故事,人類文明誕生了神祇、國家、民族、貨幣、權力等等諸多認知,這才徹底拉開了與野獸之間的差別。

AIGC的一小步,人類文明的一大步

有趣的是,赫拉利在「人類簡史」出版十週年時,要求GPT-3模仿自己寫了一篇新序,最後生成出來的結果讓他「毛骨悚然」,以致於他說,斧頭、車輪和火藥都給予了人類新的力量,然而有史以來第一次,人工智慧這種力量可能會脫離人類之手。

赫拉利當然應該驚慌,因為他用了很多年研究出來的那個終極答案——人類的獨特性在於能夠虛構和創造——被輕而易舉的顛覆了,神聖的權柄悄然旁落,一切的堅固也就蕩然無存。

在擁有天工樂府SkyMusic這種AI作曲產品之後,崑崙萬維成立了一家名為MusicX Lab的實驗室,旨在落地AIGC的商業模式,除了在全球發行完全由人工智慧創作出來的歌曲之外,它還聯絡了很多青年歌手,說服他們接受AI成為自己的「合夥人」。

在MusicX Lab籌辦的夏令營裡,學員的角色被定義為「參與式原創」,相比李宗盛那樣自己給自己寫歌的傳統唱作人,新生代歌手們更像是工程師,他們輸入要求、管理過程、監督結果,最終由AI補齊成品,歌手直接拿著寫好的歌詞和譜子進錄音棚。

從不同的角度來看,這種生產關係的改變必然有著二象性,悲觀者會認為,這是人類在讓渡創造性的潰敗史上的又一次投降,對於未來的機器人軍團搶走飯碗這件事情渾然不知,而樂觀者卻能看到工具價值的提高對於人類工作效率的增益,就像沒有人會因為汽車取代了步行而感到難過。

無論如何,藝考教材上的一道對錯題恐怕需要把標準答案從「正確」改成「錯誤」了:藝術創作是人類特有的一種高階的、複雜的精神活動與實踐活動。

· · ·

根據測算,ChatGPT的對話成本大概是幾美分一次,聊個十來分鐘可能就相當於一個巨無霸漢堡的價格了,考慮到使用規模,發展這類業務的最大難題,還是在於如何解決商業模式的可持續問題,OpenAI可以依靠融資暫時支援ChatGPT「廣迎賓客」,但在產業端,真正的定心丸,還要等到羊毛出在誰身上的答案出爐。

或者,就像崑崙萬維的試探方向:「你已經是一個成熟的AI了,該學會自己掙錢了。」

因為旗下游戲產品相當豐富,崑崙萬維實際上長期都對場景音樂的製作或是技能圖示的繪製有著極高的需求,而在過去的採購清單裡,外包一首樂曲的費用是2萬塊錢起步,設計一個遊戲圖示則要600塊錢,積微成著下來,開銷向來不低。

而在有了AIGC的硬投入之後,崑崙萬維率先成為了自家技術的買單方,由人工智慧生成的樂曲,平均每首的成本不到5塊錢,而圖示設計的成本更是低到可以忽略不計,更重要的是,生產週期都開始以秒為單位進行,對於公司降本增效的賦能很大。

AIGC的一小步,人類文明的一大步

這很容易讓人聯想到AWS的歷史。

彈性計算雲的誕生,本來是傑夫·貝佐斯用來解決公司內部各條業務線之間過度損耗的問題,但是後來亞馬遜意識到,它遇到過的問題,很有可能在其他公司也會出現,所以AWS作為解決方案,完全可以做成商業服務賣出去,避免「重複造輪子」的浪費——更重要的是,它們造出來的輪子,可能還沒有亞馬遜的好。

所以AWS後來成為了亞馬遜集團裡最能掙錢的一片飛輪,也證明了科技公司的能力溢位價值:在苛刻的標準裡,能夠自產自銷的產品,一定也擁有行業上的橫向競爭力。

在崑崙萬維的佈局裡,AIGC的商業價值也在於它在內容端的生產能力,以及在toB場景下作為智慧槓桿的勞動替代能力。

如果說模型層的開源是一種互利互惠的考慮——為社群貢獻技術資源,同時藉助社群的資料互動更新演算法——那麼應用層的變現,則是可以把AI封裝為輔佐專業人員以及公司的助手,「不眠不休」的為他們寫程式碼、編曲子、畫地圖……而在toB場景中,隨著各種AIGC工具的產品深度不斷提升,甚至可以逐漸駕馭各種專業型內容的產出,從底層商業邏輯上去改變內容產業。比如,創意公司不再需要擔心核心員工的突然跳槽,也不再害怕因為員工個人情緒波動而影響公司的創意質量。

從這個角度來看,資料是科技時代的石油這個說法並不準確,位元本身沒有價值,使用位元的結果才有價值,所以智慧才是未來的能源,它的廉價化和無處不在,才會改變地球上每一個人的生活方式。

· · ·

在製作分析機時,巴貝奇和洛芙萊斯找到了一個願意資助他們工作的有錢人、同時也是物理學家的大衛·布儒斯特,他在目睹了「土耳其機器人」及其引起的科學探索之後,說了一句意味深長的話:

「那些本來為了取悅普通人而發明出來的自動化玩具,現在正在用於開拓我們人類的能力並將文明帶向更新的境界。」

AIGC的熱潮,也在呼應著這句幾百年前的箴言,成千上萬的網民在各種實驗性的應用裡玩得不亦樂乎,興奮的把光怪陸離的圖片和對答如流的截圖發到社交媒體裡,也讓人工智慧成了一個充滿獵奇屬性的樂子。

但在普通人看不到的程式碼深海里,在每一張晶片、每一塊顯示卡的功耗裡,智慧的進化從未停止,並且,越來越快。

Top