特德薑講了一個堪比他寫的科幻小說般的故事。
“這個事情我是從一個計算機科學家朋友大衛·克裡賽爾那裡聽到的,他接到锝國一家建築公司的求助,說他們公司的施樂複印機出現了一些奇怪的問題。當他們在複印一個房子的平麵圖時,副本和原件之間總是會存在微小但無法忽視的差異。原件中,每棟房子的三個房間都有個矩形來說明它們的麵積,房間分彆是1413平方米、2111平方米和1742平方米。然而在複印件中,所有三個房間都被標記成1413平方米。”
劉玉琨聽過這個故事,露出神秘的微笑。
李睿和妲露拉卻覺得不可思議,複印機不就是應該把原件原原本本的複印下來嗎,為什麼複印件會和原件之間出現如此奇怪的差異呢?
如果不是內部程序出了問題,就隻能是複印機成精了?
特德薑繼續道“那家公司對複印機進行了全方位的檢查,沒有發現任何問題,最後隻能求助於大衛。大衛去看了一下,發現這是一台采用了數字掃描文檔然後打印生成圖像文件的現代複印機,而在掃描和打印的過程之間,複印機內部程序會把每個數字圖像文件進行壓縮,問題就出現在壓縮環節中。”
“我們都知道,壓縮分為兩種,一種是無損壓縮,另外一種是有損壓縮。無損壓縮恢複的文件和原始文件相同,而有損壓縮恢複的文件隻是原始文件的近似值。這台施樂複印機使用了一種被稱為jbig2的有損壓縮格式,是一種專為黑白圖像而設計的,非常節省空間的技術格式,複印機會識彆圖像中看起來相似的區域,並將所有這類區域存儲成一份副本。當文件被解壓時,複印機會重複使用該副本來重建映像。結果就是,複印機判斷出指定房間麵積的標簽非常相似,所以它隻需要存儲其中那個1413平方米的房間,並且在打印時,對所有三個房間都重複使用這一個標簽。”
“原來如此。”李睿和妲露拉明白了。
看來不是複印機成精了,還是內部程序的設計有問題。
看上去,一台複印機疑似成精的故事和人工智能之間沒什麼直接聯係,複印機內部采用的壓縮技術,才是這個故事的關鍵。
特德薑繼續道“大衛把這個問題指出來,並且聯係了施樂的工程師,想必他們很快就會通過補丁來解決這個bug,而我則從這個故事中,發散想到了其他的問題。我們一直認為複印機隻是完整的複製原件,但在數字時代,它卻采用了一種微妙而模糊的方式來解決複製問題,它製造的副本看起來準確,實際上並不準確。我們正在研究的人工智能,是不是也可以采用類似的方式來發展呢?”
“發展不準確的複製?”妲露拉驚訝的問道。
特德薑笑了“當然不是。”
他頓了頓解釋道“據我所知,微軟穀歌還有其他一些公司正在研究語言模型,希望人類和機器能夠通過某種方式進行溝通和對話,這就需要為機器準備極為龐大的數據庫,最好是能夠把整個萬維網儲存下來供機器調用。”
“那是不可能的。”妲露拉搖頭道。
特德薑道“確實不可能,但如果是采用壓縮技術,尤其是有損壓縮的技術,還是有可能的。這需要編寫一個有損算法來識彆所有數據中的統計規律,就可以把所有數據信息儲存下來,供機器學習和使用。唯一的問題是,由於數據被高度壓縮,機器無法通過搜索準確的引用來查找信息,就無法得到一個精確的匹配,隻能通過一些要點來進行響應。”
“chatgpt……不,應該是問心義言……”李睿小聲咕噥著。
“你說什麼?”特德薑問。
李睿搖頭道“沒什麼。”心中卻翻滾著巨浪,原來這麼早就有人提出了類chatgpt的概念了。
特德薑繼續道“我相信通過類似的技術,人類會在不久的將來得到一種能夠對話的人工智能,它保留了萬維網上絕大部分的信息,但它無法精確的回答一個問題,而隻能在數據庫中搜索到一個近似值,再用獨特的創建語法文本的技術來展現答案。這個答案會讓你覺得還不錯,但仔細思考的話,其實經不起推敲,這就是人工智能會在壓縮、搜索、展現環節遇到的關鍵問題,誰能先解決這些問題,誰就有可能在這個領域先行一步。”
十年後,當最初的一批人工智能模型出現時,有的技驚四座,比如chatgpt,有的丟人現眼,比如問心義言。
前世李睿其實不清楚他們的差距到底在什麼地方,現在聽了特德薑的講解,才大概有了一些了解。
問心義言那種亂七八糟的回答不知是哪個環節出現了問題,但chatgpt確實在數據的采用和文本的創建上有獨特的技術,也就難怪一問世就讓所有人目瞪口呆了。
劉玉琨一旁道“我的想法是,人類永遠都應該更相信自己,而不是壓縮之後又複製的人工智能。”
李睿點頭。
chatgpt的確令人驚豔,但最初的幾個版本依然存在大量問題,很多問題看起來回答的十分精彩,可如果認真搜集資料對比的話,會發現其中錯漏百出。
有正常思考能力的人,隻會把chatgpt當成一種輔助工具。
可會不會有人把它的錯誤答案當成正確答案呢?
就像我們讀到的曆史,其實也是一種經過有損壓縮之後又重建的文本,或許是對的,或許是錯的,或許是胡編亂造的,但許多年後也被奉為圭臬……至於真正的曆史是什麼,在這個壓縮又重建的過程中我們損失了什麼,誰又能知道呢?
和特德薑的談話讓李睿受益匪淺,他也真正體會到了科幻小說作家們的前瞻性。
仔細想想,特德薑現在對於人工智能的看法和預言,是不是很像當年凡爾納對於潛艇、環遊世界、火箭和其他很多現在看起來普通平常的科技的幻想和預測呢?
凡爾納在那個年代寫出來的文學作品是幻想,而那些幻想在未來的許多年裡一一被科學家實現。
李睿也深知,特德薑的預言會在不久的將來實現……
喜歡開局同學會上中獎兩億五千萬請大家收藏101novel.com開局同學會上中獎兩億五千萬101novel.com更新速度全網最快。