沒有關係,這是盤古最擅長的。
盤古給了蕭銘幾個接入入了口。
蕭銘將導入大量的中英文資料,資料不僅有名著更有口水話表達的網路、貼吧問答、微博、推特文章等等。
未來這些資料會可以由用戶們自己上傳,優化程序的準確性。
盤古的數據庫能將整合這些資料,熟悉每一個句子的語境,然後整理出數據模型模擬出漢語和英語等人類思維表達方式的模型。
這些數據會幫助“詞向量”在不同的語境和語法中出現在合適的位置,如此翻譯會更加準確。
這項工作最大的難點就是編譯量非常大
所以現今市麵上現存的翻譯軟件都是采用語言學家總結的語法庫,即便有少部分軟件有自我學習功能,也不能做到了解和統計當今所有的語言習慣並對其作出分析。這也是現有翻譯軟件機械不智能錯誤百出的原因。
剩下的一些接口,蕭銘將其接入全國各地的免費直播間,直播間主播有用普通話有用地方語言,也屬於口語的表達,最具有代表性。
盤古語言將搜集各地的語音和語氣將其歸類編譯,最後形成語音數據庫和文字庫相對應。
盤古編程使用方式很簡單,不需要輸入代碼,隻需要告訴邏輯意圖,當蕭銘告訴邏輯和方式之後,編程語言就可以明確運行。
然後
然後計算機卡死了,卡得發燙
蕭銘廢了半天功夫心血化為烏有。
勞資
蕭銘購買的筆記本是華碩的普通筆記本,用的是i78550u處理器。
筆記本的處理器處理如此大量的數據,不卡死才怪
蕭銘看了下時間,已經淩晨三點。
“我需要一組服務器。”蕭銘說道,隨後他躺在床上繼續思考著語言翻譯和英語學習助手軟件的邏輯性問題。
接下來的幾天,蕭銘在學校很沉默。
除了做必要的數學和理綜練習題以外,大部分時間都在做英語和語文。
學校小組的成員都知道蕭銘在水木大學老師離開之後心情不怎麼好,都沒有去打擾他。
幾天之後,蕭銘問老爹要了十萬塊的經費,直接網購了四組英特爾xeone52603v4芯片組建的服務器主機,並且聯係人上門安裝。又花錢開通了企業光纖專線。
蕭銘看著白花花的銀子今天時間就花沒了,也是肉痛。
兩個行業絕對是暴利
一個是英特爾的芯片行業,一個是電信的通訊行業
安裝服務器的年輕師父看著幾天沒睡好覺有些滄桑猥瑣的蕭銘,偷偷說道“建直播網站小兄弟,現在風聲緊,服務器好還是租用海外的好點,自己建設風險大”
蕭銘無語,“那你要不要先充個會員可以一對一。”
師父嘿嘿笑了兩聲說道“不了不了。”
手機用戶請瀏覽閱讀,更優質的閱讀體驗,書架與電腦版同步。