第四百七十二章跑步進場_我寫的自傳不可能是悲劇

我寫的自傳不可能是悲劇！

“彙聚全世界的資源，分享你我他的快樂……”

聽著鄭秋緩緩讀出這條產品介紹，俞華忍不住砸吧砸吧嘴。

“嗯！聽著的確像是某種資源分享平台？”

鄭秋登時無語，翻著白眼指了指下麵的一行小字。

“這麼牛逼的公司怎麼可能這麼膚淺！看下麵！

精選優質知識資源、促進教育方法改革、提升人才質量、推動智慧分享。

弘揚中華文化，吸收世界文明。

加快腳步邁入知識型社會——廣大莘莘學子的福音！

這格局……一聽就大的沒邊了！”

“某個相親網站還喊口號說自己想促進人類繁衍，延續地球文明呢，大的沒邊誰不會啊？”

“嗯……相親網站？”

鄭秋狐疑的盯著麵前的大齡光棍。

“咳！這都是小細節，那什麼，我們快點進去看看有沒有什麼驚喜吧，這可是白夜紀出品！

唔……上麵寫著可以用天樞er或者八戒的賬號進行同步完成注冊，咱們都沒有。

如果是新用戶，那麼個人賬號注冊則需要實名認證，等會兒……”

於是，注冊……輸入身份證號……綁定手機號……

一番操作之後，俞華獲得了一個初始賬號。

登陸之後，眼前立刻切換到了一個看著十分簡潔的新界麵。

左邊是個信息欄，除了自己的個人姓名和待編輯資料外，還有一個叫做“智慧幣”的東西，目前數額為5。

右邊則是光禿禿的什麼都沒有，就一個孤零零的搜索框，背景則是白夜紀的機器人lo。

“這東西怎麼用？”

“既然是知識類的分享平台，那應該是類似搜索引擎的東西，先輸入一個搜索項目試試看。”

於是俞華隨手輸入“人工神經網絡（ann）隨機森林算法相關期刊論文”……

這也正是他目前的研究課題。

“刷！”隻見界麵一變。

10篇相關論文及其簡介就一項項出現在兩人麵前。

“咦？還不錯誒，上麵頭幾篇都是這個領域引用次數較多，權重較高的權威論文……

看！第10篇還是你去年的論文！”俞華驚喜道。

鄭秋搶過鼠標，點開自己那篇論文，果然，是自己寫的沒錯，上麵清楚的標注了著作人和發表時間。

看著自己的作品，鄭秋有些臭屁的點點頭。

“嗯！看來這個檢索還是有些眼光的嘛！”

俞華懶得搭理這個自戀狂，又點擊下一頁，繼續查看檢索順序10~20的其他論文，果然又發現了好幾篇熟悉的業內權威。

一直到第100篇，幾乎沒有一篇是無效的“水文”。

就這檢索效率和效果，就絕不比蜘網來的差了。

而且令人驚訝的是，彆的網站通過期刊論文檢索出來的，隻要年份稍微久遠點，一般都是圖文版，也就是用相機掃描下來的。

因為以前電腦普及度不高，論文大多還隻是進行紙質存檔的。

就算後來電腦普及了，一篇篇重新機打出來也是一項異常龐大浩瀚的工程，所以隻能掃描電子化進行存檔。

隻不過，那清晰度就像是在對著電腦看舊報紙，很影響閱讀體驗。

比如有一篇《隨機向量學習模型》，他明明記得，在蜘網的檢索數據庫中它還是一篇掃描文檔。

然而這裡顯示出來的，卻是清晰完整的電子檔。

就連文章中的表格和圖文，也進行了高度還原原著的電子化重製，讓人一目了然。

就算是原作者看了，怕是也隻能說一句“無懈可擊”……

“這幫家夥，該不是把舊的數據庫文獻全都給優化了一遍吧……”

鄭秋腦子裡突然蹦出一個極為不可思議的想法。

這種工程量，絕非少量人力可以完成，唯一的可能就是依靠自動化程序進行批量圖文轉換識彆……

如果真是如此，那這圖文轉換效果簡直炸裂啊！

“這東西說是還能查重來著，不知道效果怎麼樣……我試試看。”

俞華沒忘記自己原本的目的，當即從電腦裡找出一篇已經審核過的碩士生論文，按照提示直接拖入對話框……

請問是否花費1智慧幣進行查重服務？是否

“原來要花站內幣啊……1幣一次，這樣看來每個新用戶都有5次免費查重機會？還不錯。”

俞華心裡還是有些滿意的。

雖說不是完全免費，總比那些個上來就直接彈付款碼的要好些。

選擇“是”，下一刻，畫麵上蹦出一個進度條。

大概3分鐘的功夫，進度條就緩緩拉到底，最終跳出來一個大號數字——重複率693！

“啥？693？”俞華臉上有些錯愕。

“怎麼啦？”

“這篇論文我用蜘網查重過，最後結果是362來著……喏，這是蜘網的查重報告單。”

俞華從旁邊的書桌上找了找，遞過去一張打印a4紙。

當蜘網查重係統在檢測論文內容時，會將論文與自己的係統庫進行比對。

如果發現連續出現13個字符，也就是七八個漢字類似，就會判為重複，計算這部分重複率，最後將查重後的數據顯示在最後的報告單中。

同時還會在文本中以紅色字體顯示重複內容，並在重複區域旁標注出該段引用的相關文獻。

總的來說，蜘網雖然收費貴，但是就檢索結果來說，服務還是比較到位的。

鄭秋看著手中的查重報告單，又看了看電腦上給出的693的高重複率，皺了皺眉。

“彆的不說，就這查重速度，就快的有些匪夷所思了，該不是互聯網算命……玩隨機那一套亂給的吧？”

剛剛那進度條，滿打滿算也不超過3分鐘。

3分鐘，看似有些漫長，但相對規模龐大的文獻數據庫檢索量來說，簡直快到不可思議！

要知道，蜘網的單次查重耗時一般為30~60分鐘，在畢業高峰期間甚至會超過2個小時。

相比之下，這樣的“查重”耗時，多少顯得有些兒戲了。

什麼樣的運算速度和檢索算法，能在這麼短的時間內檢索完那麼龐大的文獻庫？

“不可能吧……這麼優秀的公司，而且人家也給了查重結果的。”

俞華說著點開下方的“查重報告”按鈕。

下一刻，電腦前的兩人都愣住了。

畫麵上，這篇論文超過一半的地方都被紅色標注了出來，旁邊掛了引用文獻和對應跳轉鏈接。

密密麻麻的根本不像是胡編亂造……

“真的假的啊？”鄭秋有些傻眼。

他一把拿起那份蜘網的查重報告，開始逐行比對。

“這個有，這個也有……嘶~全中！”

蜘網檢索出來的重複段落標注和引用文獻，這裡全都有，而且還貼心的給了文獻鏈接，真假一目了然。

那麼多出來的這些……

通過兩人比對，得出了一個令人震驚的結論。

那就是這個智慧樹所檢索的數據庫……居然比蜘網來的還要全麵！

通常來說，論文查重係統的數據庫，主要包括“學術期刊數據庫”、“學位論文數據庫”以及“互聯網數據庫”。

這其中“互聯網數據庫”最為複雜，指的是大量的網頁、博客、論壇等互聯網信息資源。

論文查重係統會將互聯網數據庫作為重要的對照，檢測論文中是否存在互聯網上已被公開發布的相似內容。

“臥槽！對方哪兒來的這麼龐大的數據庫資源？”俞華不解道。

下一刻他似乎是反應過來……

“該不會，是爬蟲程序吧？”

國外有個牛逼的程序猿，靠著編寫的強大爬蟲程序，抓取了世界上超過6億個網站的網絡公共資源！

最後就連骨歌、亞馬孫、adobe、ebay等互聯網大廠，都前來尋求數據支持。

一桌一椅一電腦。

單槍匹馬搞出了年營收1400萬美元的誇張戰績！

而整個公司僅有一個員工，堪稱有史以來商業效率最高的企業！

所以……會爬數據，也是絕對的高科技！

“不止！你看，就連圖表或者公式的抄襲……對方也能檢測出來！”

鄭秋指著一串字符旁的標注震驚道。

蜘網的檢測技術是有缺陷的，部分“圖表”，“athtye編輯公式”，“ord代碼”都不能識彆，這就留下了一些漏洞。

而現在……這個漏洞被堵上了……

第四百七十二章 跑步進場（1 / 2）

第四百七十二章跑步進場（1 / 2）