我寫的自傳不可能是悲劇!
“彙聚全世界的資源,分享你我他的快樂……”
聽著鄭秋緩緩讀出這條產品介紹,俞華忍不住砸吧砸吧嘴。
“嗯!聽著的確像是某種資源分享平台?”
鄭秋登時無語,翻著白眼指了指下麵的一行小字。
“這麼牛逼的公司怎麼可能這麼膚淺!看下麵!
精選優質知識資源、促進教育方法改革、提升人才質量、推動智慧分享。
弘揚中華文化,吸收世界文明。
加快腳步邁入知識型社會——廣大莘莘學子的福音!
這格局……一聽就大的沒邊了!”
“某個相親網站還喊口號說自己想促進人類繁衍,延續地球文明呢,大的沒邊誰不會啊?”
“嗯……相親網站?”
鄭秋狐疑的盯著麵前的大齡光棍。
“咳!這都是小細節,那什麼,我們快點進去看看有沒有什麼驚喜吧,這可是白夜紀出品!
唔……上麵寫著可以用天樞er或者八戒的賬號進行同步完成注冊,咱們都沒有。
如果是新用戶,那麼個人賬號注冊則需要實名認證,等會兒……”
於是,注冊……輸入身份證號……綁定手機號……
一番操作之後,俞華獲得了一個初始賬號。
登陸之後,眼前立刻切換到了一個看著十分簡潔的新界麵。
左邊是個信息欄,除了自己的個人姓名和待編輯資料外,還有一個叫做“智慧幣”的東西,目前數額為5。
右邊則是光禿禿的什麼都沒有,就一個孤零零的搜索框,背景則是白夜紀的機器人lo。
“這東西怎麼用?”
“既然是知識類的分享平台,那應該是類似搜索引擎的東西,先輸入一個搜索項目試試看。”
於是俞華隨手輸入“人工神經網絡(ann)隨機森林算法相關期刊論文”……
這也正是他目前的研究課題。
“刷!”隻見界麵一變。
10篇相關論文及其簡介就一項項出現在兩人麵前。
“咦?還不錯誒,上麵頭幾篇都是這個領域引用次數較多,權重較高的權威論文……
看!第10篇還是你去年的論文!”俞華驚喜道。
鄭秋搶過鼠標,點開自己那篇論文,果然,是自己寫的沒錯,上麵清楚的標注了著作人和發表時間。
看著自己的作品,鄭秋有些臭屁的點點頭。
“嗯!看來這個檢索還是有些眼光的嘛!”
俞華懶得搭理這個自戀狂,又點擊下一頁,繼續查看檢索順序10~20的其他論文,果然又發現了好幾篇熟悉的業內權威。
一直到第100篇,幾乎沒有一篇是無效的“水文”。
就這檢索效率和效果,就絕不比蜘網來的差了。
而且令人驚訝的是,彆的網站通過期刊論文檢索出來的,隻要年份稍微久遠點,一般都是圖文版,也就是用相機掃描下來的。
因為以前電腦普及度不高,論文大多還隻是進行紙質存檔的。
就算後來電腦普及了,一篇篇重新機打出來也是一項異常龐大浩瀚的工程,所以隻能掃描電子化進行存檔。
隻不過,那清晰度就像是在對著電腦看舊報紙,很影響閱讀體驗。
比如有一篇《隨機向量學習模型》,他明明記得,在蜘網的檢索數據庫中它還是一篇掃描文檔。
然而這裡顯示出來的,卻是清晰完整的電子檔。
就連文章中的表格和圖文,也進行了高度還原原著的電子化重製,讓人一目了然。
就算是原作者看了,怕是也隻能說一句“無懈可擊”……
“這幫家夥,該不是把舊的數據庫文獻全都給優化了一遍吧……”
鄭秋腦子裡突然蹦出一個極為不可思議的想法。
這種工程量,絕非少量人力可以完成,唯一的可能就是依靠自動化程序進行批量圖文轉換識彆……
如果真是如此,那這圖文轉換效果簡直炸裂啊!
“這東西說是還能查重來著,不知道效果怎麼樣……我試試看。”
俞華沒忘記自己原本的目的,當即從電腦裡找出一篇已經審核過的碩士生論文,按照提示直接拖入對話框……
請問是否花費1智慧幣進行查重服務?是否
“原來要花站內幣啊……1幣一次,這樣看來每個新用戶都有5次免費查重機會?還不錯。”
俞華心裡還是有些滿意的。
雖說不是完全免費,總比那些個上來就直接彈付款碼的要好些。
選擇“是”,下一刻,畫麵上蹦出一個進度條。
大概3分鐘的功夫,進度條就緩緩拉到底,最終跳出來一個大號數字——重複率693!
“啥?693?”俞華臉上有些錯愕。
“怎麼啦?”
“這篇論文我用蜘網查重過,最後結果是362來著……喏,這是蜘網的查重報告單。”
俞華從旁邊的書桌上找了找,遞過去一張打印a4紙。
當蜘網查重係統在檢測論文內容時,會將論文與自己的係統庫進行比對。
如果發現連續出現13個字符,也就是七八個漢字類似,就會判為重複,計算這部分重複率,最後將查重後的數據顯示在最後的報告單中。
同時還會在文本中以紅色字體顯示重複內容,並在重複區域旁標注出該段引用的相關文獻。
總的來說,蜘網雖然收費貴,但是就檢索結果來說,服務還是比較到位的。
鄭秋看著手中的查重報告單,又看了看電腦上給出的693的高重複率,皺了皺眉。
“彆的不說,就這查重速度,就快的有些匪夷所思了,該不是互聯網算命……玩隨機那一套亂給的吧?”
剛剛那進度條,滿打滿算也不超過3分鐘。
3分鐘,看似有些漫長,但相對規模龐大的文獻數據庫檢索量來說,簡直快到不可思議!
要知道,蜘網的單次查重耗時一般為30~60分鐘,在畢業高峰期間甚至會超過2個小時。
相比之下,這樣的“查重”耗時,多少顯得有些兒戲了。
什麼樣的運算速度和檢索算法,能在這麼短的時間內檢索完那麼龐大的文獻庫?
“不可能吧……這麼優秀的公司,而且人家也給了查重結果的。”
俞華說著點開下方的“查重報告”按鈕。
下一刻,電腦前的兩人都愣住了。
畫麵上,這篇論文超過一半的地方都被紅色標注了出來,旁邊掛了引用文獻和對應跳轉鏈接。
密密麻麻的根本不像是胡編亂造……
“真的假的啊?”鄭秋有些傻眼。
他一把拿起那份蜘網的查重報告,開始逐行比對。
“這個有,這個也有……嘶~全中!”
蜘網檢索出來的重複段落標注和引用文獻,這裡全都有,而且還貼心的給了文獻鏈接,真假一目了然。
那麼多出來的這些……
通過兩人比對,得出了一個令人震驚的結論。
那就是這個智慧樹所檢索的數據庫……居然比蜘網來的還要全麵!
通常來說,論文查重係統的數據庫,主要包括“學術期刊數據庫”、“學位論文數據庫”以及“互聯網數據庫”。
這其中“互聯網數據庫”最為複雜,指的是大量的網頁、博客、論壇等互聯網信息資源。
論文查重係統會將互聯網數據庫作為重要的對照,檢測論文中是否存在互聯網上已被公開發布的相似內容。
“臥槽!對方哪兒來的這麼龐大的數據庫資源?”俞華不解道。
下一刻他似乎是反應過來……
“該不會,是爬蟲程序吧?”
國外有個牛逼的程序猿,靠著編寫的強大爬蟲程序,抓取了世界上超過6億個網站的網絡公共資源!
最後就連骨歌、亞馬孫、adobe、ebay等互聯網大廠,都前來尋求數據支持。
一桌一椅一電腦。
單槍匹馬搞出了年營收1400萬美元的誇張戰績!
而整個公司僅有一個員工,堪稱有史以來商業效率最高的企業!
所以……會爬數據,也是絕對的高科技!
“不止!你看,就連圖表或者公式的抄襲……對方也能檢測出來!”
鄭秋指著一串字符旁的標注震驚道。
蜘網的檢測技術是有缺陷的,部分“圖表”,“athtye編輯公式”,“ord代碼”都不能識彆,這就留下了一些漏洞。
而現在……這個漏洞被堵上了……