更新時間:2017-08-21 來源:黑馬程序員python培訓學院 瀏覽量:
據(jù)《自然》雜志官網日前報道,一篇發(fā)表在最新一期《進化生物學》雜志上的論文稱,用成千上萬份標本圖像“訓練”過的計算機算法,已經能自動識別被壓制的、干燥植物標本的物種。這是科學家首次嘗試通過深度學習,讓計算機使用大型復雜數(shù)據(jù)集的神經網絡,解決了識別自然物種分類的困難任務。
世界各地的自然歷史博物館正在加速藏品數(shù)字化進程,將標本圖像存儲在開放數(shù)據(jù)庫中。比如美國國家科學基金會的iDigBio項目的一個數(shù)據(jù)庫,就擁有來自全美各地收集的超過1.5億張植物和動物圖像。
目前,世界3.5億個物種中,只有一小部分被數(shù)字化了。但是,隨著計算技術的進步,哥斯達黎加理工學院計算機科學家艾瑞克-蒙塔羅和法國蒙彼利埃國際發(fā)展農業(yè)研究中心植物學家皮埃爾-邦尼特認為,為標本做大數(shù)據(jù)集已經成為可能。他們的團隊已經實現(xiàn)了植物識別的自動化。
研究人員借助智能手機應用程序現(xiàn)場拍攝標本,積累了數(shù)以百萬計的新鮮植物圖像,然后對1000多個物種、超過26萬份植物標本進行了掃描識別,采用先進算法的識別準確率高達80%。
邦尼特說,這樣驚人的結果往往讓植物學家擔心其學術領域被輕視?!暗祟惖膶iL永遠不會被消除,識別結果仍需要植物學家來檢驗正確與否?!?/p>
人工智能識別標本的方法,極大地減少了植物學家收集和識別標本的時間,還能幫助改進標本數(shù)據(jù)貧乏地區(qū)的植物鑒定水平,對生物多樣性豐富但植物標本較少的地區(qū)特別有用。
此外,這種方法還能讓研究人員對大數(shù)據(jù)進行額外的分析。一般而言,植物標本樣本中含有豐富的數(shù)據(jù)信息,例如采集時間和地點,采集時在開花還是在結果,以及花群密集特征等。由于一些樣本是幾個世紀以前的數(shù)據(jù),因此,可以幫助研究植物是如何適應氣候變化的。
美國賓夕法尼亞州立大學博士彼得-威爾夫說:“在自然歷史的進程中,這種方法預示著未來?!?/p>
植物學家似乎能從繁重的收集和識別標本的工作中解放出來了。如果研究結果穩(wěn)定,他們至少能夠省下80%的時間啊!要知道,世界各地的自然歷史博物館中的數(shù)字化標本越來越多,單一個數(shù)據(jù)庫就有超過1.5億張圖像。人工智能可以自動識別標本,這對植物學家來說當然不是威脅。畢竟,大部分鑒定工作枯燥又無聊,但又至關重要,人工智能在這些地方幫忙,真是不能更貼心。開一個腦洞,如果科學家能把那些繁瑣又不得不做的都交給人工智能,科學產出會不會更加豐富?
本文版權歸黑馬程序員Python培訓學院所有,歡迎轉載,轉載請注明作者出處。謝謝!
作者:黑馬程序員Python培訓學院
首發(fā):http://m.3rdspacecomics.com/news/python.html