為了自動(dòng)從科學(xué)論文中捕獲重要數(shù)據(jù),美國(guó)國(guó)家標(biāo)準(zhǔn)技術(shù)研究院(NIST)的計(jì)算機(jī)科學(xué)家開(kāi)發(fā)了一種方法,可以在圖像數(shù)據(jù)中包含的密集,低質(zhì)量繪圖中準(zhǔn)確檢測(cè)小的幾何對(duì)象,例如三角形。NIST模型采用旨在檢測(cè)模式的神經(jīng)網(wǎng)絡(luò)方法,在現(xiàn)代生活中具有許多可能的應(yīng)用。
NIST的神經(jīng)網(wǎng)絡(luò)模型在一組定義的測(cè)試圖像中捕獲了97%的對(duì)象,并將對(duì)象的中心定位在手動(dòng)選擇位置的幾個(gè)像素內(nèi)。
NIST的計(jì)算機(jī)科學(xué)家Adele Peskin解釋說(shuō):“該項(xiàng)目的目的是恢復(fù)期刊文章中丟失的數(shù)據(jù)。” “但是,小型密集物體檢測(cè)的研究還有很多其他應(yīng)用。物體檢測(cè)被廣泛用于圖像分析,自動(dòng)駕駛汽車(chē),機(jī)器檢查等領(lǐng)域,而小型密集物體的檢測(cè)尤其困難。找到并分開(kāi)。”
研究人員從NIST的熱力學(xué)研究中心(TRC)的金屬特性數(shù)據(jù)庫(kù)中獲取了可追溯到1900年代初的期刊文章的數(shù)據(jù)。通常,結(jié)果僅以圖形格式顯示,有時(shí)是手工繪制,而由于掃描或影印而退化。研究人員希望提取數(shù)據(jù)點(diǎn)的位置,以恢復(fù)原始的原始數(shù)據(jù),以進(jìn)行進(jìn)一步的分析。到目前為止,這些數(shù)據(jù)都是手動(dòng)提取的。
圖像為數(shù)據(jù)點(diǎn)提供了各種不同的標(biāo)記,主要是圓形,三角形和正方形(實(shí)心和實(shí)心),具有不同的大小和清晰度。這種幾何標(biāo)記通常用于標(biāo)記科學(xué)圖中的數(shù)據(jù)。在訓(xùn)練神經(jīng)網(wǎng)絡(luò)之前,使用圖形編輯軟件從文本的子集中手動(dòng)刪除了可能會(huì)錯(cuò)誤地顯示為數(shù)據(jù)點(diǎn)的文本,數(shù)字和其他符號(hào)。
由于多種原因,準(zhǔn)確檢測(cè)和定位數(shù)據(jù)標(biāo)記是一個(gè)挑戰(zhàn)。標(biāo)記的清晰度和確切形狀不一致;它們可能是開(kāi)放的或充滿的,有時(shí)是模糊的或失真的。例如,某些圓形看起來(lái)非常圓形,而其他圓形則沒(méi)有足夠的像素來(lái)完全定義其形狀。另外,許多圖像包含非常密集的重疊圓,正方形和三角形的補(bǔ)丁。
研究人員試圖創(chuàng)建一種網(wǎng)絡(luò)模型,以至少與手動(dòng)檢測(cè)一樣準(zhǔn)確地識(shí)別出繪圖點(diǎn)-在繪圖實(shí)際位置的五個(gè)像素之內(nèi),每側(cè)大小為數(shù)千個(gè)像素。
如一篇新的期刊論文所述,NIST研究人員采用了最初由德國(guó)研究人員開(kāi)發(fā)的用于分析生物醫(yī)學(xué)圖像的網(wǎng)絡(luò)架構(gòu),稱為U-Net。首先縮小圖像尺寸以減少空間信息,然后添加要素和上下文信息層以建立精確的高分辨率結(jié)果。
為了幫助訓(xùn)練網(wǎng)絡(luò)對(duì)標(biāo)記形狀進(jìn)行分類并確定其中心,研究人員嘗試了四種使用蒙版標(biāo)記訓(xùn)練數(shù)據(jù)的方法,即為每個(gè)幾何對(duì)象使用不同大小的中心標(biāo)記和輪廓。
研究人員發(fā)現(xiàn),向蒙版添加更多信息(例如,更粗的輪廓)可以提高對(duì)物體形狀進(jìn)行分類的準(zhǔn)確性,但可以降低在圖中確定其位置的準(zhǔn)確性。最后,研究人員結(jié)合了幾種模型的最佳方面,以獲得最佳分類和最小的位置誤差。事實(shí)證明,更改掩碼是提高網(wǎng)絡(luò)性能的最佳方法,它比其他方法(例如在網(wǎng)絡(luò)末端進(jìn)行小的更改)更有效。
網(wǎng)絡(luò)的最佳性能-定位對(duì)象中心的精度達(dá)到97%-僅對(duì)于圖像點(diǎn)的子集是可能的,在這些圖像中,繪圖點(diǎn)最初由非常清晰的圓形,三角形和正方形表示。對(duì)于TRC而言,其性能足夠好,可以使用神經(jīng)網(wǎng)絡(luò)從較新的期刊論文中從圖中恢復(fù)數(shù)據(jù)。
盡管NIST研究人員目前沒(méi)有后續(xù)研究計(jì)劃,但神經(jīng)網(wǎng)絡(luò)模型 “絕對(duì)”可以應(yīng)用于其他圖像分析問(wèn)題,Peskin說(shuō)。