售前電話
135-3656-7657
售前電話 : 135-3656-7657
近年來,計算機視覺領域的優(yōu)秀算法層出不窮,以下?lián)褚喗檠芯渴褂玫囊恍┠P汀?/p>
(1)VGG
2014年,牛津大學計算機視覺組和谷歌公司的研究員聯(lián)合研發(fā)出一種新的深度卷積神經(jīng)網(wǎng)絡,即VGGNet,并獲得當年ILSVRC分類比賽的亞軍。VGGNet分為VGG16和VGG19:VGG16通過13層3×3的卷積網(wǎng)絡和3層全連接網(wǎng)絡構(gòu)建,VGG19則通過16層3×3的卷積網(wǎng)絡和3層全連接網(wǎng)絡構(gòu)建。VGG19被廣泛應用于不同行業(yè)的圖像特征提取領域。
(2)Resnet
深度殘差網(wǎng)絡(Residual Network, ResNet)是過去幾年中計算機視覺領域頗具開創(chuàng)性的工作。因其強大的表征能力,除圖像分類以外,包括目標檢測和人臉識別在內(nèi)的許多計算機視覺應用都得到了性能提升。ResNet101是其中的一種網(wǎng)絡堆疊方式,101層網(wǎng)絡指齊總的卷積或全連接層數(shù)目。
(3)SIFT
尺度不變特征轉(zhuǎn)換(Scale-invariant feature transform,SIFT)是一種用來偵測與描述影像局部性特征的重要算法,由 David Lowe在1999年所發(fā)表,并于2004年總結(jié)完善。SIFT算法主要用于處理兩幅圖像之間發(fā)生平移、旋轉(zhuǎn)、仿射變換情況下的匹配問題。
(4)Mask R-CNN
Mask R-CNN是華人學者何愷明提出的一種簡潔、靈活的圖像實例分割框架,用于判斷圖像中不同目標的類別和位置,并可做出像素級預測。該算法不僅能夠有效地檢測圖像中的目標,而且還能為每個實例生成一個高質(zhì)量的分割掩碼。