2016年,AlphaGo對人類頂尖圍棋手的無差別“虐殺”,又一次引發(fā)了大眾對AI技術(shù)的關(guān)注和恐懼。
在大部分人都熱衷于討論AI技術(shù)是否會真的全方位超越人類,進(jìn)而對人類產(chǎn)生重大威脅時(shí),有一群人卻因?yàn)榭吹狡浔澈笸黄菩缘臋C(jī)器學(xué)習(xí)技術(shù)而深感興奮。
在他們看來,AI機(jī)器威脅到人類還是一個(gè)遙不可及的未來,眼下最重要的是如何把AI變成“新工人”,來幫助人類解決那些遲遲沒有找到好方案的問題。
產(chǎn)品檢測就是這樣一個(gè)急切需要新技術(shù)的老問題。
盡管企業(yè)很早就利用工業(yè)相機(jī)等數(shù)據(jù)采集設(shè)備對產(chǎn)品實(shí)施檢測,但是采集到的數(shù)據(jù)還是要通過人工識別和判定,效率低不說,質(zhì)量穩(wěn)定性也難以保證。
機(jī)器學(xué)習(xí)算法的突破,提供了一種可能性,就是基于過往積累的數(shù)據(jù)訓(xùn)練AI模型,然后讓其自主判定產(chǎn)線相關(guān)檢測數(shù)據(jù),進(jìn)而克服人工判定的低效與高錯(cuò)誤率等問題。
由此,傳統(tǒng)制造業(yè)向智能化轉(zhuǎn)型升級的大門,借由AI+機(jī)器視覺開啟了一道縫隙,讓遙遠(yuǎn)的光亮照了進(jìn)來,讓行業(yè)前進(jìn)的道路逐漸明朗了起來。
時(shí)隔6年多后,機(jī)器視覺這項(xiàng)技術(shù)發(fā)展到了什么程度?相關(guān)企業(yè)利用AI技術(shù)如何打造自己機(jī)器視覺產(chǎn)品的獨(dú)特性?并如何實(shí)現(xiàn)商業(yè)落地?在這個(gè)過程中,又會遭遇怎樣的阻礙?透過機(jī)器視覺的發(fā)展,能夠給我們看待AI賦能傳統(tǒng)制造業(yè)的轉(zhuǎn)型升級提供怎樣的啟發(fā)?
為了尋求上述問題的答案,智次方·物聯(lián)網(wǎng)智庫分別采訪了格創(chuàng)東智科技有限公司AOI產(chǎn)品商務(wù)負(fù)責(zé)人江淵總和菲特(天津)檢測技術(shù)有限公司研發(fā)總監(jiān)陳立名總,通過與兩位長期浸淫在戰(zhàn)斗最前線的專家的深度交流,盡可能全面地了解機(jī)器視覺技術(shù)的發(fā)展路徑,并在此基礎(chǔ)上管窺智能制造的發(fā)展現(xiàn)狀和方向。
根據(jù)美國自動成像協(xié)會(AIA)的定義:機(jī)器視覺(Machine Vision)是一種應(yīng)用于工業(yè)和非工業(yè)領(lǐng)域的硬件和軟件組合,它基于捕獲并處理的圖像為設(shè)備執(zhí)行其功能提供操作指導(dǎo)。
機(jī)器視覺可以分為成像和圖像處理分析兩大部分:成像依賴于機(jī)器視覺系統(tǒng)的硬件組件,如光源、光源控制器、鏡頭和相機(jī);圖像處理分析則是在成像基礎(chǔ)上,通過視覺控制系統(tǒng)進(jìn)行的。
機(jī)器視覺系統(tǒng)的核心功能包括:識別、測量、定位和檢測。
上述功能的難度是逐次遞增的,因此,生產(chǎn)檢測也是最能展現(xiàn)機(jī)器視覺“功力”的領(lǐng)域之一。
2023年12月12日,工信部聯(lián)合發(fā)改委和金融監(jiān)管總局發(fā)布了《制造業(yè)卓越質(zhì)量工程實(shí)施意見》通知。
通知中強(qiáng)調(diào),質(zhì)量是制造業(yè)的生命線,卓越的質(zhì)量是高端制造的準(zhǔn)則,推動產(chǎn)業(yè)從數(shù)量擴(kuò)張向質(zhì)量提升是新時(shí)期制造業(yè)高質(zhì)量發(fā)展的現(xiàn)實(shí)需要,追求卓越質(zhì)量是制造業(yè)由大變強(qiáng)的必由之路。
在這一定位下,通知中提出要推進(jìn)質(zhì)量保障數(shù)字化……推動企業(yè)加強(qiáng)試驗(yàn)驗(yàn)證、檢驗(yàn)檢測數(shù)字化和智能化,深化機(jī)器視覺、人工智能等技術(shù)應(yīng)用,提高質(zhì)量檢驗(yàn)檢測的效率、覆蓋率和準(zhǔn)確性。
在這樣一個(gè)背景下再看機(jī)器視覺技術(shù),其重要性不言而喻。
目前,機(jī)器視覺技術(shù)已經(jīng)廣泛應(yīng)用于消費(fèi)電子、汽車制造、半導(dǎo)體、光伏等領(lǐng)域,且市場規(guī)模在不斷擴(kuò)大。
據(jù)Markets and Markets統(tǒng)計(jì)和預(yù)測,2021年全球機(jī)器視覺市場規(guī)模為804億元,2025年有望達(dá)到1276億元。根據(jù)高工機(jī)器人產(chǎn)業(yè)研究所數(shù)據(jù),2021年中國機(jī)器視覺市場規(guī)模達(dá)到138.16億元,到2025年我國機(jī)器視覺市場規(guī)模將達(dá)到469億元,2021-2025年復(fù)合增速達(dá)到36%。前瞻產(chǎn)業(yè)研究院預(yù)測,至2028年,中國機(jī)器視覺行業(yè)市場規(guī)模將達(dá)到億837元。
格創(chuàng)東智科技有限公司和菲特(天津)檢測技術(shù)有限公司自2017年起,各自開啟了AI+機(jī)器視覺的創(chuàng)新之旅。雖然兩家企業(yè)從不同的地點(diǎn)出發(fā),經(jīng)歷了截然不同的探索過程,但從更宏觀的技術(shù)發(fā)展視角來看,卻又給人一種殊途同歸的感覺。
接下來,我們將分別進(jìn)行介紹。
2018年,格創(chuàng)東智由TCL孵化而出。帶著TCL在解決特定問題上積累的數(shù)字化能力,并以此為基礎(chǔ)發(fā)展出一系列相關(guān)產(chǎn)品和解決方案。
這樣的企業(yè)具備一個(gè)天然優(yōu)勢,就是擁有深厚的行業(yè)Know-How,不同于一些AI企業(yè)是帶著技術(shù)去找場景和客戶,他們本身就是具體場景孕育的結(jié)果,所以甫一降生,就帶有很好的理解場景和客戶需求的基因。
格創(chuàng)東智的機(jī)器視覺檢測方案——天樞AI視覺檢測系統(tǒng)是其工業(yè)智能解決方案中的一個(gè)細(xì)小分支,源自TCL華星的半導(dǎo)體生產(chǎn)檢測。
據(jù)江淵介紹,面板生產(chǎn)過程的每一個(gè)關(guān)鍵制程都需要AOI(自動光學(xué)檢測)設(shè)備拍攝圖片,進(jìn)而識別相關(guān)缺陷。早期通過人工進(jìn)行缺陷分類,只有分類好了,才能知道下一步該怎么處理。整個(gè)流程有一百多個(gè)制程,需要大量的人工去做每一個(gè)關(guān)鍵制程。
2017年,機(jī)器視覺技術(shù)興起后,TCL華星內(nèi)部開發(fā)了AI視覺檢測系統(tǒng),基于人工智能技術(shù)進(jìn)行圖片的識別分類。
方案實(shí)施后,首先是大幅提升了檢測效率,能夠代替百分之八九十的檢測人員,一天可以檢測將近三百多萬張圖片。其次是提升了檢測精度,因?yàn)槟軌蛴行П苊馊藛T易疲勞、人與人之間的認(rèn)知差異等問題。
此后,隨著技術(shù)成熟度的提升,格創(chuàng)東智的機(jī)器視覺方案逐步從半導(dǎo)體行業(yè)外溢,目前已經(jīng)成功賦能光伏、3C電子、家電、石油石化、航空航天等22個(gè)細(xì)分行業(yè)。
AI模型是如何賦能生產(chǎn)制造的?
從采訪中我們也了解到,AI賦能機(jī)器視覺檢測的過程,經(jīng)歷了一個(gè)從小模型到大模型,再到“小模型”的路徑。
初期,格創(chuàng)東智先結(jié)合深厚的行業(yè)數(shù)據(jù)積累和對特定工業(yè)場景及檢測指標(biāo)的深入理解,再融合機(jī)器學(xué)習(xí)算法,構(gòu)筑了針對特定檢測場景的小模型。
小模型的構(gòu)建旨在緊密匹配特定的業(yè)務(wù)場景和需求,強(qiáng)調(diào)的是針對性和高適應(yīng)性。通過專注和定制化的開發(fā)過程,小模型能夠在滿足行業(yè)特定需求的同時(shí),提高操作效率和決策質(zhì)量。
但是,小模型存在過擬合的風(fēng)險(xiǎn),即模型太過專注于訓(xùn)練數(shù)據(jù)集中的細(xì)節(jié)和噪聲,以至于它在新的、未見過的數(shù)據(jù)上表現(xiàn)得不好。這使得其落地前提是必須對數(shù)據(jù)進(jìn)行規(guī)范化和標(biāo)準(zhǔn)化,使得數(shù)據(jù)分布和比例達(dá)到最佳狀態(tài)。模型的開發(fā)和調(diào)優(yōu)需要專業(yè)人員的參與,要求他們既熟悉AI技術(shù),也了解行業(yè)專業(yè)背景知識。
而很多客戶企業(yè)并沒有這樣的人才儲備。
2022年,大模型技術(shù)的突破給上述問題的解決帶來了希望。
相比于小模型,大模型有更強(qiáng)的兼容性和穩(wěn)定性。大模型的設(shè)計(jì)不受數(shù)據(jù)復(fù)雜性的限制,無需對場景理解過于深入,只需足夠多的數(shù)據(jù)進(jìn)行訓(xùn)練,無需過多的參數(shù)調(diào)整或架構(gòu)設(shè)計(jì)。在更加簡便地處理各種類型的數(shù)據(jù)的同時(shí),還不會出現(xiàn)過擬合的現(xiàn)象。
概言之,大模型的出現(xiàn)可以大幅降低模型落地的門檻。
長期思索于如何將機(jī)器視覺系統(tǒng)變得更好、更容易落地的格創(chuàng)東智積極響應(yīng)大模型的技術(shù)潮流,基于已有的大量數(shù)據(jù)和小模型來訓(xùn)練和開發(fā)自己的大模型。
但是要直接把大模型落地在客戶側(cè)又存在新的問題,就是在實(shí)時(shí)工業(yè)場景中推理需求的高資源消耗與成本壓力難以滿足連續(xù)快速檢測與生產(chǎn)流程的無縫對接。
格創(chuàng)東智的解決辦法是,先在內(nèi)部訓(xùn)練大模型,而后再針對特定場景進(jìn)行“模型瘦身”。這樣做的好處是,利用大模型進(jìn)行學(xué)習(xí)和提取特征,可以更高效地訓(xùn)練出小模型,訓(xùn)練過程中所需的數(shù)據(jù)量也大幅減少,使得模型的落地應(yīng)用變得更加便捷和可行。
此外,江淵也介紹到,為了提高產(chǎn)品交付性,他們的天樞AI視覺檢測系統(tǒng)還開發(fā)了可視化功能,通過將模型開發(fā)過程簡化為直觀的拖拉拽操作,使得非AI專家的普通IT人員也能輕松開發(fā)和優(yōu)化AI模型。
客戶可以從一系列預(yù)設(shè)的子模型和算法中選擇,通過簡單的操作將它們組合起來,構(gòu)建出滿足特定需求的模型,無需深入了解背后復(fù)雜的算法細(xì)節(jié)。
這樣一來,很多客戶企業(yè)無需額外投入巨大的人力成本,就可以享用到最新的機(jī)器視覺技術(shù)的賦能。
這種時(shí)刻從客戶場景入手,不斷在產(chǎn)品落地和交付性方面死磕的精神,正是格創(chuàng)東智這種從具體場景中孕育而出的企業(yè)最大的特點(diǎn),也是他們的最大優(yōu)勢。
不同于格創(chuàng)東智的機(jī)器視覺檢測方案,是在一個(gè)大的工業(yè)智能解決方案基座上延伸出來的一個(gè)枝節(jié)。
成立于2013年的菲特(天津)檢測技術(shù)有限公司則是從檢測這個(gè)點(diǎn)出發(fā),在產(chǎn)業(yè)實(shí)踐過程中不斷積累和豐富技術(shù)經(jīng)驗(yàn),逐漸衍生出新的能力,從質(zhì)量智能逐步到工廠智能,進(jìn)而在更為廣泛的工業(yè)智能中發(fā)光發(fā)熱。
*重點(diǎn)“專精特新”小巨人的稱號,便是對其十年磨一劍最好的肯定。
筆者曾在文章中提到過,專精特新企業(yè)的目的不在于主導(dǎo)市場,讓自己成為家喻戶曉的知名企業(yè),而是更加關(guān)注小生態(tài)位的主導(dǎo)權(quán)。通過產(chǎn)品創(chuàng)新和深耕市場,構(gòu)筑具有絕對優(yōu)勢的競爭壁壘,讓自己成為某個(gè)產(chǎn)業(yè)鏈中必不可少的基本要素。
概言之,如果一家企業(yè)掛上了“專精特新”的牌子,那也意味著在其耕耘的領(lǐng)域,他已經(jīng)具備了相當(dāng)深厚的積累和話語權(quán)。
從陳立名的介紹中我們了解到,菲特也積極抓住了2017年的機(jī)器學(xué)習(xí)浪潮,著手于將此前已經(jīng)積累的大量數(shù)據(jù)用于模型訓(xùn)練,這些模型專門針對質(zhì)量檢測領(lǐng)域的需求,滿足特定行業(yè)檢測標(biāo)準(zhǔn)的同時(shí)實(shí)現(xiàn)最大化的成本控制。
在后續(xù)的發(fā)展中,菲特嘗試將AI技術(shù)應(yīng)用于更多的工業(yè)場景,最后形成了四個(gè)主要的應(yīng)用方向:生產(chǎn)智能、質(zhì)量智能、物流智能、安全智能。
這四大領(lǐng)域覆蓋了從生產(chǎn)前端到后端的全過程,先后為整車、零部件、化紡、醫(yī)藥、軍工、泛工業(yè)等領(lǐng)域內(nèi)的眾多全球知名企業(yè)提供了整體智能制造解決方案,真正為客戶企業(yè)實(shí)現(xiàn)提質(zhì)增效。
一條獨(dú)特的研發(fā)路徑:技術(shù)-中臺-產(chǎn)品
陳立名提到,為了支撐上述四大業(yè)務(wù)領(lǐng)域的發(fā)展,菲特采用了分層研發(fā)策略,包括核心技術(shù)層、標(biāo)準(zhǔn)化技術(shù)的中臺層和產(chǎn)品層。
核心技術(shù)層是企業(yè)為未來五年的技術(shù)儲備而進(jìn)行的頂級研發(fā)工作。這一層面的研發(fā)活動集中在創(chuàng)新和拓展技術(shù)邊界,比如2D和3D測量技術(shù)等,其目的是要實(shí)現(xiàn)在線級(即落地到實(shí)際的生產(chǎn)線上)微米級別的精確度。
標(biāo)準(zhǔn)化技術(shù)的中臺層是指通過匯總標(biāo)準(zhǔn)化、模塊化的工具和技術(shù),形成中臺能力,以應(yīng)對多變的工業(yè)場景和定制化生產(chǎn)需求。這一層面的研發(fā)旨在實(shí)現(xiàn)技術(shù)的可復(fù)用性和靈活性,以便快速適應(yīng)市場和客戶需求的變化。
產(chǎn)品層指的是具體的產(chǎn)品開發(fā),包括檢測設(shè)備和監(jiān)控系統(tǒng)等,直接面向市場和客戶。力圖將先進(jìn)的技術(shù)應(yīng)用到具體的產(chǎn)品設(shè)計(jì)和功能實(shí)現(xiàn)中,使其成為看得見摸得著的成果。
大模型技術(shù)浪潮興起后,菲特也積極響應(yīng)新趨勢。
陳立名提到,對于大模型的發(fā)展,他們有一個(gè)長期的規(guī)劃,主要集中在兩個(gè)方向:
首先,利用大語言模型改進(jìn)數(shù)字化系統(tǒng)的交互方式,從傳統(tǒng)的表單和流程,轉(zhuǎn)向更直觀、更人性化的交互模式。既包含人與人之間的交互,也涉及知識檢索和沉淀,特別是將原本沉淀在個(gè)人或零散文件中的行業(yè)Know-How,通過大模型技術(shù)進(jìn)行整理和可檢索化,以便更有效地復(fù)用。
其次,菲特也開始了多模態(tài)大模型的開發(fā)和應(yīng)用。通過結(jié)合傳統(tǒng)的圖像數(shù)據(jù)和文本數(shù)據(jù),實(shí)現(xiàn)不同數(shù)據(jù)類型的綜合利用,以此來更好地沉淀行業(yè)數(shù)據(jù)。
對談下來,筆者能夠感覺到,菲特對自己的核心要求體現(xiàn)在,他們始終想著如何利用AI技術(shù)去幫助客戶企業(yè)將他們已經(jīng)擁有的數(shù)據(jù)資源和行業(yè)能力充分利用起來,以此為目標(biāo)讓自己向著國內(nèi)領(lǐng)先的智能制造整體解決方案提供商邁進(jìn)。
通過與兩位技術(shù)專家的對談,我們也對機(jī)器視覺的交付方式和商業(yè)模式有了更為深入地了解。
江淵提到,格創(chuàng)東智向客戶交付的機(jī)器視覺檢測系統(tǒng)主要涉及三大塊內(nèi)容:硬件、數(shù)據(jù)算法和后續(xù)服務(wù)。
硬件部分主要包括光學(xué)采集設(shè)備和系統(tǒng)設(shè)備,這些設(shè)備在檢測過程中起著重要作用。數(shù)據(jù)算法與系統(tǒng)集成在一起,提供給客戶的是一個(gè)整合的系統(tǒng),客戶可以在此基礎(chǔ)上進(jìn)行使用和操作。后續(xù)服務(wù)通常包括數(shù)據(jù)算法的優(yōu)化、調(diào)試以及系統(tǒng)的維護(hù)和更新等,以確保系統(tǒng)的長期穩(wěn)定運(yùn)行。
據(jù)江淵介紹,他們與客戶的商務(wù)合作模式主要分為兩類:買斷和訂閱。
買斷指客戶一次性購買系統(tǒng)和硬件,之后自行管理,遇到問題再與服務(wù)商聯(lián)系。訂閱則是客戶購買硬件設(shè)備,并訂閱公司提供的服務(wù)。
商務(wù)模式的選擇與客戶企業(yè)的規(guī)模和需求有關(guān)。對于規(guī)模較大、產(chǎn)品類型繁多的企業(yè),可能更傾向于買斷模式,以滿足不斷變化的需求。而對于小型企業(yè),可能更傾向于訂閱模式,以降低成本并獲得專業(yè)的服務(wù)支持。
類似的,陳立名介紹到,目前菲特的交付模式主要有三種類型,分別是全套服務(wù)交付模式、軟件算法服務(wù)交付模式和標(biāo)準(zhǔn)化產(chǎn)品交付模式。
全套服務(wù)交付模式提供了一個(gè)全面的解決方案,包括軟件和硬件的整合。公司承擔(dān)從項(xiàng)目開始到完成的所有工作,類似“交鑰匙”工程,即客戶從開始到結(jié)束不需要擔(dān)心任何細(xì)節(jié)問題。
軟件算法服務(wù)交付模式下,公司專注于提供軟件算法方面的服務(wù),而不涉及任何硬件設(shè)備。公司的服務(wù)主要是賦能客戶現(xiàn)有的設(shè)備,比如制造設(shè)備或質(zhì)檢設(shè)備,通過提供高級的軟件算法來優(yōu)化客戶的操作流程。
與前兩種定制化服務(wù)不同,標(biāo)準(zhǔn)化產(chǎn)品交付模式下,公司提供的是成品解決方案,即直接銷售標(biāo)準(zhǔn)化的產(chǎn)品給客戶。交付過程通常包括現(xiàn)場安裝和調(diào)試,而所有的后續(xù)配合和適配工作則由客戶自己或公司的渠道伙伴來完成。
通盤來看,AI+機(jī)器視覺帶給企業(yè)的好處是顯而易見的,但這并不意味著相關(guān)方案的落地就會水到渠成。在采訪中,兩位專家也提到了他們在產(chǎn)品推進(jìn)過程中的一些阻礙以及相對應(yīng)的策略。
首先,他們面臨的最大的問題是所有2B企業(yè)都繞不開的問題,即如何給客戶算清楚投入產(chǎn)出比這筆帳,只有讓客戶在數(shù)據(jù)上看到機(jī)器視覺方案帶來的顯著收益,他們才愿意在前期投入巨大的成本來引進(jìn)。這需要方案提供商想辦法建立標(biāo)桿案例,提高行業(yè)認(rèn)知度,也讓客戶更加理解和信任新技術(shù)的價(jià)值。
其次,很多企業(yè)的相關(guān)人員對新技術(shù)的認(rèn)知存在一定的局限性,把新技術(shù)當(dāng)成了許愿池和百寶箱,期望引進(jìn)相關(guān)技術(shù)方案后,能夠一下子解決自己公司面臨的所有的問題。面對這一情況,服務(wù)商能夠做的就是不斷溝通和解釋,讓客戶對新技術(shù)的認(rèn)知更加清晰和明確,意識到相關(guān)技術(shù)的可為和不可為。
此外,數(shù)據(jù)保密問題也是一個(gè)比較大的阻礙。一些關(guān)鍵數(shù)據(jù),客戶企業(yè)一方面是不愿意分享給服務(wù)商,這就無法讓他們的AI模型發(fā)揮作用。一些愿意分享的,也會要求相關(guān)開發(fā)工作必須在客戶現(xiàn)場進(jìn)行,這又容易出現(xiàn)算力和工程師資源不足等問題。
最后,就是檢測指標(biāo)的問題。客戶的期待是,既然都上AI了,那是不是能夠做到零漏檢和零缺陷,這在當(dāng)前也很難實(shí)現(xiàn)。一方面是故障指標(biāo)難以形成一個(gè)標(biāo)準(zhǔn)化的共識,另一方面就是質(zhì)量問題與整個(gè)生產(chǎn)流程相關(guān),無法通過檢測環(huán)節(jié)去解決所有問題。
總體而言,機(jī)器視覺方案的推進(jìn)難度主要體現(xiàn)在客戶認(rèn)知顆粒度的對齊上,需要服務(wù)商不斷與客戶方溝通和交流,并通過標(biāo)桿案例等方式,解決客戶認(rèn)知上的偏差和客戶期望與實(shí)際情況的落差。
通過了解機(jī)器視覺的發(fā)展境況,可以讓我們對AI的影響力和落地形式有一個(gè)更為直觀和具象的了解。它來得并不像技術(shù)狂熱派所宣揚(yáng)的那么迅猛和摧枯拉朽,也不像保守者所認(rèn)為的那樣一無是處,只是炒作和概念。
AI技術(shù)帶來的改變正在一點(diǎn)一滴地發(fā)生著,帶給我們新希望的同時(shí)也伴隨著種種待解決的問題。與此同時(shí),技術(shù)起作用的關(guān)鍵,從不在于旁觀者如何言說,而是依賴于那些始終思考著如何利用新技術(shù)去解決老問題的實(shí)踐者。
違法和不良信息舉報(bào)投訴電話:0377-62377728 舉報(bào)郵箱:fbypt@ex12580.com
網(wǎng)絡(luò)警察提醒你 a> 中國互聯(lián)網(wǎng)舉報(bào)中心 網(wǎng)絡(luò)舉報(bào)APP下載 掃黃打非網(wǎng)舉報(bào)專區(qū)