專屬客服號(hào)
微信訂閱號(hào)
全面提升數(shù)據(jù)價(jià)值
賦能業(yè)務(wù)提質(zhì)增效
摘要:隨著智能化生活方式的推進(jìn),服務(wù)機(jī)器人的發(fā)展更加迅猛。服務(wù)機(jī)器人的應(yīng)用場(chǎng)景和服務(wù)模式正不斷拓展,相應(yīng)的核心技術(shù)模塊取得了重大突破, 市場(chǎng)形勢(shì)大好。
當(dāng)前,國(guó)內(nèi)服務(wù)機(jī)器人行業(yè)的發(fā)展還處于初級(jí)階段,大部分的產(chǎn)品處于研發(fā)試驗(yàn)階段,而投入使用并實(shí)現(xiàn)產(chǎn)業(yè)化的服務(wù)機(jī)器人產(chǎn)品還較少。2016年,國(guó)內(nèi)服務(wù)機(jī)器人的市場(chǎng)規(guī)模達(dá)到38.8億元,預(yù)計(jì)2018年國(guó)內(nèi)服務(wù)機(jī)器人銷售額將近60億元,達(dá)到59.6億元。
由于服務(wù)機(jī)器人應(yīng)用場(chǎng)景和模式不斷地拓展,因此服務(wù)機(jī)器人涉及到了語(yǔ)音和語(yǔ)義分析、圖像識(shí)別、動(dòng)作捕捉等多個(gè)維度的交互,應(yīng)用場(chǎng)景的多元化決定了多模態(tài)交互屬性,而想要達(dá)到人機(jī)融合,則需要突破語(yǔ)音模塊、語(yǔ)義模塊、圖像模塊、感知模塊等核心技術(shù)。當(dāng)前國(guó)內(nèi)服務(wù)機(jī)器人在控制系統(tǒng)、感知模塊、語(yǔ)音模塊上取得了顯著的突破,但在語(yǔ)義和圖像識(shí)別上還有待提升突破。
操作系統(tǒng):國(guó)產(chǎn)系統(tǒng)孕育而生
目前全球服務(wù)機(jī)器人的主流操作系統(tǒng)是安卓和ROS,二者占據(jù)了整個(gè)市場(chǎng)的絕大多數(shù)份額,可以說(shuō)該領(lǐng)域長(zhǎng)期被國(guó)外公司把持,可喜的是,近期國(guó)內(nèi)服務(wù)機(jī)器人的國(guó)產(chǎn)操作系統(tǒng)Turing OS、優(yōu)必選的ROSA系統(tǒng)取得了重大突破。Turing OS是國(guó)內(nèi)首批機(jī)器人操作系統(tǒng)之一,具備了情感和思維能力的機(jī)器人操作系統(tǒng),未來(lái)的商業(yè)前景非常廣闊。其擁有情感、思維、自學(xué)習(xí)三大引擎,支持多種情感識(shí)別,準(zhǔn)確率達(dá)95.1%,而在情感表達(dá)方面,支持468類情感語(yǔ)言表達(dá),能夠讓機(jī)器人模擬人類80%的情感表達(dá)模式;優(yōu)必選公司研發(fā)的ROSA機(jī)器人操作能實(shí)現(xiàn)語(yǔ)音操控、機(jī)器視覺(jué)、運(yùn)動(dòng)控制、情緒表達(dá)等功能,目前操作系統(tǒng)ROSA已經(jīng)在優(yōu)必選的新一代服務(wù)機(jī)器人的產(chǎn)品開發(fā)中全面使用,應(yīng)用于近50萬(wàn)臺(tái)機(jī)器人產(chǎn)品中。
感知模塊:傳感器各有優(yōu)劣,多傳感融合彌補(bǔ)不足
環(huán)境感知是服務(wù)機(jī)器人實(shí)現(xiàn)智能化交互所要具備的能力。由于服務(wù)機(jī)器人的應(yīng)用場(chǎng)景廣泛且較為復(fù)雜,要實(shí)現(xiàn)精準(zhǔn)服務(wù),需要結(jié)合定位信息來(lái)對(duì)環(huán)境進(jìn)行識(shí)別。當(dāng)前,大部分移動(dòng)式智能裝備多采用攝像頭、激光雷達(dá)、毫米波雷達(dá)等傳感器組合來(lái)實(shí)現(xiàn)移動(dòng)。
攝像頭是目前唯一能夠辨別物體的傳感器,但是過(guò)于依賴算法、對(duì)于行人識(shí)別不穩(wěn)定且在逆光或光影復(fù)雜的地方難以使用;激光雷達(dá)可以將定位的精度控制在0.01-0.1米,并且可以獲得精確地圖。目前主流的前沿機(jī)器人已經(jīng)裝備了激光雷達(dá)模塊,可以實(shí)時(shí)識(shí)別周圍環(huán)境的情況,測(cè)量周邊物體與障礙物的距離,但是在惡劣天氣的環(huán)境下,激光雷達(dá)的使用效果會(huì)受到影響。此時(shí),測(cè)量距離遠(yuǎn)但無(wú)法探測(cè)行人的毫米波雷達(dá)就能夠彌補(bǔ)激光雷達(dá)的短板。
總體來(lái)說(shuō),不同的傳感器各具特點(diǎn),能夠滿足不同的功能,需要相互搭配組合使用。多傳感融合將是未來(lái)的服務(wù)機(jī)器人感知模塊應(yīng)用的大趨勢(shì)。而激光雷達(dá)在國(guó)內(nèi)的研發(fā)與生產(chǎn)僅僅是剛起步,當(dāng)前國(guó)內(nèi)僅有思嵐科技、鐳神智能等公司在進(jìn)行激光雷達(dá)的研發(fā)生產(chǎn)。
語(yǔ)音識(shí)別達(dá)商用,語(yǔ)義識(shí)別需提升,圖像識(shí)別為其交互形成補(bǔ)充
在語(yǔ)音識(shí)別方面,自動(dòng)語(yǔ)音識(shí)別經(jīng)歷了規(guī)則到統(tǒng)計(jì)再到深度學(xué)習(xí)的歷程,識(shí)別能力越來(lái)越強(qiáng)。當(dāng)前自動(dòng)語(yǔ)音識(shí)別的錯(cuò)誤率已經(jīng)達(dá)到了商用標(biāo)準(zhǔn)。在公認(rèn)的語(yǔ)音識(shí)別錯(cuò)誤率中,人類的為4%,國(guó)際上第一大語(yǔ)音公司Nuance為10%,而目前的商用為15%。在國(guó)內(nèi)語(yǔ)音實(shí)力最強(qiáng)的科大訊飛也達(dá)到了15%,特別是在針對(duì)中文部分中的方言也已經(jīng)達(dá)到了實(shí)用門檻。
在語(yǔ)義識(shí)別方面,語(yǔ)義識(shí)別當(dāng)前僅僅只處在淺層上的處理。在自然語(yǔ)言處理中的詞法(分詞、詞性標(biāo)注的理解)與句法(內(nèi)部詞語(yǔ)之間的搭配修飾關(guān)系)基本上已經(jīng)得到了解決,而詞義消歧是自然語(yǔ)言處理所面臨的難點(diǎn),用什么形式來(lái)理解句子并表達(dá)真實(shí)的語(yǔ)義,需要依靠深度學(xué)習(xí)來(lái)解決這個(gè)難點(diǎn),具體在詞嵌入、基礎(chǔ)模型和應(yīng)用三個(gè)方面。
在圖像識(shí)別方面,借助于圖像識(shí)別技術(shù),能夠通過(guò)圖片搜索來(lái)快速的獲取信息,節(jié)省了對(duì)圖像的文字描述的時(shí)間,從而能夠產(chǎn)生一種新的與外界交互的方式。雖然圖像識(shí)別的準(zhǔn)確率不斷提高,但在自然條件下的表現(xiàn)仍無(wú)法滿足商用的要求。圖像識(shí)別技術(shù)的突破依舊需要深度學(xué)習(xí),來(lái)提高計(jì)算能力。
結(jié)語(yǔ)
隨著國(guó)內(nèi)服務(wù)機(jī)器人市場(chǎng)規(guī)模的逐漸擴(kuò)大,國(guó)內(nèi)企業(yè)加大了在服務(wù)機(jī)器人的部分核心技術(shù)上研發(fā)力度。在語(yǔ)音識(shí)別上,技術(shù)研發(fā)達(dá)到了國(guó)際水平;在感知識(shí)別上,采用多傳感融合彌補(bǔ)不足;在操作系統(tǒng)上,優(yōu)必選取得了技術(shù)突破,研發(fā)的ROSA系統(tǒng)成為了大規(guī)模商用的機(jī)器人操作系統(tǒng)。目前國(guó)產(chǎn)服務(wù)機(jī)器人雖有部分核心技術(shù)取得了突破,但是在語(yǔ)義識(shí)別與圖像識(shí)別方面,仍需依靠深度學(xué)習(xí)來(lái)取得更大突破。
本文為我公司原創(chuàng),歡迎轉(zhuǎn)載,轉(zhuǎn)載請(qǐng)標(biāo)明出處,違者必究!
請(qǐng)完善以下信息,我們的顧問(wèn)會(huì)在1個(gè)工作日內(nèi)與您聯(lián)系,為您安排產(chǎn)品定制服務(wù)
評(píng)論