成人午夜激情影院,小视频免费在线观看,国产精品夜夜嗨,欧美日韩精品一区二区在线播放

諦聽機器人:專研語義,讓機器人獲得智慧

2016-05-10 10:36:06來源:1號機器人網作者:

諦聽機器人CEO彭軍輝說:“在語義理解上,諦聽機器人采用的方法有所區別,是通過句法分析,分析句子里每個詞之間的相互關系,讓機器人能更準確的理解語義。”

對機器人是否智能包含很多因素,但是對普通消費者而言,機器人是否智能取決于語音交互。

語音交互包含“語音”與“語義”,這兩大難題目前一直困擾著機器人企業。

很多機器人企業反應,語音與語義在實驗室里測試很好,但是一旦應用到市場,結果就很不理想。

以目前的語音與語義技術,只能在特定的場景下,才能實現流暢的人機交互。

諦聽機器人CEO 彭軍輝
諦聽機器人CEO 彭軍輝

北京諦聽機器人科技有限公司(以下簡稱:諦聽機器人)CEO彭軍輝說:“在語義理解上,諦聽機器人采用的方法有所區別,是通過句法分析,分析句子里每個詞之間的相互關系,讓機器人能更準確的理解語義。”

雖然市面上已有不少語義處理企業,而且各有所長,但技術進步很快,比我們想象中的要快很多,相信過不了多久時間,語音與語義將會有質的突破。

記者:服務機器人是否智能取決于語音與語義,你們的語義目前已經研究到什么程度?可否舉個例子說明,它目前能做到什么場景的語義理解?

彭軍輝:服務機器人目前最大的瓶頸是對自然語言語義的理解。所謂機器人,核心在于智能,不在硬件。服務機器人如果不能很好的理解用戶的意圖,就無法滿足用戶的需求。

人和機器人的交互,語音是唯一合理的方式。語音識別現在已經做的很好了,但語音識別只能把語音信號轉換成文字的信號,機器人未必能理解文字包含的語義。這就是我們語義理解要做好的事情。

語義理解,其實就是機器人的大腦,它決定了機器人的智力水平。語義理解水平高的公司,就能做出高智能的機器人,相反,就只能做出來一些傻乎乎的家伙。

而我們的開放平臺不是機器學習算法,不是簡單的關鍵字處理,我們是句法分析,分析句子里每個詞之間的相互關系,讓機器人能更準確的理解語義。

我們把語言放在一個環境當中,分析每一句話所處的場景,比如:“漂亮!”,如果沒有場景,這句話無法準確理解到底是贊美一個姑娘,還是足球場上的一次漂亮射門。如果加上“看到漂亮姑娘”或“看足球”,這個“漂亮!”,語義就明確了。

我們分析了句子結構,詞的特征,包括口語和同義詞,讓機器人更好的理解上下文。還有對“的、地、得、著、了、過”的處理,讓機器人對語義的理解更加細膩。

記者:你們在語義領域做了多久了?是什么因素促使你進入到這個領域?

彭軍輝:我在語義領域做了十多年,現在能查到我最早發在網上的文章是2002年,當時主要是出于個人的興趣愛好,讓我走進了這個領域。

當初五筆字型輸入法還很流行,那時我只是想做一個更加理解人的輸入法,讓漢字輸入變得簡單。不管是字形輸入法還是拼音輸入法,一個代碼都會產生很多漢字,需要用戶在菜單中做出選擇。

比如:“hanzi”到底代表“漢字”、“漢子”、“汗漬”,還是“韓資”,必須要用戶去人工選擇。

我是學歷史教育的,大學中文語法也是主修課,我發現如果從語法規則出發,把詞放在句子當中,根據上下文的搭配關系,就能比較準確的確定“hanzi”到底代表“漢字”、“漢子”、“汗漬”,還是“韓資”。

于是我就開始專注于這方面的研究,經過數年積累,我發明了一套漢語智能拼音文字,它自身有很強的邏輯性。比如:你把“牛吃草”用漢語智能拼音文字寫成“草吃牛”,機器一樣可以立即成“牛吃草”。

它可以作為輸入法的中間代碼,應用于拼音輸入法。這樣的輸入法,將會很少產生需要用戶去選擇,但是當時我還不懂,也沒有經濟實力支撐我去做一個輸入法程序。

為了把輸入法程序做出來,我成立了一家公司,給別人做企業網站積累人才和資金。但當時招聘的開發人員只能開發網站,開發不了輸入法。

后來看到MSN機器人,發現我們做聊天機器人還是存在優勢的,于是我們開發了最早的聊天機器人“柳柳”,當時用ASP+ACCESS做的。

雖然我們在語義理解方面有些優勢,但在系統搭建上差太遠了,機器人反應速度很慢,而且還有很多BUG。后來幾年,這個程序我們不斷完善,也在這個過程中,我慢慢學會了編程。

記者:國內專門做語義的企業也很多,你們的語義理解與他們是否存在差異?或者說你們的優勢在哪里?

彭軍輝:我們的競爭對手多數是從高校NLP專業科班出身的,他們采用的語義理解技術基本上對數學依賴較高,他們算詞頻和概率,處理的對象是文字。

我們處理的對象是語義,所以我們要先處理同義詞、口語等,一句話只有放在一個場景和背景下,語義才能明確。

所以我們是先去分析場景和背景,再去處理上下文和省略語,甚至可以讓機器人自己進行推理判斷。根據現有知識推導出新知識。

從效果上看,我們的對話過程更自然流暢。

記者:目前語義理解的技術瓶頸是哪些?

彭軍輝:現在很多公司用機器學習或者神經網絡做語義處理,但是機器學習或者神經網絡并不是一項自然語言處理技術,他們可以用在很多方面,比如:圖像識別、語音識別等領域。

所有做語義處理的公司都不得不自己手動寫一些規則,可以說不用機器學習和神經網絡照樣可以做語義處理,但是不用規則,語義處理就沒法去做。

現在很多公司覺得上下文處理是難點,都期望能在這里取得突破。

但是自然語言處理有分詞、詞性處理、句法分析等基礎技術,如果這些都做不好,上下文處理必然做不好。

記者:你認為目前市面上做的最好的語義公司是哪家?他們的語義理解已經到達什么程度?可否舉個例子描述一下場景?

彭軍輝:目前我們看到的語義處理公司大多數都是用機器學習在做,從我們的角度去看,他們做的還是比較粗糙的,自認為我們的技術處于行業領先。

我們提出里語義處理四個標準:

第一個標準是同一性,就是語義相同的句子要能歸并處理。比如:“你今年多大了”和“你今年幾歲”就是一個意思,完全可以歸并處理。

第二個標準是差異性,就是語義之間的細微差異要能區分開。比如:“老張的貓是我送的”和“我給老張送的是貓”;“我要睡了你”和“我要睡了,你呢”,這些都是相同的語句,但是兩個意思,要有區分。

第三個標準是一致性,就是機器人說出來的話要前后一致,不能自相矛盾。不能前面說“我是男生”,后面說“我是女生”。

第四個標準是容錯性,就是要能準確理解用戶意圖,不能就字面處理,要能容錯。比如:用戶肚子餓了,輸入“我額了”,機器人應該能理解成“我餓了”。

目前這四個原則,還沒有公司能達到。我們正在努力,在不久之后可以全部達到。

記者:你認為機器人像人一樣自由的交流,還需要多久的時間能實現?目前是哪些因素阻礙著朝這方向發展?

彭軍輝:人和人能自由的交流,是因為交流的對象都是高度智慧的。一個正常人與傻子交流一樣很困難。只有當機器人擁有正常人的智慧,人和機器人的交流才能真正自由順暢起來。

這個也許是未來五年或者十年就能完成的事情。

解決這個問題的唯一機會就在于讓機器人真正理解人類語言。在我們看來,語言就是智慧本身,只要理解了人類語言,機器人才可能擁有人類的智慧。

而語義理解技術就是機器人理解人類語言的基礎技術。

記者:做語義理解的門檻有多高?如果一家企業想進入這個行業?他需要付出多大的成本?這些成本包括哪些?

彭軍輝:這個行業進入很容易,要做好很難。

做語義理解需要兩個東西,一個是算法,一個是知識庫。

算法目前有一些開源的東西可以用,但如果用開源的東西,做出來的必然沒什么特色,也就沒有什么價值。如果自己從事基礎研究,需要花費大量的時間。

不管是微軟、谷歌、百度,還是小i機器人等都已經在語義理解行業積累了十多年。單純做算法,從頭開始,就算快也得三五年時間。

知識庫建設需要大量服務器資源,需要大量的數據,也需要大量的時間。

對于新進入者,還不如依靠大的平臺去做,目前我們也在打造一個語義理解開發平臺,讓機器人企業使用語義的門檻和成本大幅降低。

記者:根據你的判斷,你覺得目前國內語義行業現狀如何?這行業未來兩年它的市場空間會有多大?

彭軍輝:自然語言處理行業,國外與國內幾乎沒有什么差距。NLP發源于西方,國內引進后應用于中文處理。后來新興的技術如:機器學習、神經網絡、知識圖譜技術等都是引用開源的軟件。

雖然大多數是西方發明的,但國內很快就應用起來了。隨著機器人行業的發展,目前市場對自然語言處理的需求是非常強烈和迫切的。機器人需要更加自然流暢的人機交互過程。

但傳統自然語言處理技術在人機交互的流暢性上有缺陷,上下文處理能力明顯不足。

我們通過小范圍試用后,在人機交互流暢性上的表現比較有優勢,所以在這方面,我們是行業領先的。

未來機器人普及是必然的趨勢,也為我們帶來了良好的發展機遇。據預測,未來幾十年后,機器人的數量將會超過人類的數量。

記者:最后一個問題,談談未來三年你們的發展規劃?

彭軍輝:我們目前在開發一個機器人開放平臺,讓每個企業可以建立自己的問答機器人。企業給機器人增加知識就像寫微博那樣簡單。

我們期望未來三年,我們平臺的企業用戶數能達到1000萬以上。為此,我們將會不斷升級我們的技術,讓機器人對用戶語義的理解更加準確,讓人機交互的過程更加自然流暢,讓我們的機器人能為客戶解決更多的問題。

關鍵詞:機器人
主站蜘蛛池模板: 湘乡市| 黄平县| 丹棱县| 沭阳县| 胶南市| 迭部县| 建湖县| 郧西县| 游戏| 宣汉县| 莎车县| 菏泽市| 西华县| 大余县| 徐州市| 五河县| 呼玛县| 天气| 曲阳县| 星座| 施秉县| 内丘县| 麻栗坡县| 承德县| 阿克陶县| 武汉市| 布尔津县| 博客| 新化县| 上犹县| 大兴区| 贵州省| 佛冈县| 宜昌市| 修水县| 应城市| 平塘县| 建昌县| 德江县| 明光市| 烟台市|