首頁 / 科技 / 正文

    對話科大訊飛胡郁:新增超100項AI能力,AI助手打電話早於谷歌

    智東西(公眾號:zhidxcom) 文 | 寓揚

    智東西5月17日消息,今天,科大訊飛在深圳發布4款新品:AIUI語音交互平台3.0、魔飛麥克風2.0、AIoT物聯網平台、iFLY OS物聯網操作系統。

    AIUI語音開放平台本次3.0升級新增了文字識別、醫療聽寫等能力,將在今年年底提供超過200項能力,新增AI能力超100項。魔飛麥克風新增分布式、能量跟隨和聲紋喚醒的新功能。而AIoT和iFLY OS則是科大訊飛面向物聯網領域首次發布的新品。

    訊飛還亮出了新的成績單,開放平台開發者數量已經達到80萬,每天移動端使用語音次數達45億次,電視每日語音交互次數超過2600萬,智能音箱日交互次數達4000萬等。此外,訊飛還整合語音識別、語音喚醒、語義理解、語音合成技術,將系統級解決方案免費開放。

    對話科大訊飛胡郁:新增超100項AI能力,AI助手打電話早於谷歌

    (左為科大訊飛執行總裁、消費者BG總裁胡郁;右為消費者BG執行總裁於繼棟)

    會後,科大訊飛執行總裁、消費者BG總裁胡郁、消費者BG執行總裁於繼棟接受了智東西等媒體的採訪,他們告訴智東西通過魔飛麥克風開發者可以將過去半年的開發在幾個小時內實現,並且通過AIoT和iFLY OS操作系統,幫助開發者打通產品開發的各個環節。

    一、發布四款新品

    在發布新品前,科大訊飛先簡單幹脆的秀了一下肌肉,展示近期取得的一些成果。消費者BG執行總裁於繼棟分享到,2017年訊飛開放平台開發者的數量達到51.2萬,而2018年如今已經達到80萬,其中開發者主要集中在教育、通訊、機器人及智能硬件領域,其中教育類開發者占到20%。

    對話科大訊飛胡郁:新增超100項AI能力,AI助手打電話早於谷歌

    下面又是一串科大訊飛語音交互在不同設備的日活成績單:每天移動端使用訊飛語音次數達45億次,電視每日語音交互次數超過2600萬,智能音箱日交互次數達4000萬,車載日交互次數達2000萬次,商用機器人日交互次數超300萬次。相比2017年,2018年訊飛在學習、社交、智能硬件、商務辦公、生活服務等領域實現了超100%的增長。

    秀完肌肉後,科大訊飛發布了4款產品:AIUI語音交互平台3.0、魔飛麥克風2.0、AIoT物聯網平台、iFLY OS物聯網操作系統。

    1、AIUI語音交互平台3.0

    對話科大訊飛胡郁:新增超100項AI能力,AI助手打電話早於谷歌

    其中,AIUI語音交互平台升級到3.0,新增了文字識別和醫療聽寫能力。在文字識別方面,訊飛的手寫識別準確率達97%,印刷文字識別準確率97%,數學公式識別達93%等。

    胡郁後來也補充到,AIUI平台將在今年年底提供超過200項能力,新增AI能力超100項。為了讓開發者更好的使用AI能力,科大訊飛還與商湯科技、碼隆科技、小牛翻譯等AI技術公司合作,進行技術的組合和封裝。

    2、魔飛麥克風2.0

    對話科大訊飛胡郁:新增超100項AI能力,AI助手打電話早於谷歌

    去年科大訊飛發布了魔飛麥克風,開發者可以在其基礎上進行開發, 也可以通過它與家電設備相連來實現智能化。今天魔飛麥克風升級為2.0,對回聲消除、功耗等進行了優化,還添加了分布式、能量跟隨、聲紋喚醒等新功能。

    所謂的分布式功能,就是在一個局域網內放置多個魔飛麥克風,在與用戶的交互過程中,距離用戶最近的魔飛會被喚醒,這一點雷軍也在小米mini音箱中介紹過。

    能量跟隨則與波束形成技術有關,之前當你喚醒智能音箱時,麥克風陣列會對一個方向形成波束,從而更好的獲取某個方向的聲音。魔飛麥克風升級後,這個波束形成可以跟隨用戶發出聲音的位置進行動態的調節,就像能量跟隨一樣。

    而聲紋喚醒也是此次魔飛麥克風新增的一個功能,讓設備可以聞聲識人,科大訊飛也會把相關接口開放給開發者。

    3、AIoT物聯網平台、iFLY OS物聯網操作系統

    對話科大訊飛胡郁:新增超100項AI能力,AI助手打電話早於谷歌

    於繼棟稱,過去18個月使用訊飛AI能力的終端數已經達到了近20億的數量,值得注意的是過去兩年時間,非手機類智能終端的比例已經從1%提升到7.6%,這是一個非常可觀的量。以智能家居、智能穿戴設備、機器人、安防監控等為代表的物聯網設備近期呈現井噴之態,科大訊飛也對物聯網領域開始重視,並推出AIoT物聯網平台。

    AIoT分為兩部分,一部分是雲端,訊飛提供開放的語音交互平台,聚合的內容、廣告生態,以及AI的能力;在終端提供本地計算等。

    至於iFLY OS物聯網操作系統會如何布局,會後智東西也把這個問題拋給了胡郁,他解釋到,這是出於更好的打通開發者在產品開發過程中各個環節面臨的障礙,通過OS物聯網系統,將設備需要的各種底層系統打透,能夠讓開發者更自由的開發。他也稱這是第一次發布OS系統,後期會公布更多細節。

    二、魔飛2.0、AIUI3.0、AIoT落地語音交互場景

    為了更好的理解魔飛2.0、AIUI3.0、AIoT三者之間的關係,科大訊飛產品經理也以掌勺科技運用AIUI3.0和AIoT推出的魔櫥為例進行示範,魔櫥看上去像廚房中的一塊平板,將魔飛麥克風與平板相結合,接入訊飛AIoT後,魔櫥就具有了遠場語音交互的能力,它可以連接不同的設備,並調用。此外,魔櫥還加入了手勢識別,人臉進行交互,滿足廚房場景的交互。

    對話科大訊飛胡郁:新增超100項AI能力,AI助手打電話早於谷歌

    於繼東還提到,訊飛將WiFi協議與語音打通,通過一個麥克風模塊,就可以對現有WiFi類設備進行改造,實現語音交互,讓所有WiFi設備都用上AIUI平台。

    此外,AIUI今天的一項重要更新在於開發者開發速度的提升。於繼東告訴智東西,過去開發者需要花半年來整合訊飛的能力,而現在可以基於魔飛麥克風進行開發,魔飛就就相當於一個開源硬件,開發組件的一部分,有了魔飛麥克風就相當於把硬件開發變成了軟件開發,使開發者真的可以在幾個小時做出一個Demo應用來。

    三、基於視覺的語音交互是未來發展方向

    新品發布後,胡郁圍繞未來的發展態勢主要談了三方面內容:

    對話科大訊飛胡郁:新增超100項AI能力,AI助手打電話早於谷歌

    首先,他回應了外界對科大訊飛盈利能力不行的質疑,他稱訊飛每年要投入數以億計的資源到開發者平台,赤字來自開放平台。

    第二, 他認為基於視覺呈現的語音交互是未來的發展方向,人類獲取信息80%依賴眼睛,但人類90%的信息輸出依靠語言,並且移動場景、車載場景、家庭場景都是自然語言交互的重要場景。

    前幾天在谷歌I/O大會上,谷歌發布了AI助手打電話功能,他稱訊飛幾年前就實現了,並在各大運營商的客服中使用。

    第三,系統創新+產品創新。胡郁公布了2017年技術投入增長超61%,技術研發團隊增長56%,訊飛擅長的是源頭核心技術的創新,並不斷擴展平台能力,降低創新門檻,由開發者來做產品創新和應用創新。

    結語:重點在於加快行業落地

    通過今天科大訊飛AIUI的3.0升級我們可以看到,一方面在百度等語音技術公司的競爭下,科大訊飛也在加快技術整合與開放,今年開放的能力將達到200項。

    另一方面,科大訊飛通過整合AIUI、魔飛麥克風、AIoT、iFLY OS系統,更加注重對物聯網終端的重視,以及通過關鍵技術以及系統的整合,降低開發者門檻,加快行業落地。

    本文是智東西(zhidxcom)原創稿件,轉載聯繫微信:zhidx_com,未經許可,謝絕轉載。

    相關推薦