受訪嘉賓:達觀數據高級運營經理孫亞彬
采訪記者:界面記者
文字整理:陳昕媛
記者:達觀數據的定位是?
孫亞彬:我們達觀數據是一家專門做文本智能處理的一家公司,我們所有的產品包括我們的技術,都是以文本處理為核心的,像我們目前接觸到的一些行業里面的客戶也是因為他們企業內部存在大量的文本數據,他們沒有辦法來去挖掘其中的價值,就會找到像我們這樣的公司,由我們來給他提供一整套的系統,來幫助他進行文本數據的挖掘,從而可以幫助他們簡化整個工作的流程,提高他們整體運營效率。
記者:那您能不能具體舉一下例子,你們現在主要服務哪些行業?哪些企業?
孫亞彬:我們現在大部分服務的行業集中在金融、銀行、保險、法律等等,您可以看到其實像這些企業來說,他們有一個特點,就是他們會招聘大量的人員來從事文檔資料審核的工作,舉個例子來說,我們有一個客戶,他在成都建立了一個數據服務中心,招聘了大概有1000名左右的本科畢業生,去幫助他來進行公司內部的文檔校對和審閱工作。我們為他提供了一套文檔智能審閱系統以后,可以幫助他大大節約這樣的人力。我們都知道文本校對其實是一個比較機械化的工作,需要人肉眼不斷地去看,不斷地去校對,而且一份文檔大部分都會有1000頁以上。
對于人來說,不僅是效率比較低,同時也經常會出現一些錯誤,我們的系統等于是會自動化地把校對審閱的工作幫他解決掉,把其中的一些關鍵信息提取出來,我們的客戶只要把我們提取出來的一小部分的信息再重新進行校對整理就可以了,大大地節約了客戶的人力成本以及時間成本。
記者:能否請您介紹一下公司在獲得A輪融資之后,主要做了哪些方面的布局?在2017年公司有哪些業務上的亮點?
孫亞彬:我們達觀數據是一家以技術驅動為核心的公司,我們公司的技術研發人員也占到了60%以上,所以在進行A輪融資以后,我們也花了大量的精力在研發人員招募上。我們雖然是一家創業公司,但實際上我們對于技術人員的要求來說還是比較嚴苛的,因為技術是我們最核心的點,所以我們是希望能夠招募到更多的技術性人才來到我們的公司,來幫助我們夯實自身的技術實力。在2017年我們也逐漸發現在傳統的大型企業里面,有大量的文本處理需求,所以我們也針對這些傳統大型企業,有一系列的新的產品,比方說合同智能審閱系統,因為大企業里面有大量的合同文檔,這一類來說我們能夠幫他解決。
第二塊是我們的人才智能搜索平臺,因為對于一些大型企業來說,本身內部就有可能有幾十萬人,本身在自己內部招聘體系下面會有大量的需求,我們提供了一套整體的智能人才搜索平臺給我們客戶。
記者:能否透露一下公司在人員規模上,技術是公司的核心,現在規模人數有多少?
孫亞彬:我們現在差不多已經將近100人,在今年2018年也會招募更多的技術人才,因為我們現在越來越多的大型企業,是有私有化部署需求,所以我們也會在客戶現場進行更多的項目人員實施。所以技術人才的需求還是比較多的。
記者:那您覺得2018年達觀數據主要有哪些布局?
孫亞彬:2018年大家都知道現在是一個人工智能的時代,大家都在喊用機器代替人,我們的話也是,對于我們公司來說,其實最核心的根本是讓機器代替人,當然并不是說完全取代人,我們更多地是取代一些人去做機械化的工作,讓人騰出更多的時間去進行一些更加富有創造性的工作。所以我們更多地在今年會與更多的傳統以勞動力密集的企業,跟他們有更深入的合作,來幫助他們做這樣的一個傳統行業進行到人工智能企業的轉型。像我們很多客戶,他們都說每個部門都在強調AI,我們也是希望通過達觀數據AI技術,去幫助我們這些傳統的客戶進行轉型。
記者:我也很好奇,你剛剛說為各種不同的企業做轉型,具體到項目實施的過程當中,達觀是怎么樣去給這些客戶做個性化定制服務的呢?
孫亞彬:是這樣的,在人工智能行業里面,我們經常說的是叫一秒鐘原則,所謂的一秒鐘原則就是說我們人在一秒鐘之類可以進行判斷的事情,比方說我看到你,我知道我認不認識你,知道你是男是女,你是長發短發,或者是我們去看車牌,我能一秒鐘把車牌號碼報出來等等,類似這樣的。我們叫做一秒鐘原則,就是說只要是人在一秒鐘能完成的事情,我們都能夠通過機械,通過系統計算機去代替人來完成。像現在行業里面很多做計算機視覺的,語音識別的和圖象識別的等等,我們其實是專注于在做文本識別的這一塊,像我剛才跟您提到的,像合同,還是說我們法院里面有這樣的法律文書,或者說我們在企業招聘的內部每個人簡歷還是崗位描述等等,其實每一個都是跟文字相關的。
所以說我們的這項技術其實是可以運用到企業只要有文字出現的地方,我們都可以去運用。這邊再舉一個例子來說,其實我們大家都知道,以前每個公司都會有自己的客服部門,我們客服部門都是通過人工去接電話,或者說網上各種的客戶評論等等,當他們需要對你某一個推出的產品進行市場反饋的時候,也可能是去收集我們的客服人員主觀上的感受。通過達觀這邊,我們就可以把這些所有某個產品在市場上所有的客戶聲音收集過來,無論是語音的,還是文字的,最后都能轉化成文本數據。通過我們這些數據進行分析,從這些數據里面挖掘出市場對具體某一塊產品的真實反饋,我們再把這些反饋的結果反饋給我們的客戶,這種是更加客觀性,更加全面地來做這樣的客戶評論分析。
比過去只是通過人工去進行統計效果會更好,所以說我們更多地是聚焦于企業內部的文本數據,只要有文本的數據,我們都可以把它轉化成這樣的可行產品來服務于我們的企業。
記者:知道大數據其實也是一個風口行業,包括像國內外的一些互聯網巨頭,其實也都是在布局,國內也是有不少創業公司不斷地在涌現,您覺得行業在未來2-3年內,還有怎樣的挑戰和機遇呢?作為一個業內人士。
孫亞彬:我覺得目前來說,其實人工智能這一塊還是有很多的機會,現在可能大家面向于對于每一個普通的用戶來說,其實我們能看到有做無人駕駛的也好,還是人臉識別也好,還有交互的智能機器人也好,其實我們更多的是C端用戶能夠感受到的,而實際上在背后其實還有很多企業服務級的應用產品,這一片會有很多的未來,有這樣的獨角獸公司涌現出來,他們可能對于現在普通的用戶來說,可能感受不到,但是對于我們這種面向to B的企業來說,發現企業中有迫切要實現的需求。就像我剛才前面跟您提到的,所有的傳統企業都在希望自己從勞動型密集的企業轉化成一家更加智能化的公司,那我覺得這塊在未來有更多的機會。