提起賽博,通常會想到“賽博朋克”。
其實(shí),賽博朋克(英文:Cyberpunk)是“賽博”與“朋克”的結(jié)合詞。在英語中,賽博這個(gè)詞脫胎于Cybernetics(中文:自動控制論),起源于希臘語 kubernetes,意思是導(dǎo)航員、駕駛員。
而在科幻小說的范疇中,“賽博”廣義上涵蓋了這些主題:機(jī)器人、自動化、計(jì)算機(jī)、智能等等。如果進(jìn)一步縮窄“賽博”的范圍,我們可以發(fā)現(xiàn)這個(gè)詞最常用于指代“人工智能的創(chuàng)建”。
在現(xiàn)實(shí)生活中,AI的本質(zhì)就是生產(chǎn)力。而易道博識創(chuàng)立的初心,就是借助人工智能,來簡化復(fù)雜枯燥的工作。
我們在“賽博”這個(gè)詞上,傾注了許多我們美好的期許:我們希望并且相信,科技充當(dāng)?shù)慕巧粌H是一個(gè)簡單的技術(shù)提供者,我們希望不僅能授人以魚,還能授人以漁,我們希望能讓用戶擁有一個(gè)可以自主可控、成本可控的、可現(xiàn)場應(yīng)用的平臺產(chǎn)品。
我們知道,開發(fā)一項(xiàng)人工智能模型并上線應(yīng)用大致需經(jīng)歷從業(yè)務(wù)理解、數(shù)據(jù)采標(biāo)及處理、模型訓(xùn)練與測試到運(yùn)維監(jiān)控等一系列流程。?
過程中,不僅需要大量的AI算力、高質(zhì)量數(shù)據(jù)源,還需要AI應(yīng)用算法研發(fā)及AI技術(shù)人員的支持,但大部分中小企業(yè)用戶并不具備在“算力、數(shù)據(jù)、算法”三維度從0到1部署的能力,而財(cái)力雄厚的大型企業(yè)亦需高性價(jià)比的AI開發(fā)部署方案。
智能化轉(zhuǎn)型趨勢下,企業(yè)部署AI項(xiàng)目的需求正經(jīng)歷著變化,對數(shù)據(jù)質(zhì)量、模型生產(chǎn)周期、模型自學(xué)習(xí)水平、模型部署方式、人力成本及資金投入、投資回報(bào)率等的要求都逐步走高。
假如,每次開發(fā)模型都需要算法工程師單獨(dú)完成從生產(chǎn)到上線的全流程招建,就會導(dǎo)取很多時(shí)間的耗損與AI模型開發(fā)成本的浪費(fèi)。所以集標(biāo)注、訓(xùn)練、推理于一體的賽博(CyberBot)深度學(xué)習(xí)平臺應(yīng)運(yùn)而生。
數(shù)據(jù)閉環(huán),自成有機(jī)整體
賽博學(xué)習(xí)平臺是易道博識基于深度學(xué)習(xí)自主研發(fā)的一站式機(jī)器學(xué)習(xí)訓(xùn)練平臺。賽博平臺集數(shù)據(jù)管理、數(shù)據(jù)標(biāo)注、模型訓(xùn)練和模型應(yīng)用于一身,提供及時(shí)、現(xiàn)場化的數(shù)據(jù)驅(qū)動模型應(yīng)用解決方案。
賽博平臺充分利用現(xiàn)有的經(jīng)過長期迭代的基礎(chǔ)模型能力,包括圖像、OCR和NLP等,在少量樣本的驅(qū)動下,利用遷移學(xué)習(xí)和小樣本學(xué)習(xí)等技術(shù),高效完成增量模型的訓(xùn)練,生成最優(yōu)的模型文件,并通過推理平臺實(shí)現(xiàn)模型的快速部署與生產(chǎn)應(yīng)用。
產(chǎn)品組成上,賽博平臺由管理中心CyberCenter、數(shù)據(jù)標(biāo)注平臺 CyberData、深度學(xué)習(xí)訓(xùn)練平臺 CyberLearning和深度學(xué)習(xí)推理平臺 CyberServing幾個(gè)子平臺組成,各子平臺依次承擔(dān)平臺管理、數(shù)據(jù)管理與標(biāo)注、模型訓(xùn)練和模型服務(wù)的功能,各個(gè)子平臺之間相互獨(dú)立又有效配合,形成一個(gè)有機(jī)整體,從而有效支撐數(shù)據(jù)驅(qū)動模型應(yīng)用的整體功能。
賽博平臺設(shè)計(jì)中充分考慮并兼顧了企業(yè)應(yīng)用的綜合性復(fù)雜場景以及C端客戶相對單一的場景。通過對各種應(yīng)用場景的深入研究與有效融合,以及先進(jìn)的架構(gòu)設(shè)計(jì)和技術(shù)選型,平臺最大化兼顧了專業(yè)性與易用性,從而在滿足各種應(yīng)用場景需求的前提下,提供最佳的用戶操作體驗(yàn)。
值得一提的是,賽博平臺打造了數(shù)據(jù)驅(qū)動模型應(yīng)用的閉環(huán)。推理平臺支持對于自身所產(chǎn)生的生產(chǎn)數(shù)據(jù)根據(jù)不同的條件進(jìn)行自動采集的功能,采集后的數(shù)據(jù)可以方便地導(dǎo)入標(biāo)注平臺,形成數(shù)據(jù)集,并支持進(jìn)一步的數(shù)據(jù)處理與標(biāo)注。標(biāo)注完成的數(shù)據(jù)集可以用于模型的訓(xùn)練調(diào)優(yōu),從而得到性能更佳的模型,用于更新推理平臺生產(chǎn)模型,從而形成一個(gè)完整的數(shù)據(jù)閉環(huán)。
數(shù)據(jù)標(biāo)注平臺 CyberData
數(shù)據(jù)平臺主要功能包括數(shù)據(jù)管理、數(shù)據(jù)處理、樣本擴(kuò)充、數(shù)據(jù)標(biāo)注與采集。數(shù)據(jù)平臺內(nèi)置exLabeler標(biāo)注客戶端,提供強(qiáng)大專業(yè)的CV、OCR、結(jié)構(gòu)化和NLP任務(wù)標(biāo)注功能。同時(shí),數(shù)據(jù)平臺還支持單人和團(tuán)隊(duì)標(biāo)注模式。
用戶可以通過exLabeler客戶端完成樣本的標(biāo)注。exLabeler支持CV、OCR、結(jié)構(gòu)化和NLP等領(lǐng)域算法的標(biāo)注。標(biāo)注完成的數(shù)據(jù)集可以直接用于模型訓(xùn)練,或進(jìn)一步做后處理(如圖像處理、樣本擴(kuò)充等),然后再用于模型訓(xùn)練。
深度學(xué)習(xí)訓(xùn)練平臺 CyberLearning
訓(xùn)練平臺通過自身對于訓(xùn)練資源池的集中管理與分配,以及與管理平臺的無縫對接,可以方便地實(shí)現(xiàn)訓(xùn)練基礎(chǔ)設(shè)施的管理,從而減輕用戶的管理維護(hù)工作。同時(shí),利用自動超參搜索等技術(shù),訓(xùn)練平臺可以自動搜索到最佳性能的模型。
通過分布式訓(xùn)練與多框架支持,訓(xùn)練平臺可以最大化利用計(jì)算資源,加速模型訓(xùn)練。同時(shí),利用自動超參搜索等技術(shù),訓(xùn)練平臺可以自動搜索到最佳性能的模型。最后,對于訓(xùn)練所得的最優(yōu)模型,訓(xùn)練平臺支持一鍵部署到推理平臺,實(shí)現(xiàn)模型的快速應(yīng)用。
深度學(xué)習(xí)推理平臺 CyberServing
推理平臺主要完成各種識別功能的部署。業(yè)務(wù)系統(tǒng)通過調(diào)用推理平臺提供的RESTful API提交圖像并獲得識別結(jié)果。整體上講,推理平臺產(chǎn)品需求可分解為模型管理、API過程定義、識別數(shù)據(jù)查看,接口統(tǒng)計(jì)和其它非功能項(xiàng)等部分。其中模型管理和API管理模塊屬于基礎(chǔ)核心模塊。
推理平臺對同一模型不同版本的管理,并支持在模型服務(wù)中同時(shí)加載和運(yùn)行多個(gè)版本的模型。推理平臺還支持一個(gè)API綁定多個(gè)模型服務(wù)。模型升級時(shí),用戶可以選擇先在部分服務(wù)中激活新版本的模型,完成測試驗(yàn)證后再升級其他服務(wù)。