韩国三级高清手机在线版-韩国三级电影久久-韩国三级hd中文字幕一男多女-韩国三级hd中文字幕久久精品-日本精品在线视频-日本精品在线观看视频

因?yàn)樾湃危院唵巍?/p>

深圳小程序開發(fā)|深圳APP開發(fā)|微信小程序開發(fā)|小程序軟件開發(fā)|抖音小程序開發(fā)

本文是我從2019年1月底接手CRO線NLP算法團(tuán)隊(duì)以來,在團(tuán)隊(duì)組建、能力建設(shè)、以及管理上的一些思考,全部是沒有科學(xué)論證的主觀判斷,不過都進(jìn)行了實(shí)踐。我沒有任何管理學(xué)背景知識,把拙見沒羞沒臊地寫出來,是為了拋磚引玉,和同學(xué)們交流討論。

團(tuán)隊(duì)的定位是什么?——做正確的事

定位

團(tuán)隊(duì)的定位是重要的事情之一,有了偏差,后續(xù)做得越多錯得越多。確定團(tuán)隊(duì)的定位花了我很長時間,中間還發(fā)生了一次組織變化,和兩任主管有多次討論。

首先,這個團(tuán)隊(duì)配置在CRO線,肯定要為風(fēng)險(xiǎn)管理業(yè)務(wù)服務(wù);同時,這又是一支能力團(tuán)隊(duì),還要考慮和業(yè)務(wù)團(tuán)隊(duì)的協(xié)同關(guān)系。最終,我確定了3點(diǎn):

1、能力建設(shè)為主,同時也需要有業(yè)務(wù)抓手;

2、不做業(yè)務(wù)團(tuán)隊(duì)已經(jīng)做得好的事情;

3、立志高遠(yuǎn),勇攀高峰,要做就做到最好。

壁壘與價(jià)值

不夸張地說,現(xiàn)在是NLP領(lǐng)域的大航海時代,新算法層出不窮,日新月異,后浪各種把前浪碾死在沙灘上。尤其是 BERT 橫空出世之后,整個 NLP 的研究范式都發(fā)生了變化,從原來的 task-specific 的模型結(jié)構(gòu)設(shè)計(jì)轉(zhuǎn)變到語言模型 pretrain+ 下游任務(wù) finetuning 的模式,預(yù)訓(xùn)練模型是含金量高的工作。研究一下預(yù)訓(xùn)練模型,你會發(fā)現(xiàn)這是個需要海量金錢+數(shù)據(jù)+技術(shù)才能玩的游戲。

這就陷入兩難:如果搞預(yù)訓(xùn)練模型,沒那么多資源;如果不搞,用開源模型做下游任務(wù),實(shí)際上很難有什么技術(shù)壁壘。其實(shí)就算你真的搞出什么新算法可以充當(dāng)技術(shù)壁壘,可能兩三個月之后就又有人做出了更強(qiáng)的結(jié)果。

困境的根源在于,目前 NLP 算法這個領(lǐng)域發(fā)展速度太快了,在高速變化的領(lǐng)域是很難形成壁壘的。所以,我們需要結(jié)合自身所處的環(huán)境,尋找變化不那么快的東西。

我經(jīng)過好多天的考慮之后,認(rèn)為沉淀風(fēng)險(xiǎn)管控知識可以作為壁壘。原因:1)風(fēng)險(xiǎn)知識隨時間有變化,但速度明顯比算法慢很多;2)CRO 線在這方面有一定積累,也需要用于實(shí)際業(yè)務(wù)管控,并沉淀到產(chǎn)品。

所以,團(tuán)隊(duì)的宗旨我定義為:基于知識驅(qū)動的 NLP 算法團(tuán)隊(duì)。為 CRO 線乃至集團(tuán)沉淀風(fēng)險(xiǎn)知識,并提供不同層次的服務(wù):

4層服務(wù)體系

最近,CRO 線在清華舉辦了 AI 與安全研討會,會上張鈸院士談到了第三代人工智能,尤其強(qiáng)調(diào)了其中知識的核心作用;我們走訪中科院信工所,對方的宗旨也是建設(shè)基于知識驅(qū)動的算法,和業(yè)界發(fā)生的共鳴,更堅(jiān)定了我們走這條道路的決心和信心。

團(tuán)隊(duì)需要什么能力?

先要搞清楚團(tuán)隊(duì)所處的環(huán)境。

阿里是一個什么結(jié)構(gòu)的組織?

有人說是矩陣式的,有人說是樹+網(wǎng)狀的,我不知道確切的答案。不過,如果把每個小團(tuán)隊(duì)看作節(jié)點(diǎn)的話,有 2 點(diǎn)是確定的:

1、體量巨大,各種節(jié)點(diǎn)(業(yè)務(wù)、產(chǎn)品、工程、算法)種類繁多數(shù)量大。

2、單元節(jié)點(diǎn)之間比較容易發(fā)生跨大團(tuán)隊(duì)甚至跨 BU 的聯(lián)系,條件合適可以發(fā)生協(xié)同關(guān)系。

繼續(xù)觀察,你會發(fā)現(xiàn):

1、你所需要的一切資源幾乎都能找到提供者,而且往往不止一個。

2、你也可以給各種需求節(jié)點(diǎn)提供服務(wù),只要還在你的能力范圍內(nèi)。

3、由于規(guī)模巨大,需求節(jié)點(diǎn)和資源節(jié)點(diǎn)相互之間往往不知道對方在哪。

基于以上,我認(rèn)為一個身處中臺的算法團(tuán)隊(duì),需要具備 4 項(xiàng)能力:連接-生產(chǎn)-傳播-服務(wù)。

能力中臺的算法團(tuán)隊(duì)需要具備的能力

四項(xiàng)能力

連接

就是尋找到自己所需要的資源,篩選出其中最優(yōu)的,建立長期穩(wěn)定的合作關(guān)系。比如算法團(tuán)隊(duì)需要的爬蟲、標(biāo)注工具、分布式模型訓(xùn)練工具、模型的評測工具等,都能在公司范圍內(nèi)獲取,就沒必要刀耕火種從頭開始自己建設(shè)了。

生產(chǎn)

這是傳統(tǒng)意義上算法工程師的工作,指獲取數(shù)據(jù)后產(chǎn)出效果和效率達(dá)標(biāo)的算法模型,并上線。

對算法的要求,主管的主管早有論述:算法要全!算法要強(qiáng)!算法要快!算法要便宜!精煉簡潔,振聾發(fā)聵,細(xì)化一下就有:

圖-對算法的要求

傳播

針對中臺的算法團(tuán)隊(duì)提的要求,因?yàn)槟阈枰屇繕?biāo)業(yè)務(wù)節(jié)點(diǎn)知道你的存在,知道你的能力項(xiàng),以及細(xì)節(jié)。ATA 是個不錯的對內(nèi)傳播途徑,之前在 CV 團(tuán)隊(duì)時,很多業(yè)務(wù)方是通過 ATA 找到我的。

服務(wù)

如果是專屬某業(yè)務(wù)的算法團(tuán)隊(duì),只需要考慮該業(yè)務(wù)下的 SLA 即可;如果是中臺的算法團(tuán)隊(duì),還需要考慮如何滿足不同業(yè)務(wù)節(jié)點(diǎn)的需求,同時又不至于做開發(fā)和維護(hù)成本很高的個性化定制,避免隨著接入業(yè)務(wù)的增長各種資源的開銷也隨著線性增長。

能力雷達(dá)圖

團(tuán)隊(duì)的能力雷達(dá)圖是由成員的個人能力長板組成的。(話越短意思越長)

圖-團(tuán)隊(duì)能力雷達(dá)圖

組織與個人的關(guān)系

為什么需要一個組織呢?

先從一個現(xiàn)象出發(fā):在小區(qū)業(yè)主和物業(yè)公司的糾紛斗爭中,業(yè)主獲勝的概率很低。從人數(shù)、個體的教育背景和素質(zhì)來看,業(yè)主都占據(jù)絕對優(yōu)勢,可是為什么會輸?

粗略分析,大體有三個原因:

1、共同利益,目標(biāo)明確。物業(yè)的目標(biāo)非常清晰,就是為了從業(yè)主那里賺錢,這也是物業(yè)人員的共同利益。業(yè)主人多,情況各有不同,各自的利益訴求差異大,容易被分化。

2、組織嚴(yán)密,相互協(xié)同。物業(yè)內(nèi)部有明確的分工,平時也長期一起工作,相互間有信任感,能夠進(jìn)行配合。業(yè)主彼此之間往往是陌生人,缺乏信任感,難以統(tǒng)一行動,是原子化的散點(diǎn)。

3、局部相對優(yōu)勢。相對單個業(yè)主,物業(yè)具有明顯力量優(yōu)勢。比如,物業(yè)有資金,而業(yè)主因?yàn)槿狈π湃魏茈y籌措資金。

好,看出來了,小規(guī)模組織的力量可以超過大規(guī)模原子化散點(diǎn)存在的個體集合的力量。

組織為個人提供什么?

1、組織能使資源增效組織能把各種資源組合成有機(jī)的整體,使各種分散的力量形成合力,從而產(chǎn)生大于這些資源和力量機(jī)械總和的效能。這個原理 2000 多年前亞里斯多德就論述過了,后來馬克思又更嚴(yán)密地論述過一次。

2、組織是實(shí)現(xiàn)目標(biāo)的依托

個人可以依托組織的能力和資源去做事,而組織的能力和資源遠(yuǎn)大于個人,所以依托組織的時候,個人能夠?qū)崿F(xiàn)比單打獨(dú)斗模式大得多的目標(biāo)。

舉個例子,我們團(tuán)隊(duì)做了 UGC 場景效果超越開源模型的預(yù)訓(xùn)練模型,每個同學(xué)都可以在這個預(yù)訓(xùn)練模型的基礎(chǔ)上去做下游的有監(jiān)督學(xué)習(xí)任務(wù),起點(diǎn)就比別人高。

個人為組織提供什么?

是否有短板不是那么重要,關(guān)鍵是要有長板,能夠?qū)M織的能力雷達(dá)圖做貢獻(xiàn)。

這一節(jié)留一個思考題:公司設(shè)置主管這個職位的目的是什么?是為了像幼兒園阿姨那樣,保障每一個小朋友都有自己喜歡的玩具,高高興興上學(xué)來,平平安安回家去?

招聘團(tuán)隊(duì)需要的人才

招聘為什么特別重要?

世界有個普遍規(guī)律:在前序階段做嚴(yán)格的控制會大大降低后序階段的實(shí)現(xiàn)難度,比如數(shù)據(jù)標(biāo)注、寫代碼、模型中的預(yù)處理等等。人招進(jìn)來之后是要用要管的,招聘的時候高標(biāo)準(zhǔn)嚴(yán)要求,后續(xù)管理會輕松很多;如果降低標(biāo)準(zhǔn)甚至放水,后續(xù)管理付出的代價(jià)遠(yuǎn)遠(yuǎn)高于招聘時偷懶省的功夫。

所以,我花了至少 1/3 的時間在招聘上。對的,至少 1/3 ,你沒有看錯。從 2019 年 2 月到現(xiàn)在,社招弄了 300+ 份簡歷;校招 100+ 份簡歷。在這里特別要感謝團(tuán)隊(duì)里球夫、天逸、開陽3位同學(xué),犧牲了大量業(yè)余時間做簡歷評估和初面。從統(tǒng)計(jì)數(shù)據(jù)看,每 100 份簡歷產(chǎn)生 2-3 個offer,入職 1-2 個人。從 100 份簡歷中招來的人絕對比 10 份簡歷中招來的省心很多。

我給算法團(tuán)隊(duì)找來過不少人,both 社招 and 校招,具體的展開討論見彩蛋部分的【招聘】。

招聘要考察哪些能力?

招聘,首先要確定 job model 。限于篇幅,這里只討論“生產(chǎn)”環(huán)節(jié)所需要的能力。

所處的時代背景:快速變化,新算法層出不窮。

不變的是什么:數(shù)學(xué)基礎(chǔ)、計(jì)算機(jī)基礎(chǔ)、動手能力。

我們很難預(yù)測新技術(shù)的具體實(shí)現(xiàn),但是當(dāng)新技術(shù)出現(xiàn)的時候,需要能夠快速地分析、學(xué)習(xí)、掌握。而且,我們經(jīng)常要解決從來沒有遇到過的新問題,這就要求候選人在面對沒見過的問題時具備分析判斷,在具體約束條件下找完整解決方案的能力。另外,在復(fù)雜的業(yè)務(wù)場景里,問題經(jīng)常沒有確定性的答案,我們往往通過對過程的合理性來判斷整個方案是否合乎要求。尋找答案的過程很少有一帆風(fēng)順的,大概率會遭遇挫折,非常需要候選人不斷嘗試不斷修正去抵達(dá)終點(diǎn)。

至于教育背景、之前從業(yè)經(jīng)歷,反而不怎么重要。我不贊成對于畢業(yè)好幾年的社招候選人還要參考畢業(yè)學(xué)校、最高學(xué)位,甚至本科學(xué)校是否 985 ——如果一個人能力強(qiáng),是不需要靠學(xué)校學(xué)位來旁證的,直接用行動證明就行了。

對于候選人的考察,我往往從基礎(chǔ)的硬技能、創(chuàng)新性/開放性思維、精神素質(zhì)三方面考察。

硬技能

數(shù)學(xué):概率論與數(shù)理統(tǒng)計(jì)、矩陣論、隨機(jī)過程。

計(jì)算機(jī)基礎(chǔ):操作系統(tǒng)、組成原理、數(shù)據(jù)結(jié)構(gòu)。

算法能力:領(lǐng)域內(nèi)主流模型的演進(jìn),優(yōu)缺點(diǎn)對比;在具體設(shè)定的場景下選擇合適的方案。

動手:C++/python/Java (什么?你說matlab?工業(yè)界里這個不算編程語言)。

有人說,面試過程中要求做代碼測試,就像相親時要求看存款證明一樣殘暴。我贊同這個說法,因?yàn)椴簧俸蜻x人聽到要寫代碼就高傲地拒絕了。我給大家推薦一個在線代碼測試工具:

http://collabedit.com

從我長期的觀察情況看,發(fā)展得好的算法同學(xué),動手能力都比較強(qiáng)。畢竟,算法工程師,首先是一個工程師。

創(chuàng)新性/開放性思維

其實(shí)我還經(jīng)常干比代碼測試更令人發(fā)指的事情——做智力題。這個不是我的創(chuàng)新,是跟 Google 等公司學(xué)來的,而且是直接找網(wǎng)上流傳的面試題換個馬甲來用。

前面的硬技能,看的往往是結(jié)果;這里對思考能力的考察,看的是過程:是否有方法論,思路是否清晰,是否言之有據(jù)。所以,這種問題的面試方式往往是討論式。

如果候選人能夠完成,最后再請TA做個總結(jié),觀察歸納要點(diǎn)的能力,視線的高度。

有些候選人結(jié)束面試后仍然會繼續(xù)思考,給出更好的回答。

精神素質(zhì)

公司對人才的要求是:樂觀、皮實(shí)、聰明、自省。

你看,四個詞里面有兩個都在強(qiáng)調(diào)堅(jiān)韌不拔。在面試過程中,我會看候選人在解題不順時的表現(xiàn),有時甚至故意小刺激一下觀察候選人的反應(yīng),偶爾還會故意中途改變限制條件。阿里內(nèi)部競爭激烈,經(jīng)常需要擁抱變化,如果心理承受力脆弱,是不適合當(dāng)同路人的。

還有一點(diǎn)很重要:自我驅(qū)動力。這是從降低對內(nèi)管理成本來要求的,后面會具體說。

在我看來,硬技能、創(chuàng)新性/開放性思維和精神素質(zhì)缺一不可。即使這三方面我都滿意了,如果主管,主管的主管, HR 對候選人明確提出疑慮,我一般不申辯直接放棄掉。因?yàn)椋麄儽任?level 高,閱人無數(shù),往往不會錯。

有的同學(xué)會問:這樣子做,會不會錯失優(yōu)秀人才?是的,我的方式幾乎可以確保招進(jìn)來的同學(xué)肯定是好的,但會漏掉一些優(yōu)秀的候選人,不過這不會造成嚴(yán)重的后果。相比之下,招進(jìn)來不合格的人才會有大麻煩。

用人

主管的角色是什么?

以前有句話,叫做“火車跑得快,全靠車頭帶”,這說的是前動車時代。動車和高鐵為什么比傳統(tǒng)的火車速度更快?根本原因是:大多數(shù)車廂都能提供動力。

同樣的,如果一個團(tuán)隊(duì)完全靠主管來驅(qū)動,來提供動力,主管很容易成為團(tuán)隊(duì)的瓶頸。我的團(tuán)隊(duì)成員,很多都是自己領(lǐng)域的高手,專業(yè)能力在我之上,我就應(yīng)該順應(yīng)實(shí)際情況,不要拿自己的愚見去束縛同學(xué)們的發(fā)揮。因此,我的角色更多的是眺望遠(yuǎn)方,掌握方向盤,有時踩一下剎車;團(tuán)隊(duì)大多數(shù)同學(xué)一起構(gòu)成動力引擎。

動車/高鐵跑得快,是因?yàn)榇蠖鄶?shù)車廂都提供動力

對內(nèi)管理模式

一個不恰當(dāng)?shù)谋扔鳎悍叛颉?/p>

這么做,堂而皇之的理由是“因?yàn)樾湃危院唵巍薄<夹g(shù)層面的原因,對算法類同學(xué)做過程管理性價(jià)比太低。

算法類工作,創(chuàng)造性在其中占據(jù)重要地位,而創(chuàng)造性很難在過程中量化度量,也很難從外部觀測現(xiàn)象來判斷。比如:身邊的同學(xué)坐在工位直視屏幕目不轉(zhuǎn)睛,我不知道他到底是在思考論文中的公式還是在回味昨天晚上看的電影。再比如,我base在杭州,沒辦法知道團(tuán)隊(duì)內(nèi)base北京的同學(xué)是不是在工作時間打游戲。

所以,我選擇信任我的同學(xué),只在一些必須監(jiān)管的事項(xiàng)上把關(guān),比如數(shù)據(jù)安全、安全生產(chǎn)等,其他事項(xiàng)一般不做過程管理,只做結(jié)果管理。得益于招聘時把關(guān)嚴(yán)格,絕大多數(shù)同學(xué)的自我驅(qū)動力都比較強(qiáng),我并不用操心偷懶的事情;相反,偶爾需要操心一下少部分同學(xué)拼過了頭的問題。關(guān)于這一點(diǎn),更多的內(nèi)容見彩蛋中的【認(rèn)真生活,快樂工作】。

肯定有同學(xué)問:上面說的是不擔(dān)心出工不出力,那么,怎么解釋出力的問題呢?你難道不指導(dǎo)同學(xué)做項(xiàng)目嗎?

我一般只給出項(xiàng)目的目標(biāo),有時給一個粗略的方案設(shè)想,有時不給。公司對于P6同學(xué)已經(jīng)有“獨(dú)當(dāng)一面拿結(jié)果” 的要求,大家都應(yīng)該具備獨(dú)立作戰(zhàn)的能力。而且,按照前面說的,團(tuán)隊(duì)內(nèi)大部分同學(xué)都應(yīng)該是提供動力的車廂,沒必要依賴我。人是否有自我意志?這個問題我不知道答案。但我知道,如果一個人認(rèn)為主意是自己想出來的,決定是自己做的,會更有動力去實(shí)現(xiàn)。嘗試做決策,嘗試完成不確定的任務(wù),都有利于自己的成長。

思考題:管理有很多種style。有的主管喜歡自己做需求分析,然后拆解細(xì)化到原子級的技術(shù)問題,讓下屬做執(zhí)行。這種模式,和“放羊”模式相比,從主管視角,以及下屬視角看,各有什么優(yōu)缺點(diǎn)?

綜合以上兩點(diǎn),我覺得放羊是可行的。而且,放羊這件事,羊倌也是要做很多工作的:選擇合適的天氣,找到草地,把羊群帶到草地,放哨保護(hù)羊群,是不是?如果還要把青草割好喂給羊吃,那成什么了?

羊倌應(yīng)該把更多的精力花在尋找豐美的草地,購買強(qiáng)壯的羊,與其他羊倌交流這些事情上,要是成天忙于喂羊,督促偷懶的羊快點(diǎn)吃草,拉開打架的羊這些內(nèi)部事務(wù),羊群怎么發(fā)展壯大?更多的展開見彩蛋中的【因?yàn)樾湃危院唵巍俊?/p>

鼓舞團(tuán)隊(duì)信心,最好的方式是什么?

痛痛快快地贏一次。如果不夠,就兩次。

接手團(tuán)隊(duì)的時候,在商業(yè)化方向上局勢是很差的:去年三次PK競品都輸了,穩(wěn)定性問題頻發(fā)以至于新版本都無法發(fā)布……團(tuán)隊(duì)好幾個人都撲在這一個陣地上干得很苦但就是拿不到結(jié)果。

這個時候我要是去發(fā)表個類似《至暗時刻》里丘吉爾那樣讓人熱血沸騰的演講是否可以解決問題?可能有短暫的強(qiáng)心劑作用,但是不長久,因?yàn)閷?shí)際困難沒解決。何況,我也肯定不具備丘吉爾的演說能力。最有用的辦法,還是分析失敗的原因,制定正確的打法,指導(dǎo)同學(xué)們獲得一次成功。鼓舞信心最好的方式還是靠實(shí)實(shí)在在的成功。

結(jié)果大家都看到了,今年我們PK競品的戰(zhàn)績是N:0,付費(fèi)調(diào)用量上漲25倍以上。大家肯定好奇:正確的打法是什么樣的呢?我放在后面《正確地做事》那一節(jié)講。

做有吸引力的事情

目標(biāo)要定得高一些,有挑戰(zhàn)性,達(dá)成的時候內(nèi)心的成就感會更高一些。這個很容易理解,就好比你打游戲,虐了個菜,沒多少快感;如果能贏下之前屢戰(zhàn)屢敗的對手,一定會興奮很久。我跟部分同學(xué)說過,大家的眼光不要局限在三號樓,也不要局限在聚橙路,而是要放眼世界。

目標(biāo)定得太低,不僅不能逼出自己的潛力,還容易讓自己關(guān)注于一些雞毛蒜皮的小問題。

前幾天,我的主管在一個項(xiàng)目 kick off 會上說,當(dāng)你回首往事時,要有一件做過的事情能夠拿出來吹牛逼,人生才有意義。深以為然。

過程即享受

在阿里的工作肯定是辛苦的,我沒看到過誰能隨隨便便就成功。如果只是沖著收入來做工作,難免在過程中會感覺到很多痛苦。物質(zhì)的刺激是短暫的,不管是加薪、年終獎,或者 option ,興奮高興個幾天就過去了。如果喜歡自己做的事情,專注于工作本身,從中源源不斷地獲得成就感,就能做到雖然辛苦但是不痛苦。我家做飯的阿姨是拆遷戶,坐擁 N 套房,每天仍然跑幾家做飯,我問她為什么?她說,以前是開蒼蠅館子的,拆遷后沒得開了,但是自己就是喜歡做飯。理想狀況下就是要招聘這種人。

采取什么工作模式?——正確地做事

四個在線化

互聯(lián)網(wǎng)的本質(zhì)是連接,最大價(jià)值也是連接。

這句話不知道是誰說的,第一次聽說是在《計(jì)算機(jī)網(wǎng)絡(luò)》課程上。互聯(lián)網(wǎng)連接的可以是人和人,人和文檔,人和數(shù)據(jù),人和代碼,人和……和一切你工作中需要的東西。

接手團(tuán)隊(duì)之后,我發(fā)現(xiàn)同學(xué)們的工作模式真的是自耕農(nóng)一般:各做各的模型,各用各的數(shù)據(jù),各讀各的 paper ,完全是原子化的散點(diǎn)存在。說得不客氣一點(diǎn),除了聚餐的時候,平時感覺不到這是一個組織。也就是說,身處中國頂級互聯(lián)網(wǎng)公司,大家卻像農(nóng)業(yè)社會時期一樣在進(jìn)行生產(chǎn),當(dāng)著不折不扣的“碼農(nóng)”。

團(tuán)隊(duì)里一個同學(xué)說得很好:相互間建立信任關(guān)系的最好辦法是發(fā)生工作上的協(xié)同。我覺得,要發(fā)生工作上的協(xié)同,前提就是把工作相關(guān)的資源都在線化,與組織成員發(fā)生連接,于是,我設(shè)想做4個在線化。

文檔、數(shù)據(jù)、代碼、評測在線化

1、文檔在線化

春節(jié)期間我建了個團(tuán)隊(duì)語雀,自己做頂層設(shè)計(jì),寫好框架,然后讓同學(xué)們把業(yè)務(wù)、技術(shù)、資源、技術(shù)影響力等等和工作相關(guān)的內(nèi)容都填寫其中。這樣子,每個同學(xué)都可以看到團(tuán)隊(duì)的各種信息和資源,以及其他人的工作。目前團(tuán)隊(duì)的語雀還對部分關(guān)聯(lián)緊密的兄弟團(tuán)隊(duì)完全開放。

2、數(shù)據(jù)在線化

如果同學(xué)們各自管理自己的數(shù)據(jù),形成數(shù)據(jù)孤島不說,發(fā)生機(jī)器重裝,或者轉(zhuǎn)崗、離職,往往數(shù)據(jù)就丟了。接手的時候,能清理出來的有標(biāo)簽數(shù)據(jù)遠(yuǎn)遠(yuǎn)低于應(yīng)有的數(shù)量,就是因?yàn)橐恢睕]有做數(shù)據(jù)的在線化管理。團(tuán)隊(duì)里的言奇同學(xué)做了樣本大表項(xiàng)目,已經(jīng)完成了將整個智能認(rèn)知團(tuán)隊(duì)的全面標(biāo)簽數(shù)據(jù)在線化。這一點(diǎn)非常重要,后續(xù)在開發(fā)各種新模型,以及做預(yù)訓(xùn)練模型時,就擁有不同業(yè)務(wù)不同場景不同風(fēng)險(xiǎn)的大量數(shù)據(jù),在短時間內(nèi)取得了良好的效果。

3、代碼在線化

這個正在進(jìn)行中,預(yù)期 S2 結(jié)束時完成,出發(fā)點(diǎn)是:

a.代碼是團(tuán)隊(duì)重要的技術(shù)資產(chǎn),應(yīng)該統(tǒng)一管理,提高安全性。

b.在線化后方便團(tuán)隊(duì)協(xié)作,共享優(yōu)秀代碼

c.基礎(chǔ)性模塊代碼統(tǒng)一,降低維護(hù)成本

4、評測在線化

也在進(jìn)行中,設(shè)想是在一些特定任務(wù)上做幾種經(jīng)典模型和確認(rèn)無誤的主流模型,能夠一鍵實(shí)現(xiàn)自己的模型和前者的自動化比對,提升工作效率。除此之外還有個作用:經(jīng)典模型的結(jié)果可以作為baseline,幫助驗(yàn)證深度模型的正確性。因?yàn)椋阕隽艘粋€深度模型,效果好也就罷了,效果不好的時候都搞不清楚是模型不適用,還是自己的代碼寫錯了。

找對前進(jìn)的方向

主管最重要的職責(zé)之一是當(dāng)同學(xué)們迷茫的時候明確前進(jìn)的方向。

接著前面商業(yè)化的例子,詳細(xì)情況是這樣的:我們通過阿里云對外輸出文本風(fēng)險(xiǎn)識別的算法能力做商業(yè)化,比如涉政、色情低俗、廣告、辱罵等。我接手的時候,有 3-4 個同學(xué)全職投入這項(xiàng)工作,他們工作非常努力,干得也很辛苦,但是效果并不好, PK 競品的時候并無勝算。出了什么問題呢?

分析之后,我發(fā)現(xiàn)以下問題:

1、確實(shí)是一個內(nèi)容維度的問題,但只使用了分類模型一種方式。

分類模型適合解決靜態(tài)標(biāo)準(zhǔn)的問題,并不適合及時響應(yīng)業(yè)務(wù)上的快速變化。模型迭代更新的速度做到極限也只能是 T+1 或者 T+2 天,且人力消耗高。之前的主管為了解決這個問題,在分類模型中塞了一個風(fēng)險(xiǎn)詞包,由算法同學(xué)維護(hù)更新,接到運(yùn)營反饋的 badcase 之后手動添加到風(fēng)險(xiǎn)詞包,然后定時推送到分類模型應(yīng)用中。這個復(fù)雜的機(jī)制帶來了詞典的頻繁構(gòu)建,結(jié)果導(dǎo)致應(yīng)用的穩(wěn)定性問題頻發(fā),甚至已經(jīng)無法更新。

2、缺乏頂層設(shè)計(jì),同學(xué)們各自為戰(zhàn)。

幾個風(fēng)險(xiǎn)各自單獨(dú)做模型,技術(shù)選型高度自由,百花齊放,starspace、SVM、CRF、kenlm、textCNN 都有,難以統(tǒng)一提升能力,維護(hù)的難度大。

3、做了過多的個性化定制,導(dǎo)致后續(xù)維護(hù)和升級的成本非常高。

幾乎為每一個稍微大一點(diǎn)的用戶都單獨(dú)做了模型,付費(fèi)調(diào)用量不大,模型倒是有了好幾十個。同學(xué)們頻繁地做模型的迭代更新(每周都至少有 1-2 次),占用大量人力。

怎么辦呢?

建設(shè)技術(shù)體系去解決某一類問題,而不是某個技術(shù)點(diǎn)去解決某一個問題;結(jié)合安全業(yè)務(wù)的特點(diǎn),設(shè)計(jì)可以強(qiáng)化通用算法效果的基礎(chǔ)能力或處理框架。

——上面兩句話不是我說的,來源于前主管。(插一句:本文還有一些內(nèi)容來源于前主管和主管,向主管學(xué)習(xí)是提升自己的一個重要途徑。)

具體來說,解法有幾點(diǎn):

1、明確風(fēng)險(xiǎn)詞包、相似性檢索、分類模型、風(fēng)險(xiǎn)知識圖譜 4種手段適合完成的任務(wù),且相互配合。

2、把風(fēng)險(xiǎn)詞包從分類模型中拆出來,降低應(yīng)用的復(fù)雜度,以及模型迭代的頻率,解決穩(wěn)定性問題。

3、分類模型的結(jié)構(gòu)盡可能統(tǒng)一,標(biāo)準(zhǔn)盡可能不變,持續(xù)把效果做強(qiáng)。

4、自從 BERT 提出以來,NLP 問題的基本范式從原來的 task-specific 的模型結(jié)構(gòu)設(shè)計(jì)轉(zhuǎn)變到語言模型 pretrain+ 下游任務(wù) finetuning 的模式。工作重點(diǎn)應(yīng)該轉(zhuǎn)向預(yù)訓(xùn)練模型與知識蒸餾。

由于目前對內(nèi)的內(nèi)容交互風(fēng)險(xiǎn)管控業(yè)務(wù)也在我的團(tuán)隊(duì)內(nèi),我就貼一張全局視角的問題分析與解決方案。

全局視角的UGC風(fēng)險(xiǎn)管控思路

明確解法之后,同學(xué)們快速做了實(shí)踐,到 4 月份就基本扭轉(zhuǎn)了被動的局面,隨后打了翻身仗,付費(fèi)調(diào)用量增長 25 倍。現(xiàn)在模型的更新周期降低到以月為周期,穩(wěn)定性大幅度提升,同學(xué)們也不再疲于奔命;而且,投入的人力也明顯下降了

績效的考核

績效考核決定了收益的分配,也是團(tuán)隊(duì)最重要的事情之一。

如果把團(tuán)隊(duì)比作一個模型,考核的標(biāo)準(zhǔn)就是 loss function。loss function 一旦確定,模型的優(yōu)化方向也就定了,團(tuán)隊(duì)成員會按照利益最大化原則沿著這個方向調(diào)整自己的 action 。

所以,考核標(biāo)準(zhǔn)的設(shè)計(jì)需要體現(xiàn)團(tuán)隊(duì)的定位、價(jià)值和需求;在執(zhí)行的過程中需要滿足平等性。

績效考核的3個維度

業(yè)務(wù)結(jié)果

阿里有個文雅的說法是:為過程鼓掌,為結(jié)果付酬。

還有個話糙理不糙的說法是:沒有過程的結(jié)果是垃圾,沒有結(jié)果的過程是放屁。

你覺得哪一句對你的胃口就看哪一句。

配置在業(yè)務(wù)BU的算法團(tuán)隊(duì),幫助業(yè)務(wù)目標(biāo)達(dá)成肯定是首要任務(wù)。今年以來,AI 行業(yè)也都漸漸擠出泡沫,回歸本質(zhì),開始強(qiáng)調(diào)創(chuàng)造業(yè)務(wù)價(jià)值了。

能力進(jìn)步

從價(jià)值觀上講,今天的最好表現(xiàn)是明天的最低要求。

從業(yè)務(wù)需求講,量級越來越大,業(yè)務(wù)形態(tài)越來越復(fù)雜,老算法是解決不了新問題的。

從團(tuán)隊(duì)利益講,成員的能力進(jìn)步可以擴(kuò)展團(tuán)隊(duì)的能力雷達(dá)圖。

參加百阿的時候,一位講師的發(fā)言我到現(xiàn)在都記得:在座的各位最終都是要離開阿里的,離開的時候無非兩種情況:1,公司不要你了;2,你不要公司了。怎么離開,取決于是你的能力提高快,還是公司對能力的要求提高快。

技術(shù)影響力

什么是技術(shù)影響力?

有形物:Paper 、競賽成績、著作、專利、 ATA 文章等。

無形物:對內(nèi)對外合作、對外 PR 、對內(nèi)分享、組織機(jī)構(gòu)任職、參會做報(bào)告等。

為什么要建設(shè)技術(shù)影響力?

1、團(tuán)隊(duì)的四項(xiàng)基本能力:連接、生產(chǎn)、傳播、服務(wù),其中“傳播”就需要技術(shù)影響力。

2、 CRO 線的使命“四心”中,有一條叫“讓監(jiān)管單位放心”。技術(shù)影響力是讓監(jiān)管放心的有效方式之一。

3、商業(yè)化需要資質(zhì):搞過投標(biāo)的同學(xué)都知道。

4、招聘需要名氣:對候選人講解我們的技術(shù)水平時,如果用內(nèi)部業(yè)務(wù)舉例,不容易產(chǎn)生共鳴;但是如果直接亮出頂會論文、刷榜名次之類的,對方馬上就懂了。

5、個人的市場價(jià)值需要證明:這些東西都可以作為個人技術(shù)品牌,到哪都能帶著。

假定一個場景,有人問:“你說這個業(yè)務(wù)做得好,說明你的算法水平高。會不會換一個人能夠做得更好?”你打算怎么回答這個問題?

再假定一個場景,你打算給自己團(tuán)隊(duì)的算法能力定性為“xx領(lǐng)先”或者“xx第一梯隊(duì)”,如果沒有硬核的技術(shù)影響力做支撐,是否還能理直氣壯?

平等性

團(tuán)隊(duì)協(xié)作的基礎(chǔ)是團(tuán)結(jié),團(tuán)結(jié)的基礎(chǔ)是平等。

平等性最重要的體現(xiàn),就是在考核過程中盡可能只衡量以上三項(xiàng),不去考慮地域、教育背景、從業(yè)經(jīng)歷、之前表現(xiàn)、顏值、性別、個人動向等等其他因素。我認(rèn)為:結(jié)果體現(xiàn)的就是能力,直截了當(dāng),最能服眾。

當(dāng)然,這個世界上是否有完全客觀的判斷?或者,完全客觀的判斷如果存在,是不是就是最合適的?我不知道答案。不過,我覺得不能因?yàn)樽霾坏酵耆钠降榷艞壸非笃降取?/p>

按照慣例,it's the timefor employment ad 。我們需要研究這些領(lǐng)域:

1、安全場景特有的問題

1.1 無限制條件下的攻擊與防御

現(xiàn)實(shí)世界里,違規(guī)者的變形變異方法是不受約束的,思路非常廣,讓人防不勝防。我們需要研究無限制條件下的攻擊與防御以提升我們對于業(yè)務(wù)(尤其是信息治理與商品)中層出不窮的變形變異,這屬于核心能力。

1.2 模型的可解釋性

是AI的一大發(fā)展趨勢。我們作為安全AI,這張牌更需要打出來,體現(xiàn)安全領(lǐng)域的特色;也需要給業(yè)務(wù)同學(xué)提供人可以理解的原因,放心地做決策。

1.3 小樣本學(xué)習(xí)

安全場景經(jīng)常因?yàn)椴豢煽沽Σ荒芩鸭阶銐虻臉颖荆蛘唛L尾風(fēng)險(xiǎn)因?yàn)槌杀镜脑驘o法去做樣本收集,必須要發(fā)展只憑借少量樣本快速獲取“夠用”的模型的手段。

2、預(yù)訓(xùn)練與知識蒸餾

自從 BERT 提出以來,NLP問題的基本研究范式從原來的 task-specific的模型結(jié)構(gòu)設(shè)計(jì)轉(zhuǎn)變到語言模型預(yù)訓(xùn)練+下游任務(wù)微調(diào)的模式。這是歷史必然的趨勢,不可扭轉(zhuǎn)。

2.1 預(yù)訓(xùn)練

預(yù)訓(xùn)練模型自身的提高,可以帶來分類、檢索、 NER 等 NLP 基本任務(wù)(這些都是我們需要具備的核心能力)的水平提高,且有利于 NLP 技術(shù)體系的統(tǒng)一化。可以把我們的各種應(yīng)用算法能力比喻為船,預(yù)訓(xùn)練模型是水,水漲就能船高。

2.2知識蒸餾

由于目前還存在模型復(fù)雜度和計(jì)算資源的尖銳矛盾,對于我們這種業(yè)務(wù)量動輒十幾億的情況,模型的計(jì)算效率具有非常重要的財(cái)務(wù)意義。如何在盡可能保障效果的前提下降低計(jì)算資源的消耗具有非常現(xiàn)實(shí)的意義。

穩(wěn)定

產(chǎn)品高可用性高并發(fā)

貼心

項(xiàng)目群及時溝通

專業(yè)

產(chǎn)品經(jīng)理1v1支持

快速

MVP模式小步快跑

承諾

我們選擇聲譽(yù)

堅(jiān)持

10年專注高端品質(zhì)開發(fā)
  • 返回頂部
国产成人精品人人做人人爽| 欧洲熟妇色ⅩXXXX欧美老妇| 亚洲午夜无码片在线观看影院百度 | 年轻老师的滋味5| 亚洲国产精品久久久久婷婷软件| 国产精品亚洲一区二区三区| 熟女少妇内射日韩亚洲| 成人午夜亚洲精品无码网站| 人妻少妇精品无码系列| AV无码人妻无码男人的天堂| 免费A级毛片无码韩国| 伊人成年网站综合网| 痉挛高潮喷水AV无码免费| 亚洲AV无码一区二区三区dv| 国产福利一区二区三区在线观看| 牲欲强的熟妇农村老妇女视频| 锕锕锕锕锕锕~好深啊APP| 九月在线 视频 在线观看| 99久久免费国产精品四虎99久久精品免费看国产一区二区 | 久久久婷婷五月亚洲97号色| 亚洲丁香婷婷久久一区二区| 国产精品一区二区久久不卡| 亚洲中文字幕AV不卡无码| 禁止18点击进入在线看片尤物| 午夜理论片福利在线观看| 国产精品久久久久久TV| 午夜性影院爽爽爽爽爽爽| 国产真实乱对白精彩久久| 亚洲AV中文无码乱人伦| 精品无码国产自产拍在线观看蜜桃| 亚洲欧美一区二区三区| 久久久久久久久蜜桃| 综合偷自拍亚洲乱中文字幕| 欧美黑人XXXX| 啊灬啊灬啊灬快灬高潮了| 亚洲AV日韩AV激情亚洲| 国产做国产爱免费视频| 亚洲精品无码久久一线| 久久 国产 尿 小便 嘘嘘| 成人AV鲁丝片一区二区免费| 贪婪洞窟H5双修流攻略小说| 国产午夜片无码区在线观看| 亚洲欧美日韩成人综合网| 人妻无码系列一区二区三区| 国产99视频精品免费视看9| 小浪货腿打开水真多真紧| 极品粉嫩嫩模大尺度无码视频| 亚洲欧洲成人A∨在线观看| 日本熟妇色熟妇在线视频播放| 成人精品一区二区三区在线观看| 亚洲色18禁成人网站WWW永久| 老熟妇高潮一区二区三区| 最新无码国产在线视频9299| 无码国产精品一区二区免费式芒果 | 国产后入又长又硬| 69SEX久久精品国产麻豆| 日本丰满少妇高潮呻吟| 国产草草影院CCYYCOM| 中文字幕人妻互换激情| 人妻无码熟妇乱又伦精品| 精品亚洲自慰AV无码喷奶水| 公交车里抓着摇曳的手环诗情 | 无码人妻精品中文字幕| 好了AV第四综合无码久久 | ZO2O女人另类ZO2O洗浴| 偷窥丶偷拍丶妓女丶自由| 国内少妇高潮嗷嗷叫在线播放| 亚洲欧洲日产国码无码久久99| 四十路の五十路熟女豊満| 欧美熟妇ⅤIDEOS| 国产精品久久高潮呻吟无码| 亚洲熟妇无码久久精品导航| 清一区二区国产好的精华液| 国产精品无码永久免费888| 亚洲日韩国产精品无码AV| 无码人妻精品一区二区蜜桃温柔乡| 欧美一区二区三区视频在线观看| 国产精品日本一区二区在线播放| WWW插插插无码免费视频网站| 在线 亚洲 国产 欧美| 色天使色偷偷色噜噜噜AV天堂 | 国产福利一区二区久久| 八戒八戒看片在线WWW看| 香蕉蕉亚亚洲AAV综合| 少妇太爽了在线观看免费视频 | 青青草原精品国产亚洲AV| 久久丫精品国产亚洲AV不卡| 成人无码午夜在线观看| 97精品依人久久久大香线蕉97| 西西人体大胆4444WWW| 少妇高潮惨叫喷水正在播放| 久久久无码精品亚洲日韩精东传媒| 国产一区二区怡红院| 国产精品久久国产三级国| 低调看JRS直播| 亚洲一区在线日韩在线尤物| 亚洲VA综合VA国产产VA中| 为了撞上你1∨1SC| 免费无码又爽又刺激激情视频 | 果冻传媒董小宛一区二区| 国产精品免费视频网站| 国产精品成人网站| 工口全彩H肉无遮挡无翼乌| 高潮久久久久久久久不卡| 成人免费视频一区二区| 成人欧美一区二区三区| 成人全部免费的A毛片在线看| 被两个男人按住胸吃奶好爽| 亚洲国产午夜精品理论片| 日本动漫爆乳H动漫无遮挡| 女神被啪到深处娇喘在线观看| 国产一卡2卡3卡4卡无卡国色 | 激情视频传媒一区二区| 国产精品无码综合区| 国产成人无码精品一区在线观看| 在线播放五十路熟妇| 一出一进一爽一粗一大视频免费的| 四虎永久在线精品无码视频| 色老板在线永久免费视频| 色欲色香天天天综合网WWW| 麻豆精品一区二区综合AV | 无码专区 丝袜美腿 制服师生| 欧美黑人XXXⅩ高潮交| 免费无码毛片一区二区APP| 欧美高清VIVO最新| 人妻精品久久无码专区涩涩| 日韩精品无码区免费专区 | 老妇乱强伦XXXXX| 国内极度色诱视频网站| 极品妇女扒开粉嫩小泬| 极品性荡少妇一区二区| 久久久久精品无码观看不卡| 国产熟女一区二区三区四区五区| 国产人妖视频一区二区| 播放灌醉水嫩大学生国内精品| 饭桌上故意张开腿让公在线观| 欧美日韩综合精品一区二区 | 欧美极品小妇另类xXXX性| 秋霞国产午夜伦午夜无码灬| 日韩无人区码卡二卡3卡2022| 麻豆专媒体一区二区| 娇妻当着我的面被4P| 久久久精品456亚洲影院| 狠狠色丁香九九婷婷综合| 国产精品久久国产三级国| 国精品无码一区二区三区左线 | 亚洲欧洲闷骚AV少妇影院| 用嘴巴吃鸡的好处| 亚洲AV永久无码区成人网站| 亚洲一级 片内射欧美乱强| 最新在线精品国产福利| 成人AV无码乱码在线观看无码| 国产成人精品综合久久久久性色| 国模精品一区二区三区| 国产亚洲AV寡妇| 久久久久国色AV∨免费看| 男人激烈吮乳吃奶毛片| 久久久久精品国产AV麻豆| 每晚都被他添的流好多水| 欧美日韩一区二区三区人妻| 日韩AV一区二区三区| 西西GOGO大胆啪啪艺术| 亚洲制服丝袜中文字幕在线| 99久久久国产精品消防器材| 国产办公室秘书无码精品99| 好硬好湿好爽再深一点动态图片 | 国产精品你懂的在线播放| 黑人精品一区二区三区| 久久国内精品自在自线400部| 国产精品无卡毛片视频| 精品高潮呻吟AV久久无码| 国产日产欧产美韩系列麻豆| 久久99精品久久久久久9蜜桃| 激情影视乱码AV| 女自慰喷水免费观看WWW久久| 少妇久久久久久被弄高潮| 亚洲另类激情综合偷自拍图片| 无码18在线网站成人网站| 亚洲 欧美 变态 另类 综合| 少妇饥渴偷公乱第一章全文| 亚洲A级成人无码网站| 92成人午夜福利一区二区| 高清国产亚洲精品自在久久| 精品亚洲成A人片在线观看少妇| 欧美午夜精品久久久久免费视 | 在线播放国产不卡免费视频| 草莓视频在线观看18| 把腿张开老子臊烂你的黄漫| 欧美日韩亚洲国产综合乱| 成人一区二区免费中文字幕视频| 被黑人扒开双腿猛进夏科骨科| 国产福利一区二区精品秒拍| 九热爱视频精品视频| 人妻系列AV无码专区| 无码免费一区二区三区免费播放| 在厨房乱子伦对白| 国产成人久久精品二区三区小说 | 帅气小鲜肉自慰VIDEO| 一女多男双修NP古言| 高清熟女国产一区二区三区|