法律透視 | 數據投毒:錯誤數據如何污染AI模型
引言
律師行業往往傾向於在特定領域發展專長,例如金融、公司法、海運、保險。據我觀察,絕大多數律師在職業初期,都會接受全面的法律訓練,而後(無論出於個人選擇、機緣巧合或多種因素的結合)逐漸在某一特定領域深耕。這種專業化並非一蹴而就,而是一個循序漸進的過程——律師在紮實的法律基礎上,逐步學習並理解所涉行業的運作規律。例如,一位初級律師或許起初對金融知之甚少,但若志在成為金融法律師,就必須深入理解金融市場的運作機制以及各類金融工具。這往往需要經年累月的積累,因為律師必須掌握一門原本並非自身專長的學科。
職業路徑亦有例外。有些律師在轉行執業前曾受訓於其他專業領域,而先前的背景常會影響他們日後的專業方向。例如,從醫生轉行為律師的在醫療法領域具備天然優勢;會計師出身的律師則可能在公司金融法方面獨具所長。
我自己的經歷則兼具兩者。我的法律專業方向是金融法,因此同樣是從一名律師起步,一點點熟悉金融實務。但數據科學的經歷卻是相反路徑:我並非以律師身份逐漸涉足數據科學,而是“空降式”投入到這一全新領域。攻讀數據科學碩士期間,我學習了數學、編程、計算機科學及許多令人着迷的學科。如今,我希望從數據科學的角度出發,重新回到法律領域,探索兩者之間的聯繫。
我對這段旅程充滿期待。律師常對STEM(科學、技術、工程、數學)科目望而生畏——多少人是因“我不擅長數學”而選擇法律?但既然我親身經歷過這一學習過程,我想或許(僅僅是或許)存在一種方式,能用律師能夠理解的方式來解釋STEM概念。
我作此嘗試的另一原因,是希望探尋法律與數據科學——或更廣義上為“法律與數據”——的交集。一個顯而易見的例子便是“數據隱私法”。因此,我計劃撰寫一系列文章,探討數據隱私法中出現的問題與概念。如今,數據隱私合規工作往往既需要專業的法律理解,又涉及計算機技術層面的相關技能。我希望我的文章能在法律與技術視角之間提供某種平衡。儘管我的切入點或許更側重於向法律人普及STEM概念,但也期待這些文字能為數據科學家、工程師等羣體,打開法律與合規的視角。
