文章

法律透视 | 数据投毒:错误数据如何污染AI模型

引言

 

律师行业往往倾向于在特定领域发展专长,例如金融、公司法、海运、保险。据我观察,绝大多数律师在职业初期,都会接受全面的法律训练,而后(无论出于个人选择、机缘巧合或多种因素的结合)逐渐在某一特定领域深耕。这种专业化并非一蹴而就,而是一个循序渐进的过程——律师在扎实的法律基础上,逐步学习并理解所涉行业的运作规律。例如,一位初级律师或许起初对金融知之甚少,但若志在成为金融法律师,就必须深入理解金融市场的运作机制以及各类金融工具。这往往需要经年累月的积累,因为律师必须掌握一门原本并非自身专长的学科。

 

职业路径亦有例外。有些律师在转行执业前曾受训于其他专业领域,而先前的背景常会影响他们日后的专业方向。例如,从医生转行为律师的在医疗法领域具备天然优势;会计师出身的律师则可能在公司金融法方面独具所长。

 

我自己的经历则兼具两者。我的法律专业方向是金融法,因此同样是从一名律师起步,一点点熟悉金融实务。但数据科学的经历却是相反路径:我并非以律师身份逐渐涉足数据科学,而是“空降式”投入到这一全新领域。攻读数据科学硕士期间,我学习了数学、编程、计算机科学及许多令人着迷的学科。如今,我希望从数据科学的角度出发,重新回到法律领域,探索两者之间的联系。

 

我对这段旅程充满期待。律师常对STEM(科学、技术、工程、数学)科目望而生畏——多少人是因“我不擅长数学”而选择法律?但既然我亲身经历过这一学习过程,我想或许(仅仅是或许)存在一种方式,能用律师能够理解的方式来解释STEM概念。

 

我作此尝试的另一原因,是希望探寻法律与数据科学——或更广义上为“法律与数据”——的交集。一个显而易见的例子便是“数据隐私法”。因此,我计划撰写一系列文章,探讨数据隐私法中出现的问题与概念。如今,数据隐私合规工作往往既需要专业的法律理解,又涉及计算机技术层面的相关技能。我希望我的文章能在法律与技术视角之间提供某种平衡。尽管我的切入点或许更侧重于向法律人普及STEM概念,但也期待这些文字能为数据科学家、工程师等群体,打开法律与合规的视角。