数据科学家是否应该持证上岗?
阅读量:次 Authors: 阳哥 COMPREHENSIVE
Comprehensive
阅读量:次 Authors: 阳哥 COMPREHENSIVE
Comprehensive
Licensing could lead to increased public safety, but at the cost of slowing down innovation
许可可以增加公共安全,但代价是放慢创新
作者 | Andrei Lyskov |
翻译 | 阳哥 |
译文出品 | Python数据之道 |
每天你的生活都受到不同的机器学习算法的影响。 有些是无害的,比如 Netflix 上的电影推荐。 其他如贷款审批和保释判决如果发展不当,可能会在不同程度上造成影响。 随着这些模型的影响越来越大,它提出了数据科学家是否应该获得许可的问题,类似于律师和医生。
正式职业将意味着数据科学家将被要求保持一定水平的技术能力,遵守行为准则并通过由该领域的专业人员组成的批准委员会进行自我监管。 由于数据科学需要特殊培训,并且其数据科学的使用不当可能导致严重的负面后果,因此有充分理由建立数据科学专业。
然而,数据科学相对于其他许可领域仍处于起步阶段,预计未来数年将进行细分和变革。 尽管处于起步阶段,但一名数据科学家的疏忽将比一名医生的疏忽产生更大的影响。 因此,需要有一种惩罚不良行为者并维护公众信任的方法。 是否通过设立专业许可委员会限制雇用没有获得数据科学许可的人员,或者需要通过获取专门的证书来确保数据科学家的完整性。 我们的最终目标是保护公众免受此类专业人员的影响。
在讨论是否需要许可的原因时,最明显的原因是保护公众。 去看医生,你对服务有一定的期望。 你知道他们遵守标准,如果他们行为不端会产生影响,例如撤销他们相关的医生证。 然而,行为不端的数据科学家可以简单地找到另一份工作并继续他们的职业生涯。
许可的另一个好处是标准化数据科学家的教育和期望。 目前,对数据科学家的作用存在很多困惑,导致许多不合格的人将自己重新塑造为数据科学家,以增加薪酬和声望。 通过许可创建标准,不能满足新入职要求的低质量人员将被迫离开,而更有驱动力的人员将不得不参与与工作相关的培训以满足新的期望。 例如,在英国,为保安人员和护理人员引入职业许可证导致了资格水平和与工作相关的培训的增加。
然而,反对许可的原因同样令人信服。 例如,已经表明,过多的许可可能会妨碍创造就业机会,特别是对于教育水平较低的人,这可能会导致不平等程度的进一步加剧。
决定谁是合格者也是一项艰巨的任务,特别是因为数据科学家来自各种背景。 一项小型研究(n = 1001)探讨了数据科学家背景在学术研究(20% 计算机科学,19% 数学,19% 经济学)以及他们所从事领域(42% 技术,37% 工业,16% 金融,5% 医疗保健)等方面的差异,研究表明背景差异会形成鲜明对比。 此外,由于该领域是如此新颖,未来的数据科学家可能会拥有与当今数据科学家不同的技能。
可以出现的另一个问题是通过创造进入的高门槛来削减创新。 对于可能已经胜任的移民人才尤其如此,他们可能再次需要通过他们之前在本国已经参加过的重复培训。 由于数据科学已经出现短缺,毫无疑问,任何形式的专业许可都会影响就业增长并显着降低从业者的入门率。 这些问题将是以数据科学协会形式产生垄断的直接结果,这将限制劳动力供应并减少竞争。
是否需要获得专业许可的核心问题是保护公众免受不良行为者的影响并确保质量始终如一。 其他好处包括标准化教育和对数据科学家的期望,降低低质量人员的数量。 另一方面,由于数据科学是一个新领域,获得专业许可可能会阻碍创造就业机会并减缓创新。 这可能会导致移民人才寻求其他国家的就业机会,因为这些国家的入境门槛较高。
虽然实施许可背后的机制可能很难,但证书可能是一种限制性较小的许可选项。 专业协会可以管理考试,想要确保数据科学家质量的公司可以选择优先考虑那些具有证书的候选人。 另一种方法是仅许可和管理使用敏感数据或大规模模型的数据科学家。 很可能,随着该领域的成熟以及数据科学家的角色更加标准化,重新审视许可问题或者至少创建某种检查和平衡可能是有意义的。 就目前而言,实施任何形式的限制性许可程序可能最终会造成更多弊大于利。
对我的文章感兴趣的朋友,可以关注我的微信公众号「Python数据之道」(ID:PyDataLab),接收我的更新通知。