GitHub Copilot自动补全身份证信息,生成假数据“曝光”隐私

近期,有一位网友在推特上使用GitHub Copilot这一AI编程工具时,发现它尽然能自动补全身份证的信息。据悉,当他输入B站CEO的信息后,下方随即自动补出了关于这个CEO的身份证相关信息,这波操作一时让很多用户陷入恐慌,不过好在这个AI编程工具自动生成的信息是有误,让大家松了口气。

经过这件事之后,不少朋友很好奇这个GitHub Copilot到底试试怎么产生个人隐私信息呢?

首先,这和它的工作原理有着一定的关系,它是由Codex模型支持,为了让它能够看懂注释,于是接受像GPT-3一样的语言训练。这些训练让它既能看懂代码,也能看懂自然语言。

而对于GPT-3和BERT这样的超大型语言模型来说,训练用的数据集一般都抓取自网络公共信息,其中就有包含个人敏感信息在内的数据,比如姓名、地址、身份证号等。

这一次的意外是因为这款AI编程工具受到了错误代码的影响而造成的,所以这位网友才会看到了关于B站CEO陈睿的个人信息。也因为这一次的意外,让人们意识到了它在安全隐私上存在着诸多的风险。

总结:其实早在GitHub Copilot这款编程工具上线以来就争议不断,除了安全隐私上的风险外,它还有没有开源许可证以及直接照抄源代码的争议。

查看全部

同类推荐

精品推荐

网友评论

同类下载