303. 想学吗?我教你啊!(二合一)(2 / 2)
“这一方面我们可以看到数据的强大,人工智能的强大,另一方面我们也发现个人的隐私在这个大数据的时代面前真的是无所遁形,不知道大家对于这样的问题怎么看待。比如说马芸先生您会根据我点击的某些商品信息分析我的生活状况吗?”
“大家都在担心隐私的话隐私不会出大问题,所有人不担心的事情才会出来,19年前我在燕京讨论过互联网,和一批专家,19年以前华国已经有20多个互联网专家了,他们那时候担心很多东西,我发现今天一点都没有出来,但是他们不担心的事情今天都出来了。”很显然,马芸的策略是避而不答。
你问他会不会分析生活状况,他答你担心的问题不会出大问题。
名义上似乎是回答了,让你安心,实际上什么都没有承诺。
到时候真的出了大问题,也不是他马芸的问题。
“我相信10年以后人类一定能解决隐私的问题。第一,人类会适应。今天其实已经搞不清楚有没有人知道伱了。第二,大家都担心的这条路不会出交通事故,大家觉得没交通事故的地方才会出交通事故,我对未来这些天天充满各种产品想象的人是充满信心的。”
马芸一招【后人的智慧】,将自己的锅甩得干干净净。
这是非常经典的应对四部曲,在你面对一些情况什么都不想做的时候,可以分四步走。
第一阶段,宣称什么事都没有发生。
第二阶段,声称也许有事发生但我们不该采取行动。
第三阶段,说也许我们应该采取行动,但是我们什么都做不了。
第四阶段,也许当初我们能做点什么,但现在已经太迟了。
听马芸这话的意思,现在差不多是处于第二阶段。
“我想这也是每个互联网公司的通病,不可避免地会掌握到用户的隐私数据,这个问题大家都没法避免。”最后马芸以一个拖所有人下水的方式结束了自己的答话。
意思是天下乌鸦一般黑,你也别说我什么了,我能有什么办法呢?
这的确对现阶段的互联网来说是非常忌讳的一个话题,李彦弘与张朝阳也出言帮腔:“很多人觉得我有很多数据,被那些大的互联网公司掌握了,所以我的隐私受到了侵犯,这些互联网公司其实是一堆服务器,没有人会真正地把它拎出来仔细地看一看某一个人在干一些什么事情,正是因为这样的原因,像马芸说的我买什么东西,他技术上的确可以知道,但是他不会去看。”
“我想,这对于孟繁岐来说也是一样吧?不论是做短视频平台还是做人工智能,都需要大量的用户数据。我想即便是我们算法届、人工智能届的风云人物,在隐私方面也没什么办法。”有人帮腔之后,马芸觉得话题再次回到了安全区域内。
刚刚锤了强东,现在话题回到舒适区,马芸觉得自己又行了。
面对孟繁岐的两次提问,他自然也要反击回去,将这个球踢到了孟繁岐的脚下。
但他完全没有料到,孟繁岐从最开始就考虑到了数据隐私问题在人们心中的比重是越来越高的。
“实际上并不是这样,AI视界对所有用户的数据以及各方面存储都是全本地的。当然了,在相同账号登陆不同设备的时候,App会自动申请数据互通,获取积攒在常用设备上的个性化设置信息。但在平时使用,以及人工智能模型训练的时候,视界是不获取任何用户数据的。”孟繁岐心说这球真是秒传啊。
重生者的预先准备,你想象不到啊!
此话一出,七位大佬的表情瞬间产生了变化。
还未表态的几位暗自庆幸,这样一来,即便自己后面被问到,也只要说自己在探索在研究这方面的技术就好了,不会跌份。
而刚刚已经表过态的,可就有些尴尬了。
尤其是言语之间拉了别人下水,说着什么【大家都一样】,还自信将话头转向孟繁岐的马芸,此刻就显得有点小丑了。
“不是这怎么可能呢?那你不读取用户的隐私数据,是怎么把AI视界App的推荐策略做得这么好的?”马芸这时候的用意已经不是发难,而是单纯的不理解和好奇了:“还是说你就不做这部分数据的训练了?”
短视频的推荐和马芸的核心业务,商品推荐有异曲同工之妙。
短视频推得好,能够大大增加用户的逗留时长,观看时长;商品推荐则能够总体提升用户的消费总额,都是非常致命的关键技术。
算法做得好,短期就涨个三五成完全不是难题,长期叠加下来,创造的价值简直无法估量。
这个部分的东西正是孟繁岐最擅长的,不依靠这些算法,他也不可能从人工智能跨界过来,第一战就拿下了短视频平台的大把流量和用户。
这么大的用户量和数据,马芸当然清楚它对推荐算法的价值。
毕竟tb做这个也做很多,马芸当然不信孟繁岐会不用。
在他看来,孟繁岐就是为了自己能有数据才来的互联网,怎可能舍本逐末?
“这部分数据当然是要做训练的,但我觉得并没有必要读取到公司的服务器上。”
“从个人的角度上,我其实基本赞同李彦弘的说法。互联网公司手里的数据实在太多了,没有人会仔细去看某一个人的数据,某一个人的情况。”
“等再过个几年,面对日益恐怖的数据量级,一个人可能一辈子也看不完有些公司一天产生的数据。人们最担心的隐私问题,将不是因为没人能够查看他们而解决,而是因为根本看不完而解决。”
这着实有些荒谬,就像是小偷不偷你家的钱,不是因为你的保险柜足够强,而是因为他的钱已经太多了,用不完了。
“既然互联网公司本身就不需要,也不会去查看这部分信息,那为何又要在服务器上面存放它们呢?我正是本着这种思路,这才尽可能地少存放了用户的数据。”
“至于大家关心的那部分问题”孟繁岐笑了一下,也没有绕弯子,直接摊牌了:“我也只是做了一些分布式的专门处理罢了。我派发了模型的一小部分在App中,在用户的本地做了一部分运算,这样回传过来的就是人类已经无法解读的隐藏层状态。”
“虽然这部分状态已经不可逆,无法反推用户的数据本身了,但我们在状态回传的过程当中,还是有二次保险。相同区域或者相同时间段的回传数据,会一同添加一些微量的噪声。这部分内容在我们的服务器上会继续运算下去,得到最终的结果,计算梯度,并反向用于更新我们的算法模型。”
“一个庞大的算法模型,并不一定需要训练所有的部分,因此我们只更新绝大部分存留在视界公司本部的即可。切分到用户端的那一小部分,一直维持不变,这样我们就不需要频繁地使用客户端的计算资源,或者持续更新那部分内容了。”
“当然了,这样做的话,每隔几周可能会使用用户几分钟计算资源。如果用户信任我们的话,也可以在设置里将隐私计算默认的开启状态关闭掉,这样你的数据就会上传到服务器,我们也就不再会偶尔使用你的终端算力。”
孟繁岐简要地解释完了这一套操作的流程,看向将球踢过来的马芸,有些不怀好意地说:“想学吗?我教你啊!”