date
icon
password
博客链接
Pin
Pin
Hide-in-Web
Hide-in-Web
网址
type
slug
tags
category
bottom
bottom
Hide-in-Config
Hide-in-Config
comment
status
summary
昨天晚上在保研复试时老师问及数据孤岛是什么意思,我回答了数据孤岛在联邦学习中的表现形式,但老师却不认同,当时老师所了解的“数据孤岛”应该是边缘 AI 中的表现形式,因此我们对“数据孤岛”的理解有偏差,但其实本质上都是一样的。我回去后搜索了一下,应该这样理解:
数据孤岛指的是数据被分散在不同的组织、系统或设备中,彼此缺乏共享或互通。有很多原因会造成数据孤岛这个结果,只要有这个结果出现就算是“数据孤岛”了。
在联邦学习中,各个企业之间都有自己的数据集,企业之间不愿意泄漏自身的数据给其他企业,导致数据分散在不同的企业之间,缺乏互通与交流,因此就出现了“数据孤岛”现象。
在边缘 AI 中,由于各个嵌入式设备分散在多个不同的角落,设备自身能够采集到的数据是有限的,受限于带宽、存储、隐私政策的影响,数据无法集中在中心服务器,这就造成了“数据孤岛”。
上述两个场景中,“数据孤岛”的表现形式是不一样的,但都符合数据孤岛的定义,本质上都是数据分散无法共享。