什么叫做「无偏见数据挖掘」?

关注者
67
被浏览
7,234

4 个回答

有许多数学工具可以帮助我们发现数据之间的关系,但大多数需要先验知识。如果你是从一张白纸开始,那么问题会变得十分困难。现在,MIT、哈佛和布洛德研究所的研究人员在《科学》上的发表了一篇论文,提出了无偏见的数据挖掘技术,不需要先验假设就能寻找出大数据集中变量之间的关系,即没有偏见的数据挖掘。web.mit.edu/newsoffice/

研究人员的研究技术发现 ,此图描绘的关系,在人的肠道中的微生物的含量的数据的0.25%。

图片来David Reshef

a technique that is independent of any assumptions about the data

一种技术,独立于任何数据假设

“The fundamental idea behind this approach is that if a pattern exists in the data, there will be some gridding that can capture it,” Reshef says. And because the cells in a grid can track a curve as easily as they can a straight line, the method isn’t tied to any particular type of relationship.

数据中若存在某种模式,就会有相应的网格获取它。网格中的数据点能像记录直线一样记录曲线,而不依赖任何特定的关系模式。

为什么?