您现在的位置是:首页 >教育 > 2020-11-24 09:10:19 来源:
测量空间依赖性的新方法将更少的数据转换为更多的数据
导读 机械和航空航天,生物医学以及土木和城市工程学院教授,纽约大学丹登工程学院的城市科学与进步中心(CUSP)成员Maurizio Porfiri提出了
机械和航空航天,生物医学以及土木和城市工程学院教授,纽约大学丹登工程学院的城市科学与进步中心(CUSP)成员Maurizio Porfiri提出了一种基于网络和信息理论的新颖解决方案,通过将通常用于时间序列的数学技术应用于空间过程,使“小数据”发挥更大作用。
这项名为“研究小型数据集空间依赖性的信息理论方法”的研究以皇家学会A:数学,物理和工程科学论文集的封面为特色,描述了如何从有限数量的少量属性样本中根据位置,观察者可以对影响进行有力的推断,包括对共享相似关键属性的中间区域甚至是远距离区域进行插值。
“大多数时候数据集都很差,”波尔菲里解释说。他说:“因此,我们采取了一种非常基本的方法,运用信息论来探索时间意义上的影响是否可以扩展到空间,这使我们能够处理非常小的数据集,只有25到50个观测值。” “我们正在为数据拍摄一张快照并绘制连接(不是基于因果关系,而是基于各个点之间的交互作用),以查看系统中是否存在某种形式的基础集体响应。”
该方法由Porfiri和西班牙卡塔赫纳技术大学定量方法,法律和现代语言系的合作者Manuel RuizMarín开发,涉及:
将给定的数据集合并为一小段可允许的符号,类似于机器学习系统可以识别像素数据有限的面部的方式:下巴,che骨,前额等。
应用信息理论原理来创建非参数测试(该测试不假设位置之间相互作用的基础模型)来绘制事件之间的关联,并发现如果知道某个特定位置的不确定性,是否可以减少特定位置的不确定性另一个位置的不确定性。
Porfiri解释说,由于非参数方法没有为节点之间的影响提供任何底层结构,因此它在如何关联节点甚至定义邻居概念方面赋予了灵活性。