新闻中心
网络数据的统计分析-R语言(数据分析报告r语言)
1.1 为什么研究网络?
广义上,网络被定义为“相互连接事物的集合”。
数学上通常用各种图来形式化网络。
20世纪中叶,随着运筹学和计算机科学领域的发展,网络在运输、分配等问题中成为一种主要方法。此外,社会学家也开始利用网络表示社会群体的互动关系。
20世纪90年代中期,在统计物理(系统中组件的交互,如何产生集体行为;系统层面的特征和结果)和计算机科学(网络的概念化、存储、操作,以及利用网络和相关数据进行计算)领域的研究者的推动下,人们对网络以及用于复杂系统建模和分析的网络方法的兴趣骤增。
网络视角在不同领域的复杂系统研究中都被证明是有效的。
计算生物学:基因、蛋白质、化合物或生物相互作用系统的研究;工程学:如何最好地设计和部署传感器网络;金融:银行间的相互影响;营销:让接受产品的过程类似“疾病的传播”;神经科学:探索与癫痫有关的脑电变化模式;政治学:研究一个群体的投票偏好在面对内外部影响如何变化;公共卫生:传染病在人群中蔓延,如何有效控制。1.2 网络分析的类型
网络可视化
网络特征化
网络建模与推断
数学模型:网络生成概率模型,试图描述一个特定的机制或原理。统计模型:通过观测数据拟合,利用统计推断的形式和准则评价评估拟合效果网络过程
作为表示复杂系统元素间关系的对象,网络图通常是网络分析的首要关注目标。
很多情况下,最终感兴趣的是系统每个元素的某些属性值。例如:根据朋友的属性,预测用户的属性(可能的消费偏好),以达到营销目的。
静态网络过程:利用蛋白质相互作用网络中紧密连接的蛋白质簇团,将信息从已知功能的蛋白质推广至图中未知功能的邻居节点,实现对蛋白质供能的计算预测。
动态网络过程:疾病通过人口的传播可以通过网络图建模为二元动态扩散过程。
1.3 R的igraph包
目录:
第3章:网络可视化
第6章:网络建模的统计方法
第7章:网络建模的特例
第8章:静态的网络过程
第9章:动态的网络过程
第10章:网络中的流
代码:sand包