讨论班 | 函数型数据、统计基础、网络分析(2021/10/4-2021/10/17)
1、讨论班简介
函数型数据讨论班
本讨论班的研究主题是函数型数据的平滑方法、主成分分析、典型关联分析、线性模型、微分方程与算子等,有助于大家在日常的学习研究当中从函数型数据的角度分析问题,剖析复杂数据下的本质特征,获得更合理、更直观的数据解释。
统计基础讨论班
本讨论班目前主要参考书籍为《Statistical Models》(A. C. Davison,2008),开展目的是为新生补充研究生阶段所需的统计方面的基本知识。
网络分析讨论班
本讨论班讲授的主要内容是《Social and Economic Network》,旨在让大家对社会网络和经济网络分析有一个全面的认识,为理解和分析网络奠定理论基础。主要研究内容包括随机网络模型、网络结构分析、网络传播与渗透阈值、博弈论等。
2、时间及地点
3、本期内容概述
函数型数据讨论班
函数型数据主成分分析 (FPCA)
主成分分析(PCA)是一种多元数据线性降维方法,可用于提取重要指标并对原始样本进行压缩。函数型数据本身是一个关于时间和空间的函数,因此也可以被视为无限维变量。
这一节中,我们将首先讨论如何在函数型数据上应用PCA来提取主要特征,并在后续引入对函数型数据主成分分析(Functional PCA, FPCA)进行平滑化的方法。最后,我们会介绍如何在函数型数据上定义典型相关性分析(CCA)
统计基础讨论班
10月9日:参数估计与假设检验
本节将从不同方面来介绍参数估计的原理及相关统计量的性质。从估计形式来看,参数估计可以分为点估计和区间估计。从估计量的构造方法上来看,有矩法估计、最小二乘估计、似然估计和贝叶斯估计等。同时,本节还将介绍多种检验方法,包括似然比检验和UMP检验等。重点讲述原假设的选取法则、显著性水平及P值的定义,和UMP检验的执行方法。
10月14日:缺失数据
数据缺失在与生物相关的数据中非常常见,生物的死亡、研究对象的不配合都会导致数据的缺失。针对不同类型的数据缺失,统计学提出了不同的模型用于缺失情况下的统计推断,而这些模型引申出了一种被广泛使用的计算极大似然估计的算法,即EM算法。本节讨论班会介绍数据缺失的类型,产生的影响,EM算法的基础理论、计算性质以及各种推广。
网络分析讨论班
10月9日:网络搜索
在本次讨论班中,我们主要讨论网络搜索方法。通过实验,我们发现社会网络具有可搜索性:即使每个人只了解自身的社交群体,而不了解整个社会网络,仍然只需要少量的几次传播,就可以将信息传递给某个特定的人。因为传统的网络模型往往不能刻画这一特点,所以我们需要设定一个具有可搜索性的网络。我们可以在随机搜索的基础上,加入网络结构(比如度分布)和节点特点(比如人的性别、职业)的信息,利用网络中的同质性提升其可搜索性。
10月14日:Learning and Networks
Social networks play a central role in the sharing of information and the formation of opinions. It is important to understand how the structure of social networks affects learning and the diffusion of information. We will answer the following fundamental questions:
1. whether individuals in society come to hold a common belief or remain divided in opinions;
2. which individuals have the most influence over the beliefs in society;
3. how quickly individuals learn;
4. whether initially diverse information scattered throughout the society can be aggregated in an accurate manner.
