新闻中心

历史学专业是如何分析数据的呢?(历史学专业行业分析怎么写)

2023-11-02
浏览次数:
返回列表

对于经济学、商科的学生来说,使用数理统计的方法做文章的套路可能理所当然:观察到一个现象,提出因果关系假说,收集大量合适的数据跑回归,得出结论,再对结论做robust检验,基本上这篇文章就能立住了。

但是遗憾的是,很多时候,这个套路在历史研究当中是行不通的。

首先,年代越久,数据缺失的情况越严重。你做一个当下的上市公司,几年的年报拿到了,所有数据一应俱全。但是你做一个历史问题,可能每个三五年拿到一组数据。从这些数据里你可以看出一些基本趋势,但跑回归远远不够。一些做计量的人文章很奇怪,年代断限当不当正不正的,为什么?因为就这一段数据相对全,前面缺,后面也缺。但其实这个起止节点,和重大历史分期可能一毛钱关系都没有。诸如此类。

其次,数据的错讹造假问题更难验证。你拿到了古代国家进出口贸易量的增减变化,你用来分析变化趋势,那走私的数据你没有怎么办?或者说官方贸易数据本来出入对不上,是做的假账你如何得知?于是一些人跑出来的结论,会和文献记载的社会常态相去甚远。

根据之前经验观察,我觉得对于16世纪以来东亚和东南亚海上贸易史的研究,是坑比较多的领域。因为总有人能零零碎碎搞到一些独家的航海日志和货物记录,然后自己有哪一段就用计量手段处理哪一段,自己有哪类货物的资料,就去处理哪一类资料,最后做出来一些非常奇怪的东西来。的确,只要你用他选的这些数据,用那套算法,就能得出那个结论。但是这种数据选择方式合理吗?他说合理就合理,你没有其他数据可以拿来反驳他。

当然,确实有一些人把计量玩得很好,但这对数据本身的靠谱性依赖程度太高了。那么除了这些搞计量的人,其他历史学家怎么用数据呢?仍然是通过各种文献档案的综合分析,发现问题,提出假设,而有限的是数据材料,与文献互证。比如说某个结论,我们可以从其他文字材料中获得巨大支撑,那么我们通过有限的数据,发现两者是相互支持的,就可以成立了;但如果要抛开其他文献,单用数据回归出一个结论,操作也难,也并没有必要。

所以总结一下我的观点,在很多情况下,历史数据不是要什么有什么,而是只能有什么用什么,而且存在数据缺失,真伪不易鉴别等问题,而且没有人可以重现历史场景,没法通过数据分析的方式检验结论的强健性。现在都说大数据时代,数据越多,统计学的威力越大,算出来的东西越靠谱。但反过来也是一样,数据越少,统计学的东西也就越巧妇那位无米之炊。

我觉得对于做19、20世纪研究的人来说,很多东西有了相对完整准确的档案记录,学习一些数理方法,可以做出一些前人没关注到的东西。但是时间越久,采用数理方法就越需要慎重,如果数据本身选择的不合适,不仅无法呈现规律,还会把整个研究引向奇怪的方向。

——————————————————————补充—————————————

跟一些知友沟通之后,发现对于这个问题的讨论可能没那么简单。

我不知道大家能不能认可一个前提:经济学家研究的经济史,不同于历史学家研究的历史上的经济问题;法学家研究的法律史,不同于历史学家研究的历史上的法律、制度问题。同样,在历史学的范畴内,用数学的方法处理数据,不同于把历史问题当成一个数学问题去处理。

一个数学问题,可以去逻辑推理,可以去归纳演绎,得出的结论可以被应用到经济等学科的实践当中,指导实践。但对于历史学来说,再完美的建模,再好的推理,如果推导出的这个演变本身是没有充分的史料支撑的,这个论证过程就不能成立。 如果你是搞政治学的,你拿历史说事,研究出一个新理论,应用到当前的社会实践中,这可能是个好的研究。但作为历史学,你搞出了一个直接证据不足的理论,来解释历史,可能随时都会被新出现的证据推翻的。我个人还是坚持认为,历史学是一个很实证的学科,有一分证据说一分话。我们研究的是每一分证据所传达的信息,而不是把没有证据支撑的空白部分圆起来。不是说这个填空的工作没有意义,而是说这不属于历史学的范畴。仅代表个人观点。

搜索