历史学专业是如何分析数据的呢?

论坛 期权论坛 期权     
Chronicle   2018-9-28 00:20   4987   10
据我所知,中国的大学复旦等众多985院校历史学本科硕士,是不学习数理统计、及数据处理分析工具的,至少不作为必修,那么大部分学习研究者都没有这方面知识储备的。那么作为不懂得计量等知识的历史专业学生、甚至拿到博士学位的学生,有一个很严肃的问题,那就是搜集到了历史数据,却不会用强大的分析工具和方法去分析。比如要判断两个历史因素有没有因果关系,却不懂得回归分析等。那么你们是如何分析历史数据的呢?如何洞察数据信息背后的规律呢?还是说你们只是搜集数据和信息,分析则由专业人士去做呢?
分享到 :
0 人收藏

10 个回复

倒序浏览
2#
杨小树  1级新秀 | 2018-9-28 00:20:06
这个问题很有意思,科技史了解一下?
曾经做医学和数据打交道不少,选题时老板就多次提出把统计知识应用到研究中,我觉得想法很好,但出于对实验从设计开始就需严格把控、实验过程中稍有松懈就可能没有办法分析与实验目的相关的因素(不是分析不出来,是没有办法分析,数据脏了心痛的感觉了解一下)等的了解,我没有答应得很圆满,事实证明我是对的。
先介绍一下我们教研室,招生计划上写的就不多说了,就兄弟姐妹们的课题,医学相关的疾病史、概念史、**科史、*人物史等十分丰富,印象最深的是一位师姐做了民国时期报刊杂志等媒介上的医疗广告史,某师兄做了北医汤尔和老校长的历史,某师兄做了自己擅长的某药物研发史,某师姐做了 WHO 与中国建交史,我亲师姐做的民国时期胰岛素传入中国后应用于糖尿病患者的整个历程(题外话,我的课题差点就也定这个了,后来因某院病案室民国时的病例资料不给看,说他们自己也要研究时间冲突加上胶卷珍贵巴拉巴拉反正不给研究,很无奈换了课题,但现在也没见他们研究出个鸟;帮师姐在图书馆翻出过 60 年代一篇用马克思主义治疗糖尿病的论文,很正经的论文,当时我和师姐是有些惊的),学生的方向很多、很自由、也很丰富,老板们的研究一般就比较高大上了,不赘述。
我们教研室一般选文化冲突一点也不隐晦的民国,根据需要前后会扩个十几或几十年,一方面是话比较好说,另一方面史料也相对丰富一些,选了方向做个毕业论文完全没问题的。但在参加各种会议时也见很多惊奇的方向,印象表较深的是和南开、 UCL 合办暑期班中有个小组做的道医炼丹炉的历史,惊,有时候觉得歪果仁对我国传统文化的兴趣点是很迷的,但也很有意思。
言归正传,我们是如何分析数据的?
在相关的课题和方向中,我的方向应该是数据最多的,30年代初局势差不多稳定了一些后,卫生署每年的年报、北平各卫生事务所的年报、上海市卫生局的年报、南京的年报等,我理了很久,北大图书馆还是有很多可用资料的,夸一下,顺便吐槽国图的胶卷只给看不给拍,打印好像两块钱一张辣么贵,我第一次印了二百多后来和老板合计了一下关键的就偷偷拍了不关键的全靠我的手和脑子记,穷,没办法,国图的史料为什么不免费给大家使用呢,遇见那个湾湾的老爷爷千里迢迢来看史料也不给人优惠人家没有这样的方便的位置和手写速度了啊喂,*&%……&&=(
再言归正传,我整理的数据,只有当时的机构要记和想记的,我想分析彼时采取的医学干预手段和A、B、C 有没有因果、相关关系?不好意思,A、B、C 的数据根本拿不到,只能从报刊、通知等侧面推论,数据缺失,对我这样的人来说是最大的问题,做不了数据分析,只能做个图、表在毕业论文上好看一下,趋势分析都没有。
不过,是有很多从民国数据库中某词出现频次与时间关系推论某概念、意识流通的研究,和题主问的数据有点关系,但因果分析甚至其他答主提到的卡方分析,基本不存在,因为根本拿不到适合用的数据。
我偷拍的照片、手记都还存着,希望有一天有同学拿到了A、B、C的庞大数据,我可以提供我找的史料,免费的,满足条件就分析一下数据咯,毕竟也是泡在国图和图书馆那么久找来的,不用很可惜的,我好像也没有时间再去泡几年找相关的史料做做数据分析了.....
蛮遗憾的,啰嗦到最后就说了一句话,数据太脏,暂时无法分析。
3#
Angus Shih  4级常客 | 2018-9-28 00:20:07
没人邀请我,自己来写。
司马亮、赫连镜繇两位贤达已经对史学量化研究谈论的比较多了。这里谨补充自己的另一条思路。我想,这里所谓的Data不仅仅指的是数字一类的狭义「数据」,也可以理解成更广义的「材料」。如是,则所谓「数位人文」就是一种数据分析的方式。简而言之,数位人文(Digital Humanity)是运用电脑来处理大量数据(所以跟大数据也能沾边),以得出一个传统史学较难考察出的观点。这方面的论点,推荐阅读包弼德的一篇文章:Bol PK. The Humanities and the Digital Humanities in Higher Education. Journal of Digital Archives and Digital Humanities. Forthcoming. 具体的研究成果,则推荐谭凯的《中古世家大族的消亡》一书(当然,此书收到了一部分较为负面的评价,却仍不失为使用数位人文进行研究的代表作)。台湾大学有一支团队目前正致力于数位人文的研究,领头的是资讯管理系(也就是大陆的Computer Science)教授项洁,其最新研究成果可参考《數位人文──在過去、現在和未來之間》一书,集结了到2016年左右,项洁及其团队的部分研究成果。
目前而言,数位人文的运用大致上有几类:一是基于传统资料库的整合资料库,比较典型的如同哈佛大学(包弼德团队)、中研院史语所(柳立言团队,我本人也曾在其中)、北京大学(邓小南团队)联合开发的CBDB(中国人物传记资料索引)、比较传奇性的中国哲学书电子计划(初始团队仅一人)等,这些都是从资料库中通过人工、机器筛查的方式,选择出部分关键字词,进行整合。举例而言,CBDB一个最简单的操作是输入对应人名,可以显示其仕宦经历、家族情况、交谊情形等等,能够为研究者提供精简扼要的资料。这些资料库基于史学典籍而来,但仅是对资料的初步处理,本身无法得出足以称之为「研究成果」的结论,故而是比较基础的一类。
二是在上述整合资料库的基础上,做进一步处理的数位人文「工具」。比较典型的是莱顿大学魏希德(包弼德的学生)与普朗克研究所的何浩洋博士开发的Markus和项洁团队开发的DocuSky系统。前者是一个文本标记程序,当导入使用者自定义的文本后,能够通过连上诸如CBDB等资料库,自动标注出文本中的人名、地名、时间等史学研究中主要关注的信息。其中人名参考的是CBDB、地名参考的是复旦大学负责的CHGIS、时间则是何浩洋和魏希德自行开发。DocuSky的作用分两部分,一部分如同Markus,能够实现原始文本的标注、提炼功能;另一部分则同我下面将要陈述的第三类,具有导出潜在「研究成果」的作用。综上所述,这一类「工具」大多基于第一类资料库开发,实际使用上是为了「简化使用者的研究步骤和时间」之目的。
三是输出成果的数位人文「工具」,目前大致又可分为两个大类:一个是地理信息系统(GIS)方向;一个是社会关系网络方向。前者大多是利用上述Markus和DocuSky标注出的文本,建立时空的对应关系(利用CHGIS等确定地点的坐标轴),再使用QGIS或ARCGIS进行绘制,这方面的成果已经不少,且不多加赘述。后者的一个例子是使用CBDB绘制人物关系网络:上文所言,CBDB可以得出一个士人(或一群士人)的交谊情形,这些关系可以简化为一组表格,进而输入如Gephi或Pajek等软件中,绘制出相对应的交谊网络。一个典型的例子是台湾师范大学的李宗翰助理教授(亦是包弼德的学生),对莆田地区士人家族之间的交谊网络的考察。这一类工具,如果使用得宜,是能够产生出「研究成果」的,但目前来看仍然较为少见。
以上是我实际操作中对目前数位人文工具的粗略分类,接下来谈谈我对数位人文的一些看法。简而言之,我认为目前的数位人文远远没有达到成熟使用的程度。原因如下:
1、数位人文工具的可信度不达标。如上所述可见,数位人文工具的使用其实是有嵌套关系的,先使用CBDB等资料库进行检索、再套叠到自己的文本上选取关键信息,最后使用展示性质的软件产出成果。如果CBDB的材料不准确,那么后面两者的正确性就更加无从谈起了。很不幸的是,不论CBDB还是中国哲学书电子计划,其可靠性都远远不足。CBDB起源于Robert Hartwell(郝若贝)的个人读书卡片,进而在其过世后由哈佛大学经营,融入了包括王德毅先生编辑的《宋人传记资料索引》、京都大学《唐代人物知识库》等材料。多种材料来源的融合,导致了人物建档重复、信息不完整、错误信息多等问题,这些都需要通过长期的人工筛查才能够降低错误率。但目前看来,CBDB的决策团队仍然以「求全」为主,「求准」仍在其诉求的其次。最新消息是其希望收入龚延明《宋代登科总录》一书的信息,如果有了解中国大陆史学界对龚延明此书评价的,就知道CBDB不靠谱的程度恐怕又要再上一个台阶了。同样的,中国哲学书电子计划最初甚至使用OCR软件进行文本解读。虽然其建构人声称经过其调教和大量机器学习,其OCR识别古文的成功率已经比Google、Abbyy等公司的都高,但实际使用,错误仍很普遍。目前采用号召使用者自行校对的方式进行降重,但仍然未达到堪用的程度。
現有數位人文資料中比較靠譜的,仍然只有那些最基本的,被「電子化」的文本史料,而且多是由出版公司付費出版使用的資料庫,如北京愛如生、台灣漢籍等。這些一方面仍是收費使用,僅限於各大學和圖書館才能接觸;二是僅僅只是把文本「電子化」,還算不上是嚴格意義上的數位人文。
2、数位人文工具的操作难度较高。虽然这些软件对于个人而言已经轻而易举,但学习成本仍然相对高昂。这里的学习成本要分为两种情况讨论:一是符合其设计目的的使用情况,一种是符合自身学术目的使用情况。对于前者而言,举例如我希望得出一个莆田地区士人交谊的网络,并绘制出一个关系人之间的分布图。我需要先安装CBDB的单机版(一定要单机,网页版不行,则你需要基本熟悉Microsoft Access的操作),通过查询入仕途径得出一个莆田地区所有士人的名单。保存成txt后,再导入回CBDB得出一个这些人家族间的社会网络文件。保存成一个新的Gephi或Pajek文本,再导入进相应软件,绘制出一个图像。至于地图,则需要借助DocuSky和CHGIS的帮助,比较简易的方式是将上述人物关系制作成Excel文档,通过CHGIS手动输入坐标,再导入DocuSky内置的DocuGIS系统中(这里使用的地理坐标,是谭其骧的老图,懂的自然知道其精确度)。以上这些都还是基于你完全理解CBDB、Gephi、Pajek和GIS系统的各种参数、设置之情况。
另一类使用场景是符合自身学术目的之情况。举例而言,我希望抓取所有中古时代墓志中,明确提及参考「风水学说」的篇目。则关于「风水」的词汇,并不存在于任何上述资料库的category中,我必须自己设定关键字、学习python抓爬虫之类的事情,才能够处理上述研究课题。虽然知乎上的大多数CS专业听到这个描述可能会嗤之以鼻,但相信我,一个文学院里用得到这些软件的,大多已经是五六年,甚至近十年没有碰过数学,对电脑的认识只有Office和Windows 的「原始人」,他们的学习能力大部分甚至不足以cover上述软件。这也引出了下一个问题:
3、对于数位人文的想象差异。数位人文工具的建设者可以分为两类:一类是资讯工程背景的学者,他们对于文学院的研究具有「想象的同情」;一类是文学院的教授,他们对于电子时代的科技发展,具有「不切实际的幻想」。这就导致数位人文现在几乎在两者之间打转而一事无成。前者的典型例子是项洁,他和他的团队并不能完全理解历史学者对于数位人文工具的想象,我们需要的是准确度更高的数据、更直观易用的操作界面,而不是一个标注字词就需要三个小程序的所谓整合系统(DocuSky)。但这其实还好,问题更大的是后者,无知的人常有两种情态:一是盲目自大、一是盲目自卑。一部分学者盲目自大地认为,数位人文能解决一切问题。他们以为一种不同以往的skim而非精读,「宏观」而非「微观」的视角能够解决自己的研究课题。殊不知,数位人文工具对于使用者的「提问技巧」有着相较过往更高的要求,一个「有效的问题」是工具得出结论的基础。这一问题往往从一开始就决定了选择的工具、具体的使用方式等一连串接下来的选择。换言之,数位人文工具颇有点「开弓没有回头箭」的架势,同过往史学研究里可以进行微幅修正的方式有较大区别。
4、数位人文的结论更多是呈现、证实,而非新论。GIS也好,社会网络也罢,最后产出的图片本质上只是为读者提供一个更加直观的理解。对于研究者而言,很多时候在资料检索(并且降错)的过程中,脑海中已经形成一个结论或图景了。换言之,这些工具对研究者的帮助是有限的,往往仅能体现在「精细阅读后仍不能得出直观想象,需要进一步依靠图表思考」的情景,以我目前的研究经验来看,这样的场景是相对比较少的。进言之,数位人文工具提供的往往是对过往已有结论的证实。这又有两个原因,一是正如上文所言,我们在早期史料筛查的精度中早就有了一定结论,数位人文工具只是锦上添花;二是在数位人文工具方兴未艾的今天,我们仍然找不到「合适」的问题使其得出具有开创性的结论。换言之,是我们的「想象力」尚未更上工具发展的步伐。但不论如何,数位人文发展到现在,以我的了解尚未得出过完全颠覆现有史学定论的结论(包括谭凯一书的负面评价中,也有一些人认为他只不过是用一些fancy的工具,得出了与史学界已有定论类似的结论)。
综上所述,我认为数位人文工具目前的可用性极低。其正确率的低下使得使用者必须耗费大量时间对资料进行校对(吐槽:有这个时间我还不如自己去翻原始史料),对提出问题意识的质量要求较高,也有仍然较难以克服的操作门槛。但我始终认为这是未来发展的一个重要趋势:未来机器取代人类几乎成为定论的情况下,历史学门如何不被机器取代,取决于我们如何使用机器工作。如何使用机器工作,则迫使我们思考「哪些问题是机器能够取代,哪些问题却是机器不能的?」至少在某种意义上,数位人文工具对使用者而言提出了更高的要求。同样的,身为曾经的半个开发者,我希望尽可能地将数位人文工具的可靠性、易用性升至最高,使得我们能够回归历史研究的本质,也即是「问题意识」。
以上,深夜不得入眠,随性而作,诸君姑妄观之。
4#
芃芃其麦  1级新秀 | 2018-9-28 00:20:08
答主里好像比较少量化历史方面的?
我学经济学,一直是历史爱好者,也不算学量化历史,只是跟着一位经济史的导师做研究。虽然是经济学出身,但是我一直努力尝试用客观的视角看待史学方法。
需要注意的是经济史并不是在历史专业下的,而是在经济学专业下的。严格来说我不能答这个题,毕竟题主问的是历史学专业如何分析数据,但是实际上经常会有经济史学家是历史学专业的或者经济史学家工作的单位是历史学院,因此勉强谈一下,算是作为一个角度参考吧~
经济史学界对于量化历史有非常泾渭分明的两派,一派较为经济学帝国主义,认为经济学的那套计量方法应该被应用到整个社会科学界,应该用经济学的理论、方法研究所有的社会科学问题,个人认为很大程度上计量史学(cliometrics)就是这种思维的产物;另一派坚持传统的史学方法,研究的重点依然是解读文本,用到数据的地方仅仅是收集整理最后列表展示,不考虑什么标准差、组中值,更不用说什么交叉分析、回归分析,他们较为关注历史本身而排斥计量方法这种利用数据进行因果推断全然不考虑历史事实本身的做法。当然,也有折中派,折中派又分为两种,一种认为历史研究需以史料分析为主,通过定性分析从众多的社会经济史实和前人的研究成果中,依据一定的理论(历史观)和抽象推理得来假说,再利用计量方法进行检验;另一种认为计量方法是主体,如果理论在模型中得不到检验那么理论是没有意义的,首先应该使用模型找到因果关系,然后再回到史料中找佐证这一渠道的材料。
计量方法涉及史学研究方法,所以经济史学界对此的争议非常大,计量派以经济学出身的经济史学家为主,时常指责传统史学方法的研究不够“科学”,认为传统史学方法没有使用定量的方式确定因而带有主观性,且认为传统历史学家的研究太过于琐碎没有串联出因果关系。相对应的,定性派(我瞎取的名字,可能不能很好概括这一派的特点)往往攻讦计量派的经济学方法太“无厘头”,妄论历史事实只迷信数据,是把经济理论硬往历史里套。其实不止定性派攻击计量方法,一些经济学家(比如我另一位做宏观经济学的导师)也认为量化经济史的方法是个四不像,既没有讲好经济学故事也没有讲好历史故事。
然而,这种争论的大背景是“经济学帝国主义”,所以毫无疑问的,近年来经济史领域内量化派风头正劲,各大高校的经济史专业纷纷转向量化方法,坚持史学作风慎用计量的大概只有南开了。本来如果这种讨论止于历史学内部,那么个人认为方法论的争议实则是有益于历史学的进展的。但是随着一大批经济学家,拿着有大量缺失值的长时段数据,控制着众多的变量跑回归,得出许多匪夷所思的结论后强行用经济学理论解释而无视史实后,方法论上的争议就更大了。很多经济学家仿佛发现了终南捷径,利用历史数据做个简单回归,得出个颠覆性的结论,再用经济学理论强行解释一番,瞬时就会被各大媒体奉为座上宾。当然也有很多时候好的历史数据可以成为优秀的工具变量,厘清很多现代的经济问题的因果关系,但量化方法因为成果良莠不齐而名声也就不堪了。
其实无论国内外,量化方法自被提出起就饱受争议。下引一段吴承明先生在《经济史:历史观与方法论》中概括的计量史学方法发展历程:
1960年有12位美国学者集会讨论用数学方法研究历史,成立学会,次年定名为Cliometrics(计量史学),该学派主要研究经济史,兼及社会、制度。原来1958年即有J.迈耶和A.康拉德发表《南北战争前南方奴隶制经济学》一文,提出与传统研究迥异的观点。1974年计量史学的领袖人物R.福格尔与人合著《十字架上时代:美国黑人奴隶制经济学》出版,震惊学界。
福格尔在1960年的计量史学会议上即提出关于美国铁路问题的报告,1963年出版《铁路与美国经济增长》,认为过去人们将铁路的作用夸大了。又用“反事实度量法”,即假定美国不修铁路而用马车等其他高效运输工具,结果并不差,与用铁路相比较,国民生产总值相差不过3%。
这种反事实度量法一时成为风气,也受到批判。因为历史事物的存在有其社会的、文化的条件和价值,是不能随便否定的。
一般把1960-1975年看作是计量史学派的黄金时代。这时期他们主要研究历史上的单一命题,提出独特的论点,引起热烈的争论。他们一般是用模拟模型或理论模型,建模不是从史料出发,计量也不尽依靠历史统计系列,而常是寻求“间接度量”数据。除反事实度量法之外,还利用排队、中数等比较研究方法。20世纪70年代以后,计量史学进入第二代,研究方向转向人口问题和宏观经济问题,研究方法也与计量经济史学(此处“计量经济史学”应为“计量经济学”)无甚差异。有些学者如D.C.诺斯、R.P.托马斯则另创新制度经济史。进入21世纪,计量史学已消失生气,混入一般计量经济学分析之中。
计量史学实际上只曾盛行于美国。在欧洲虽有短暂反应,但不成气候。20世纪70年代在苏联一度颇有发展,而主要是在史学界而非经济学界。在中国则无响应。
我个人其实更倾向于吴承明先生倡导的历史研究以史料分析为主,通过定性分析从众多的社会经济史实和前人的研究成果中,依据一定的理论(历史观)和抽象推理得来假说,再利用计量方法进行检验。对我而言无论是定性还是定量甚至经济学理论都只是研究历史的工具,经济史虽然是在经济学下的分支学科但其本质是历史。历史不应该成为经济学的研究工具,经济只是社会的一部分,历史研究的是整个过去的人类社会,一定程度上历史是包含经济的(毕竟经济也只能研究过去发生的经济活动,既然已经发生了那就成为历史了)。
最后用我的亲身经历介绍一下经济史如何分析数据。我一共参加过两个助研工作,一个是近代生活费指数、工资指数、物价指数相关,一个是土地改革相关,两个助研工作都是数据收集、处理、整合。前者利用报刊数据库的报刊影印资料把所有的扫描件下载下来(团队中也有人是负责去各地档案馆把数据抄录下来),两个主要报刊数据库中相关的资料共有一万余条近两万条,两个人花了一个多月的时间筛选掉无关的或者零散的统计数据最终下载下来的有五千余条。下载下来后按地区分类,再手工录入至excel中。中间因为各种事耽搁了两三个月,最终这些事情干完一年过去了……而这只是整理数据,还没有涉及分析。另外一个土改相关更为复杂,数据没有影印资料,全靠一位学姐在北大图书馆拍摄县志。据曹树基先生统计全国县志共有六千余本,我们把北大的县志录完共有三千余本县志。(我和学姐说共有六千余本的时候学姐差点崩溃)学姐把县志中与土改有关的部分都拍下来放到云盘上,我和两个室友把县志中乱七八糟的表格甚至是文字表述整理成格式统一的表格。整理过程中涉及很多历史背景知识,包括折亩、成分的定义等等,我室友不了解这些我还要再给他们科普。这次整理数据花了两个多月,但当时几乎是下了课就理数据,没有双休日地干了两个月。
还有一位我导的师兄,经济史博士毕业去了业界,但是此公每逢周末就坐在图书馆里把县志中的清代土地数据数字化,凭一己之力硬是理完了整个山东省的数据。这种毅力真是常人所不能及的。
讲这么多只想说对经济史而言数据十分重要,把数据理出来已经是一个非常伟大的创举,其中的繁杂、枯燥真的不是没有兴趣的人可以忍受的,而如果没有这些数据后续的研究可能就无法展开,没有这些数据(尤其是人口、土地数据)只有文字的记载就无法有理有据地做出一些历史假设。
————————
再讲一个常见的误区——认为中国古代数据很少、不可靠。其实明以后的数据还是很丰富的,也较为可靠,但是静得下心整理数据的学者不多。至于明以前的数据那真的是很少。
————————
再补充一个投稿的问题。量化方法在投稿方面也处于一个很尴尬的地位。传统历史学期刊一般比较排斥量化方法,当然如果做得好的话也会收,经济学期刊一般比较排斥经济史领域,除非编辑本身比较爱好经济史还有被收的可能性。经济史领域内的顶级期刊(无论中文期刊还是英文期刊)在许多高校的期刊分级里属于B刊,所以如果投经济史期刊哪怕投到了顶级期刊其实对于博士毕业、职称评定都是不利的。
————————
最近看到几篇论文也是讨论历史的研究方法的,作为推荐阅读放在这里吧~
[1]陈争平.大数据时代与经济史计量研究[J].中国经济史研究,2016(06):53-58.
[2]梁晨,李中清.大数据、新史实与理论演进——以学籍卡材料的史料价值与研究方法为中心的讨论[J].清华大学学报(哲学社会科学版),2014,29(05):104-113+178.
[3]陈争平.经济史研究若干基本问题探讨[J].中国社会经济史研究,2013(01):99-104.
[4]陈争平,常旭.梁方仲对经济史统计工作的贡献——兼评经济史研究中的统计方法与计量经济学方法[J].清华大学学报(哲学社会科学版),2011,26(02):150-157+160.
[5]王玉茹,张玮.国际经济史学研究的新趋向——从第十五届世界经济史大会谈起[J].山东大学学报(哲学社会科学版),2010(02):66-71.
[6]孙圣民.历史计量学五十年——经济学和史学范式的冲突、融合与发展[J].中国社会科学,2009(04):142-161+207.
[7]隋福民.经济史:一门经济分析的方法[J].中国经济史研究,2009(02):97-103.
[8]陈争平.在多样化发展中注重历史连续性——新世纪经济史学刍议[J].中国经济史研究,2003(03):110-116.
[9]李伯重.历史上的经济革命与经济史的研究方法[J].中国社会科学,2001(06):171-185+208.
[10]吴承明.论历史主义[J].中国经济史研究,1993(02):1-9.
[11]吴承明.中国经济史研究的方法论问题[J].中国经济史研究,1992(01):1-21.
[12]傅衣凌.我是怎样研究中国社会经济史的?[J].文史哲,1983(02):41-45.
5#
奈何红烛灭  4级常客 | 2018-9-28 00:20:09
很多人提到计量史学,那么不妨一问——又有几人了解计量史学的发展趋势?若说其滥觞,当出于马克思的《资本论》。其后的一个多世纪,随着信息时代逐渐到来,在西方,实证主义似乎受到挑战,更有学者声称没有数据分析的历史学无权称为科学。
荒唐,又可笑。诚然大数据的分析与数学模型的建立似乎可以模拟一个最科学、最接近历史真相,换言之即最“客观”的历史图景。然而历史何曾是客观的,历史的核心是何人何时于何地做了何事,千千万万这样的单元组成了历史,这是数据可以总结而后预测的吗?
再言似乎最有相关性的经济史,举一例——明代的大运河漕粮运输问题。漕运数目及其演变趋势是明代社会经济史关注的一个重点,太多的论证我不想多言,前人已有所述。总之明代漕粮数目似以400万石为常例,洪武永乐两朝承上升趋势,而因永乐朝北征与迁都事而达到一个上限。仁宣之后逐渐回归至常例甚至在成化之后下降明显,按常例言我们会想到明的衰落以致漕运衰败,这是一个简单的由数据构成的逻辑。但万历之后晚明之世又因人所共知的原因承上升趋势,但每年又往往有极大波动,若全依数据构建有明一代漕运状况进而分析明代盛衰,结果只可能是大谬。个人观点,把客观的数据分析用于主观的历史,才是某些人对历史学科主观的偏见,这不是科学,这是科学教。
6#
王子长  3级会员 | 2018-9-28 00:20:10
中国有句俗话,叫做活人不能让尿憋死。如果研究生阶段选择需要数据分析的研究方向,比如经济史,那么一般都是自学统计学相关知识。有的学校的历史系确实会开一些数学方面的课程,但相信我,你很难学到什么真正有用的。所以我的一些同学会报一些课外辅导班,我的一个师哥直接报了注册会计师学习班,最后真的考下来了。在这些辅导班里学习有没有用我其实也不清楚,因为毕竟我也没学过。但他们都去学,我想应该是能学到一些东西的吧?反正最后论文答辩他们都通过了。
7#
无住居士  1级新秀 | 2018-9-28 00:20:11
要应用数据方法来做研究,必须具备基础的数据条件:
1.数据量要足够大;
2.数据要全面;
3数据要多维度。
在历史学研究的绝大多数领域,完全不具备这个条件。漫长的古代史及近代史,数据缺失,数据片面。
现存的历史资料不能反映完整的历史事实。如果完全依赖现存的历史资料来做数据分析,就会做出以偏概全的推论。
8#
温朝  3级会员 | 2018-9-28 00:20:12
数学在一门科学中应用的程度,标志着这门科学成熟的程度----恩格斯
就我理解,人是自然界的一部分,自然地,人类社会也是可以被科学的方式解读的。之所以看起来社会复杂,人心难测,无非是学科的发展还没到位而已。比如,一个骰子投下去,只要给出初始的运动数值,根据物理定理可以算出其点数。之所以看起来是随机和无规律,不过是水平不够,算不出来而已,人和社会的变化也是如此。作为人类学的一部分,历史学也是自然史的一种,所以,利用数学工具以及逻辑推演来理解历史变迁,是正确的方向。
看到很多答案在说史书记载模糊稀少,数据可靠性不强,数量不够等等,确实是这样。不过,史书只是寻找历史数据的一种手段而非全部。比如,研究气候变迁与历史发展的关系,气候数据可以钻取冰芯来分析,可以在利用土壤里的孢粉分析。利用古代遗址留下来的动物骨头推算经济生产形态乃至于这几年很火热的利用DNA技术推断人类迁移等等。感觉很多人谈到历史,目光就局限于有文字记载以来的时段以及文本所载。殊不知文字能记下来的东西,比起真实的世界真是沧海一粟。
9#
魏无涯  2级吧友 | 2018-9-28 00:20:13
并不是每一件算得出来的事,都有意义;也不是每一件有意义的事,都能够被算出来。
10#
匿名用户   | 2018-9-28 00:20:14
提示: 作者被禁止或删除 内容自动屏蔽
11#
莫小妍  2级吧友 | 2018-9-28 00:20:15
基本上会更注重于分析数据是否客观和真实吧。因为对于过去的历史数据来讲,真实和客观性都值得考证。数据更多让我觉得是用来论证自己的观点的东西,都是带有目的性的。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:
帖子:
精华:
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP