

以数位介面研究诗歌的例子:Poemage and Clark Coolidge 的 "Machinations Calcite" 。

数位人文(英语:Digital humanities, DH),是电脑运算资讯科技人文学的交叉学科[2][3],可被定义为以合作、跨学科与电脑运算等新方法来进行人文学的研究、教学、出版等学术工作[4]。数位人文将数位工具与方法带进人文学中,并认为印刷书不再是知识生产与传布的主要媒体。




数位人文的定义正不断地由学者与其他参与者界定中。由于其持续发展、改变的特性,特定的定义可能很快就会变得过时,或是成为对其潜力的限制[5] 。在《数位人文学的辩论》(英语:Debates in the Digital Humanities,2016年出版)一书的第二卷中提出定义此领域的困难:“除了数位典藏、量化分析、以及建立工具的计画等曾经代表数位人文的特征外,数位人文现在涵盖了更广泛的方法:大型图库的视觉化、文物的3D模型、数位原生的学位论文、标签(hashtag)运动及其分析、扩增实境游戏、活动自造者空间等等。在这个广义的数位人文中,很难清楚地定义数位人文工作必须包括什么。”[6]

数位人文自人文计算(humanities computing)发展而出,并于人文计算、社会计算(social computing)、媒体研究等相关。具体来说,数位人文包括了从线上策展到透过主题模型(topic modeling)等方法进行的资料探勘。数位人文使用数位化的资料与数位原生资料,结合传统人文学(如历史学哲学语言学文学艺术考古学音乐学、以及文化研究)与社会科学的方法论,[7] 以及电脑运算提供的工具(如超文本、超媒体、资料视觉化、资讯检索资讯探勘统计学、文本探勘、数位制图)与数位出版。另外,分支学科如软体研究、平台研究,与批判程式码研究也相继出现。与数位人文平行的学科包括新媒体研究、资讯科学、媒体写作理论、游戏研究、文化研究与文化组学[8][9]



尽管数位人文的计画与倡议相当多元,其所反映的价值与方法有些共通之处[10] 。这些共通的价值与方法有助于了解这个难以定义的领域。[11]

  • 价值
  • 批判而理论
  • 反复而实验
  • 合作而分散
  • 开放而可进


数位人文学者透过数位方法回答现有的研究问题,或挑战既有的理论范式,以产生新的问题和开拓新的方法。数位人文的目标之一,是系统性地将电脑技术带入人文学者的活动中[13]。如同今日的社会科学学者一般。尽管数位人文显著的往网络的、多模型的知识型态发展,部分的数位人文计画则专注以不同于媒体研究资讯科学传播学、以及社会学的的方式研究档案与文本。数位人文的另一目标,是创造超越文字的学科,这包括多媒体元数据、动态环境的应用( 参见维吉尼亚大学的“山谷的阴影”计画、南加州大学的“the Vectors Journal of Culture and Technology in a Dynamic Vernacular英语Vectors_Journal_of_Culture_and_Technology_in_a_Dynamic_Vernacular”计画、以及哈佛大学的“Digital Pioneers”计画[14]

愈来愈多的数位人文学者透过资讯方法分析Google图书等大型文化资料库。这类的研究为2008年由数位人文办公室赞助的the Humanities High Performance Computing competition[15],以及2009年[16]、2011年[17]由美国The National Endowment for the Humanities (NEH)主办、美国NSF[18]、英国JISC、加拿大SSHRC共同举办[19]的Digging Into Data challenge中获得重视。除了书籍,旧版报纸也可以透过大数据方法分析[20][21] 。做为大数据革命的一部份,性别偏见、可读性、内容相似性、读者偏好、甚至心情都可透过文本探勘的方式来分析。[22][23][24][25][26][27]

数位人文也与软体的开发相关,如提供“数位原声的知识生产、策展、互动的环境与工具[28] ”,在这脉络下也将此领域称为计算人文学。




数位人文学者使用的工具相当多样,这些工具可能存于移动装置甚至虚拟实境实验室中[30]。一些学者使用进阶的程式语言与资料库,而一些学者则使用较不复杂的工具。DiRT (Digital Research Tools Directory[31]) 提供了学者这些工具;TAPoR (Text Analysis Portal for Research[32]) 则为文本分析的入口。Voyant Tools[33] 是个线上的文本分析程式。Digital Humanities Tools[34] 则整理了许多免费的数位人文研究工具。免费的线上出版平台如WordPressOmeka等也是相当受欢迎的工具。







始于1998年的女性作家计画英语Women_Writers_Project,是个将前维多利亚时期女性作家著作数位化的长期计画。1990年代开始进行的华特・惠特曼档案[36] 则是建立了一个包括照片、音档的超文本资料库。2013年开始进行的埃米莉・狄更生档案[37] 则藏有狄更生的高解析度手稿以及一个包括9000个出现在诗歌中的字词的字典。



2004年开始的WordHoard页面存档备份,存于互联网档案馆) 是个协助不熟悉科技的人文学者阅读、分析的免费应用,收录的文本包括古希腊经典、乔叟莎士比亚、以及斯宾塞的著作。2008年开始的文人共和国页面存档备份,存于互联网档案馆)以互动式地图呈现启蒙时代知识份子的社会网络。 网络分析与资料视觉化也用在呈现数位人文这个领域本身,如呈现数位人文学者在社群媒体上的互动,或以资讯图表呈现数位人文学者、计画相关资料等等。



1995年开始的史丹佛哲学百科是个由哲学学者维护的百科全书。MLA Commons页面存档备份,存于互联网档案馆) 提供了一个开放同侪审查的网站,内容为Digital Pedagogy in the Humanities: Concepts, Models, and Experiments页面存档备份,存于互联网档案馆 (2016)的文物收藏。The Debates in the Digital Humanities页面存档备份,存于互联网档案馆 平台提供了同名书籍(2012年版与2016年版),读者可以划记、参与群众外包的索引编辑等。




4Humanities页面存档备份,存于互联网档案馆) and UCL Centre for Digital Humanities制作的资讯图表。

2014年6月21日开始的Around DH in 80 Days页面存档备份,存于互联网档案馆),以每天介绍一个数位人文计画的方式,以强调数位人文的多样性与全球性。

Around DH in 80 Days页面存档备份,存于互联网档案馆) 展示了数位人文领域的全球性与多样性。



数位人文的滥觞人文计算,可追溯至1940年代晚期耶稣会士Roberto Busa及其助手的研究成果[38][39]。Rboerto Busa与IBM合作,利用电脑建立了汤玛斯・阿奎那著作的索引,称为“Index Thornisticus”[4]。其他学者也开始使用大型主机来自动化检索、排序、计数等工作[4]。接下来的数十年,考古学者、历史学者、古典学者、文学研究者等等,也开始采用电脑运算。[40]

第一个专门期刊为1966年创刊的Computers and the Humanities,Association for Literary and Linguistic Computer (ALLC) 以及the Association for Computers and the Humanities (ACH)则分别在1977年与1978年成立。[4]

很快地,对数位文本标记规范的需求开始出现,首先发展的是Text Encoding Initiative (TEI) [4] 。1987年,第一个TEI计画开始,随后于1994年5月第一版的TEI Guidelines出版[39] 。TEI 形塑了电子文本的学术领域,并成为XML的滥觞。研究者也开始尝试使用资料库与超文本编辑,与传统线性的印刷不同,超文本相互连结的点和线组成[4] 1990年代,美国各人文计算研究中心已经建置了众多的数位文本、影像资料库(如女性作家计画、罗塞蒂档案[41] 、威廉・布雷克档案档案英语William_Blake_Archive等等)[42]这些资料库表现了文字编码在文学资料上应用的成熟与稳健[43] 。个人电脑与全球资讯网的发展使得数位人文得以往设计发展。全球资讯网的多媒体特性使得数位人文工作得以整合音档、影片等资料。[4]

从“人文计算”到“数位人文”的用词转变,始于John Unsworth、Susan Schreibman、和Ray Siemens所编的文选Companion to Digital Humanities (2004),该书试图强调此领域并非“仅仅是数位化”[44]。“数位人文”的提出,创造了两个重叠的领域,即“以现代人文学方法来研究数位对象”[44] ,以及“在资讯科技方法来研究传统人文问题”[44] 。个人电脑系统的使用与对电脑媒体的研究被称为“电脑运算转向”。[45]

2006年 National Endowment for the Humanities (NEH) 发起数位人文倡议组织(2008年改名数位人文办公室),使得“数位人文”一词在美国被广泛接受。[46]

数位人文从上述的小众议题发展为“大新闻[46],2009年于费城举行的 MLA convention中,数位人文学者被认为是“最可见的贡献提供者之一”[47] ,其领域则被视为“下一个件大事”。[48]



Lauren F. Klein与Matthew K. Gold整理了对数位人文的批评:其一、缺乏对种族、阶级、性别与性欲特质等议题的关注;其二、相较于教学取向的计画,更重视研究取向的计画;其三、缺乏对政治的投入;其四、参与者缺乏多样性;其五、著作权问题;其六、资源的过度集中。[49]



有些倡议以数位人文做为眼下人文面临的各种问题的解方:即资金缺乏、反复的辩论、以及对理论与方法论的不重视[50] 。Adam Kirsch在New Republic中称此为数位人文“虚假的承诺”[51] 。 在其他的人文学部门以及社会科学部门面临资金的缺乏与声誉的下降之际,数位人文所得的资金与声誉则正在增加。数位人文在讨论中通常被视为革命性的替代方法,或只是旧瓶装新酒。Kirsch认为数位人文的参与者面临的困难,在于推销做得比研究多,这些工作只是在证实研究方法的能力,而非真的进行分析。就算是做了分析,也只是做些哗众取宠的内容而已。这类的批评也有其他学者提出,如Carl Staumshein即在Inside Higher Education中称之为“数位人文泡沫”[52];Straumshein则指控数位人文是人文学“社团主义的重组”[53] 。一些人认为数位人文与商业的结盟对人文学来说是个好的转变,因为若能提高业界对人文学的重视,增加对人文学研究的资助[54] 。若不是“数位人文”这个名字的包袱,这些计画所获得的资助是不公平的。[55]



不清楚数位人文工具原理的学者对工具的过度信任,他们将资料放入这个“黑箱”里头,不清楚中间发生了什么事,也不知道如何检验错误。洛杉矶加大资讯科学系教授Johanna Drucker称此为“认识论的谬误”,并认为这普遍出现在热门的视觉化工具与科技,如网络图与主题模型工具对人文学工作来说仍过度粗糙[56]



另外也有对数位人文参与者多样性争议的讨论,Tara McPherson将数位人文中种族多样性的缺乏归因于UNIX与电脑的模式[57] 。DHpoco.org上的一个开放的线程最近收集了关于数位人文学科种族问题的100多条评论,学者争论了种族(及其他) 偏见对数位人文学者所使用的工具、文本的影响[58] 。McPherson认为需要理解即使分析的主题不是关于种族,也需要理解、理论化资讯技术对种族的影响。 

Amy E. Earheart批评了在文本获取计画中,从使用简单的HTML的网站,转向使用TEI和视觉化,形成了数位人文的新的“典范”。[59] 先前已经遗失或被排除的作品,现在可以网路上找到新家,但在传统人文学中被边缘化的作品,在网路上往往也被边缘化。根据Earhart的说法,“我们做为数位人文学者, 有需要对目前我们正建立的这个典范展开检验,因为这个典范正倾向传统文本,而排除了妇女、有色人种与GLBTQ社群。[59]



数位人文一直以来被批评不仅忽视传统的人文学问题的系谱与历史,也缺乏做为人文学基础的文化批判。然而人文学是否必须与文化批判连结才是人文学仍是问题[60] 。科学视数位人文为自非量化方法的进步。[61][62]



随著此一领域逐渐成熟,学者们开始认识到既有学术同侪审查的标准模型,对数位人文来说可能不适合,因为其计画通常包括网站、资料库等非印刷的内容。因此评价需要新旧混合的方法[4] 。对此问题的回应之一,是DHCommons Journal的设立,该期刊接受非传统的投稿,特别是在计画中程的数位人文计画,并提供较适合多媒体、跨学科、多阶段性的数位人文计画的创新同侪审查方式。



2012年版的 Debates in the Digital Humanities页面存档备份,存于互联网档案馆提出在教学法在数位人文中是“被忽视的继子”并加了一章讨论数位人文教学[6]。这个问题的成因之一,是赞助主要集中在能提供量化成果的研究而非难以评估的教学创[6] 。体认到此一领域教学的需要,Digital Humanities Pedagogy页面存档备份,存于互联网档案馆 提供了案例研究与在各领域如何教导数位人文的策略。


