Clear Sky Science · zh

改造西北边陲:通过历史报刊的计算分析观察民国时期的发展话语

· 返回目录

为何这个边陲故事至今仍有意义

在二十世纪上半叶,今之中国西北——像甘肃、陕西、青海和新疆这样的地方——在全国想象中从遥远的边陲转变为关乎国家生存与未来的核心。本篇文章展示了这一转变并非仅在战场上完成,而是在报纸与杂志的版面上展开。通过用现代计算工具阅读数千篇历史文章,研究揭示了新闻从业者、官员与知识分子如何谈论西北、他们希望在那里建成什么,以及外来入侵和内战如何改写这些憧憬。

从远缘到战略心脏地带

数个世纪以来,中国的统治者将西北视为一道保护性边缘——居住着多样的民族,地形险恶,为农耕腹地提供缓冲。在民国时期(1911–1949),这一边陲获得了新的意义。随着现代印刷媒体的繁荣,“开发西北”的口号在期刊和报纸中广为传播。作者们把这一地区描绘为既是宝库又是屏障:土地、矿产和河流充裕,同时也是抵御来自东面的日本、北面与西面的俄国与苏联威胁的堡垒。自1931年日本占领满洲并向中国腹地推进后,关于西北的讨论愈发紧迫,将其塑造成国家防卫与重建的退守基地。

如何解读庞大的报刊档案

为超越零散的轶事,作者从两个大型历史报刊数据库中汇集了五千多份有关西北的条目。许多资料仅存为质量低劣的扫描页,竖排密集。研究因此构建了一条多阶段的管道,将这些影像转为可用文本:把多栏页分割成段落,使用先进的图像—语言模型识别字形,对于特别模糊的页面则让助理朗读并转录录音。历史字形被转换为现代简体字,所得文本经过细致清洗,以便计算算法能够可靠地识别其中的模式。

Figure 1
Figure 1.

从词语中让主题浮现

在这份清洗后的语料上,研究应用了一种称为结构主题模型的方法。与其从固定主题列表出发,算法扫描哪些词常一同出现并将它们分组为“主题”,每一主题代表一组重复出现的观念。该方法还允许研究者将主题强度与出版日期或地域等额外信息关联。经过对不同模型设置的测试,作者最终确定了26个主题,涵盖关于铁路与道路、灌溉、矿业、城市、教育、民族、国防、重工业等的讨论。该方法还揭示了哪些主题常在同一篇文章中并存,生成一种图谱,显示不同讨论线索如何交织在一起。

报刊揭示了怎样的国家建构图景

所得图景并非单一的发展蓝图,而是两组紧密相连的关注簇。其一以治理与工业为核心:国家规划机构、对边疆省份的行政控制,以及兴建工厂与现代农业的努力。另一组则聚焦于基础设施与自然资源:交通路线、水利工程以及矿产与能源的开采。安全忧虑——关于海外帝国以及后来的日本侵略——把这两组联系起来,促使作者将几乎每一条道路、每一条运河或工厂都框定为国家生存斗争的一部分。文化与教育工作、游记与勘察报告位于网络的边缘,帮助将地方人口与景观纳入共同的国家叙事,但很少独自成为议程的主导。

Figure 2
Figure 2.

危机如何重塑对西北的期待

由于出版日期被纳入分析,研究可以追踪每一主题在1911至1949年间关注度的兴衰。1920年代,当强大的军阀掌控该地区时,报刊突出土地开垦、地方行政与旨在巩固其统治的实验性建设方案。自1931年日本推进并且苏联在北疆造成压力后,文章愈发强调战略性勘察、防御路线与西北在全球地缘政治中的地位。随着1937年全面抗日战争爆发,语调进一步硬化。该地区被描绘为紧急的后方基地,大学、工厂与关键产业须迁移至此,灌溉、重工业与交通项目可直接支援战争。日本在1945年战败后,这种强烈的关注迅速减退,国家滑向内战,其他危机夺去了头条。

这个边陲故事告诉我们关于现代中国的什么

简言之,研究表明西北之所以重要,不仅因为其沙漠和山脉中蕴藏的资源,更因为报刊学会将其话语化为关乎中国命运的中心。在那动荡的三十年间,媒体把它从偏远边缘改造为战略核心,把水坝、道路、学校与移民安置工程捆绑成国家力量与统一的叙事。通过将数字工具与细致的历史阅读结合,文章既提供了媒体如何想象与正当化边陲开发的大尺度新视角,也以此为例说明危机如何将遥远地区转化为国家权力的象征与试验场。

引用: Ren, T. Transforming the Northwest frontier: development discourse in Republican China through computational analysis of the historical press. Humanit Soc Sci Commun 13, 334 (2026). https://doi.org/10.1057/s41599-026-06682-6

关键词: 民国时期的中国, 西北边陲, 报刊话语, 计算史学, 国家主导的发展