2018年3月21日

大数据符合文学分析:数字人文研究在学校里,我

机器学习和大数据并不直观地去手牵手与文学小说的研究;然而,从信息学院教授最新研究 大卫bamman,利用机器学习算法和自然语言处理,揭示了在20世纪的小说与性别有关的令人惊讶的趋势。  

Bamman教授最近出版的“性别在英语小说的转型“在文化杂志的分析与特德教授安德伍德和Sabrina来自伊利诺伊大学读。以下刊物,他们的工作得到了显著媒体关注的文章,包括史密森杂志,经济学家和监护人。所有这些出版物使用不同的算法来识别与文学性别认同问题的探索教授大卫Bamman的工作。

“我的动机上像这样的项目工作的一部分是展示NLP如何可以成为有用的问题之外出商业应用,我们都知道acerca的(像的Siri和谷歌翻译)。文本数据的形式,并使用NLP理性皇冠体育STI结构具有告诉我们一些新的和有趣的皇冠体育世界的潜力。“
大卫-professor Bamman

Bamman教授的作品反映的很多研究在我校的跨学科的方法,并增加了数字人文的不断增长的领域。 Bamman来分机器学习和自然语言处理(NLP)的不同的应用教授说:“我的动机上像这样的项目工作的一部分是展示NLP如何可以为外出来的商业应用问题很有大家都知道acerca(像Siri的或谷歌翻译)。文本数据的形式,并使用NLP理性皇冠体育STI结构具有告诉我们一些新的和有趣的皇冠体育世界的潜力。“

史密森杂志 该分析检查 降低女性角色表现 因为女性与男性作家的比例下降。在研究机器学习方法能够识别趋势单身的人,将有没有因为数据的绝对量之所以能简单。

经济学家 进一步 探索研究成果 通过观察算法使用的Bamman和安德伍德。他们确定使用的算法基础不同,作为与特定性别这样的某些字词的关联。另外,笔者提到了Bamman教授以前 从2013年开始研究 我在其中“能是从42000维基百科电影摘要识别字符刻板印象。”他们关闭了商业,虽然人工智能还没有写文学人,它可以被用来作为一种工具来理解的人文技术多个方面的方法,因为通过教授的研究显示Bamman。

在文章中 守护者 着眼于教授的这一结论 更少的女性作家少的女性表示的装置 因为在小说男性作家对写作的女性角色为他们的小说性。笔者注意到,在表示数据“性别的界限作为移至小说的模糊进入20世纪。” Bamman教授通过这些研究结果感到惊讶ACE好,告诉我们:“我想准备什么是如此迷人这些发现他们是如何形成鲜明的。我在维基百科和Twitter上的性别偏见所做的工作,并预计将在这里找到一些定性的差距,但在男性和女性作家,以及如何分配注重男性是女性角色其实只是令人咋舌的区别“。

their_first_quarrel_gibson.jpg
大卫bamman
大卫bamman
graphs showing representation of women in fiction
来源:经济学家

最近更新时间:

2018年3月22日