您现在的位置是:首页 >要闻 > 2020-12-02 17:11:06 来源:

研究人员训练技术工具从书面对话中找到关系线索

导读 社会科学家已经确定了十个维度来描述人际关系的本质,但是很少有研究集中在如何通过书面语言表达这些概念以及它们在形成社会互动中的作用。

社会科学家已经确定了十个维度来描述人际关系的本质,但是很少有研究集中在如何通过书面语言表达这些概念以及它们在形成社会互动中的作用。

密歇根大学和诺基亚贝尔实验室的最新研究已使用众包和一种技术工具来检测这些特征如何以日常语言表达以及它们如何影响社会动态。

该团队使用自然语言处理来预测社会维度,包括人与人之间的关系,例如冲突或支持之一,以及他们所塑造的现实世界社区的类型(例如,富人或被剥夺者)。

“我们首先演示了如何构建模型以测量给定对话中每个维度的水平。然后我们证明了我们的模型在预测对话中存在的维度以及个人之间更高层次的预测方面表现出色”,信息学院的博士生Minje Choi在诺基亚贝尔实验室实习期间进行了这项研究。

“我们还表明,知识或社会支持等层面的水平可能与社会结果有关,例如他们的财富水平或自杀率是多少。”

该研究的第一作者崔和同事使用众包技术首先根据以下10个特征识别消息:知识,能力,地位,信任,支持,浪漫,相似性,同一性,乐趣和冲突。

900多个众包注释者在Reddit帖子中标记了7,855个句子,在电影界中标记了400个,在Enron电子邮件中标记了436个,表明了这10个特征的存在。

然后,研究人员训练了一种深度学习分类工具,以查找这些特征及其在所有Reddit和Enron消息以及电影对话中所表现的关系。

他们还使用了来自Tinghy.org的数据,这是一项游戏化的心理测验,旨在使用10个维度来衡量Twitter用户对其在线关系的看法。他们研究了1,406个独特个体之间的1,772个关系。

除了确定消息中的已知维度外,研究人员还发现:

知识是教育水平和收入的最重要的重要预测指标。

支持的存在和不信任是自杀率的两个最重要的预测指标。

受高等教育程度较高的州显示出较低的冲突水平,这与研究发现仇恨言论是受较低的教育水平推动的研究一致。

财富与减少的表达方式相关,这些表达方式表明观点之间的相似性,这是结构和文化上不同的社区的可能标志。

Choi说,团队的希望是其他人将使用他们的模型来继续探索关系维度和书面交流之间的联系。

Choi说:“对于拥有这些对话数据并想要衡量水平或维度变化(例如,社会支持或数据冲突)的研究人员,它可以用作分析工具。” “它可以用来寻找时间变化(如我们在安然的例子中所做的那样)或社区方面的差异(如我们在美国州级Reddit评论中所做的那样)。