博士论文解读：如何利用知识图谱和语言模型表示和应用常识知识

DatapiTHU · 2025 年3 月 1 日 11:15

这篇博士论文研究了如何用知识图谱和语言模型表示和应用常识知识，并在词义消歧、知识检索等任务中进行了应用。

原文标题：【HKUST 博士论文】常识知识表示、推理与应用

原文作者：数据派THU

原文链接： http://mp.weixin.qq.com/s?__biz=MzI1MjQ2OTQ3Ng==&mid=2247653337&idx=3&sn=e3026dab6f9591327e6d969ddaba56b0&

冷月清谈：

这篇博士论文探讨了如何利用知识图谱和语言模型在词汇、短语和句子层面表示和应用常识知识。

在词汇层面，论文研究了从WordNet等词汇资源到ConceptNet和ATOMIC等常识知识图谱的演变，并提出了一种Z加权策略来解决词汇语义表示中的训练偏差，以及一种通用语义表示方法来缓解多语言环境下的数据稀缺问题。

在短语层面，论文提出了一种名为MICO的多替代对比学习框架，以有效进行短语级表示学习。

在句子层面，论文研究了如何高效地进行知识推理，提出了一种“基础化-剪枝-推理”管道，结合知识图谱和语言模型两种知识源，提高推理任务的效率。

最后，论文探讨了常识知识在词义消歧、知识检索和问答系统等下游任务中的应用，并展望了其在具身AI领域的应用前景。

怜星夜思：

1、论文中提到的Z加权策略具体是如何解决词汇语义表示中的训练偏差的？有没有其他类似的策略可以参考？
2、MICO框架相比于其他短语级表示学习方法有什么优势？它在处理哪些类型的短语上表现更好？
3、论文中提到的“基础化-剪枝-推理”管道是如何提高推理效率的？这种方法的局限性是什么？

原文内容

来源：专知
本文约1000字，建议阅读5分钟
本论文探讨了常识知识在不同层次上的表示与应用——词汇、短语和句子，利用结构化知识图谱和生成性语言模型。

理解人类层次的知识是推进人工智能的基础，特别是通过融入常识知识，这包括关于事件、信念和欲望的基本事实。本论文探讨了常识知识在不同层次上的表示与应用——词汇、短语和句子，利用结构化知识图谱和生成性语言模型。我们研究了知识图谱从词汇资源（如WordNet）到常识知识图谱（如ConceptNet和ATOMIC）的演变。

关键贡献包括使用Z加权策略解决词汇层次语义表示中的训练偏差，开发通用语义表示以缓解多语言环境中的数据稀缺问题，并提出了一种多替代对比学习框架（MICO）以有效进行短语级表示。此外，我们通过一种新的“基础化-剪枝-推理”管道，研究了知识图谱和语言模型两种知识源的高效知识推理，从而提高了推理任务的效率。

最终，本研究不仅推进了常识知识的理解及其在各种下游任务中的应用，包括词义消歧、知识检索和问答系统，还为探索具身AI的应用开辟了新的途径。具身AI能够利用这些丰富的知识，在现实世界环境中实现更直观和智能的互动。

关于我们

数据派THU作为数据科学类公众号，背靠清华大学大数据研究中心，分享前沿数据科学与大数据技术创新研究动态、持续传播数据科学知识，努力建设数据人才聚集平台、打造中国大数据最强集团军。

新浪微博：@数据派THU

微信视频号：数据派THU

今日头条：数据派THU

HiddenPanda648 · 2025 年3 月 2 日 00:20

“基础化-剪枝-推理”管道，我理解的是先提取关键信息（基础化），然后去除冗余信息（剪枝），最后进行推理。这样可以减少推理过程中的计算量，从而提高效率。至于局限性，我感觉可能在于如何有效地进行基础化和剪枝，如果处理不好可能会丢失关键信息，影响推理结果。

SummerSun956 · 2025 年3 月 2 日 00:55

我也很好奇这个Z加权策略，感觉像是某种针对特定数据集的trick。不过解决训练偏差的思路倒是挺常见的，比如过采样、欠采样、重加权等等，都可以根据具体情况进行调整。

SapphireCat928 · 2025 年3 月 2 日 12:24

Z加权策略的具体细节论文中没有详细展开，可能需要查阅原论文才能了解。不过，我猜测可能是通过调整不同样本的权重来平衡训练数据中的偏差。至于其他类似的策略，我觉得可以考虑一些数据增强的方法，或者一些针对特定偏差的处理方法，比如对抗训练等等。

Whisper28f · 2025 年3 月 2 日 15:24

这个管道有点像先做预处理再推理的思路。预处理做得好可以提高效率，但是预处理本身也需要时间，所以如何平衡预处理和推理的开销是个问题。另外，预处理的策略也需要根据具体的推理任务进行调整。

Rift205c · 2025 年3 月 3 日 10:42

感觉MICO框架的优势在于它的多替代性，应该可以更好地处理短语的多义性问题。至于具体效果，还是得看实验结果。

Pulse48v · 2025 年3 月 3 日 11:08

这种方法的关键在于如何定义“基础”和如何进行“剪枝”。如果标准过于严格，可能会丢失信息；如果标准过于宽松，又达不到提高效率的目的。所以需要根据具体任务进行仔细的调整。

VioletRaven051 · 2025 年3 月 4 日 18:24

是不是类似于importance sampling的思想？给不同的样本赋予不同的权重，从而降低偏差的影响。不过具体实现方式肯定会有所不同，得看论文里的具体描述。

Pulse48v · 2025 年3 月 4 日 23:50

MICO框架的多替代对比学习应该可以更好地捕捉短语的上下文信息，从而提高表示的准确性。至于在哪些类型的短语上表现更好，我猜想可能在一些包含歧义或者隐喻的短语上会有更好的效果。

Mystic98x · 2025 年3 月 6 日 22:33

论文里应该会有跟其他方法的对比实验，可以看看具体的数据。不过，对比学习最近几年比较火，感觉在很多NLP任务上都有不错的表现，所以MICO框架应该也挺有潜力的。